http://groups.google.com/group/shanghaionrails/browse_thread/thread/41362ff381b4b1e4?pli=1
目前Rails网站全文检索、中文分词一般都用什么方案了? Google了一下,都是很老的帖子了,好像都不是很好。Javaeye后来也转向lucene了
有没有Ruby的?简单点,好配置一点 :)
-- Regards HoLin
ActiveRecord 的话,可以用 Thinking-sphinx 这个 Gem + Coreseek,很好用的
------------------------------------------------------ Jason Lee http://huacnlee.com
在 2011年7月12日星期二,下午9:24,HoLin 写道:
thinking-sphinx,作者说迟点会支持国人改sphinx的coreseek*.***
2011/7/12 HoLin <holin...@gmail.com>
本来就支持的啊,很容易就搞上去了
在 2011年7月12日星期二,下午9:27,G.zhen.ning 写道:
Thinking-sphinx. + coreseek +1
发自我的 iPhone
在 2011-7-12,下午9:27,"G.zhen.ning" <g.zhen.n...@gmail.com> 写道:
用了 Thinking-sphinx. + coreseek + rails3
Thinking-sphinx取不到sphinx的版本信息,需要修改一下 Thinking-sphinx。可能是用coreseek返回版本信息不一样的缘故。
试试这个,如果你不用innodb的话。 http://code.google.com/p/mysqlcft/
2011/7/14 HoLin <holin...@gmail.com>
推荐一下Sunspot: http://outoftime.github.com/sunspot/ 他搜索服务器用的是solr(基于Java的Lucene)
Regards, Quake
2011/7/15 Quake Wang <quake.w...@gmail.com>
默认支持的中文是单字分词,你可以使用mmseg分词算法: http://code.google.com/p/mmseg4j/ 默认是通过ActiveRecord的create/update/destroy callback来更新/删除索引。
2011/7/15 Michael He <hlxw...@gmail.com>
coreseek thinking sphinx
通过配置sphinx的charset_table和ngram_chars, 足可以对付绝大部分的中英文搜索了。
如果想用更高级的分词算法,coreseek就派上用场了。代价就是需要编译一个修改过的sphinx,索引速度下降的厉害
我把我用到的thinking-in-sphinx的config/sphinx.yml文件放上来了: rake ts:rebuild即可 https://gist.github.com/1091302
-- Best Regards
张光宇 msn: samwisezh...@hotmail.com