本文来自豆瓣网网友评论
1.我正在做一个情报分析系统,是一个决策交易系统的基础。里面的很多东西正是我需要的。我觉得很好 我自己想的话 浪费时间。
2.一位垂直搜索开发人员来信说到:我非常有幸买了你们出的《自己动手写搜索引擎》,谢谢你们共享了这么重要的资料。
我也一直做搜索相关的工作,做了一年半的数据抓取,数据处理,非格式化识别,自动分类,垃圾过滤,伪原创,文本关键字解析。
你们的搜索产品中的:网页标题及正文提取测试,做的非常强大,我曾经试图做一个网页主体识别的程序,但没有思路。
3.258商业搜索开发人员说道:我买了很多搜索的书 你这边最实用 这是真话。
4.第8章的关于solr的应该算国内书籍中第一次讲到吧作者分享技术经验的同时,也为自己的公司做了宣传~~一举两得
书名:自己动手写搜索引擎
作者:罗刚
定 价:55.00元(含光盘1张)
页码:368
出版时间:2009-10
ISBN号:9787121096402
内容简介
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。
爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。
自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。
其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
在实现搜索方面,本书用简单的例子介绍了完整的搜索实现过程,覆盖了从索引库的设计和索引库与数据库的同步到搜索用户界面设计与实现。搜索用户界面包括实现布尔逻辑查询、按区间范围查询、搜索结果按日期排序等。本书还进一步介绍了搜索排序的优化方法。
最后以基于Lucene的搜索服务器Solr为例,展示了Lucene的最新应用方法。
本书详细信息:http://www.broadview.com.cn/10483
更多图书信息:www.broadview.com.cn
想即时获取更多图书及活动资讯,赶快加入博文视点读者俱乐部 吧!