目录
- ElasticSearch
ElasticSearch
- 高度可扩展的开源全文搜索和分析引擎
- 快速地、近实时地对大数据进行存储、搜索和分析
- 用来支撑有复杂的数据搜索需求的企业级应用
特点
- 分布式
- 高可用
- 多类型
- 多API
- 面向文档
- 异步写入
- 近实时
- 基于Lucene
- Apache协议
全文搜索
数据结构:
- 结构化:指具有固定格式或有限长度的数据,如数据库,元数据等
- 非结构化:指不定长或无固定格式的数据,如邮件,word文档等
非结构化数据的检索
- 顺序扫描法(Serial Scanning)
- 全文搜索(Full-text Search)
全文搜索实现原理
建文本库---->>建立索引---->>执行搜索---->>过滤结果
基于java的开源实现
- Lucene
- ElasticSearch
- Solr