文章
-
关键的可能就是 text和keyword 前者会生成倒排索引,不适合聚合统计
-
基于lucene,是一个分布式搜索和分析引擎,可以指数大数据量。它可以用作全文搜索,结构化搜索和分析;实时性好。
-
软件的安装和升级,数据的正常使用,都是需要数据备份的【相当有必要】
日记
-
问题:添加了数据,但是查询没有查询到。由于修改这个参数的原因,导致的
刷新数据到磁盘中,会印象性能,I/O是瓶颈
缓存刷新问题,有几种类型的缓存---->引申问题:缓存怎么实现?
tranlog到fsync-------->其他数据库应该也有相同的机制
优化
-
可以联想到 MYSQL的数据库优化
我们采用了那些优化:
(1)、芬片数量的控制,一般不宜太多,5左右;取决于集群中机器的数量
(2)、副本的数量
(3)、index_refresh的时间
(4)、线程量等没有调整
(5)、bulk提交
(6)、不用唯一索引ID -
Elasticsearch之settings和mappings的意义
create_date:其实是时间,unix的时间
原理
记录
-
索引的删除
是一个危险操作