Partial Update 内部执行过程:
-
首先,ES文档是不可变的,它们只能被修改,不能被替换。Update Api 也不例外。
-
Update API 简单使用与之前描述相同的 检索-修改-重建索引(reindex) 的处理过程。 区别在于这个过程发生在分片内部。
-
相当于ES的Shard内部 执行了 Get(获取该文档所有数据),CreateDoc(根据请求生成新文档),Put(把新文档写入ES)。如果使用全量替换,这3个步骤会发生在Java程序里,但如果使用partial update,ES则会帮我们做这些事。
Partial Update的好处:
-
把原来的3次网络请求转换为1次,降低网络负荷
-
使Java程序逻辑变得简单
-
由于 检索 和 重建索引 发生在 shard内,这两个步骤时间间隔小,大大降低冲突的可能
并发问题:
-
检索 和 重建索引(reindex) 步骤的间隔越小,变更冲突的机会越小。 但是它并不能完全消除冲突的可能性。 还是有可能在 update 设法重新索引之前,来自另一进程的请求修改了文档。
-
因此,ES内部也参照Java步骤,实现了基于version的乐观锁控制并发。
-
我们可以对ES内部的乐观锁,设置一些参数:
并发冲突后,允许重试的次数:retry_on_conflict
POST /test_index/test_type/1/_update?retry_on_conflict=5
{
"doc":{
"num":20
}
}