zoukankan      html  css  js  c++  java
  • 01 lucene基础 北风网项目培训 Lucene实践课程 索引

    在创建索引的过程中IndexWriter会创建多个对应的Segment,这个Segment就是对应一个实体的索引段。随着索引的创建,Segment会慢慢的变大。为了提高索引的效率,IndexWriter会把多个索引段(独立的索引段)合并成一个大的索引段。这样的话可以降低I/O操作的频率,可以提高检索的效率,这就是Lucene索引的创新之处。

    通过IndexWriter和Directory的具体实现类可以控制索引的具体存储位置。

    抽象类Analyzer有多个实现类,不同的实现类切词的效果是不一样的。标准的分词器。会接触多个分词器,实现对应的分词操作。由于中文分词和英文分词的不同,在分词器中,Lucene对中文的支持比较有限,所以说以后对中文的分词需要依赖第三方的jar包来实现对中文分词的支持。

    一个完整的lucene下面索引的建立就完成了。

    创建索引的形式就类似于像关系数据库中向一个表中插入记录。对一个表中不仅有插入操作,还要有删除操作,刚才只是向索引中添加进去Document,怎么在索引中删除对应的Document?

    这是关于lucene下面建立索引和对索引中的Document删除操作

  • 相关阅读:
    Windows 7 Update Settings Disabled (Important Updates Grayed Out)
    vSphere 扩展硬盘空间
    Windows Updateエラー 80072EE2
    how-to-view-source-of-chrome-extension
    ffmpeg 加 logo
    书法字帖 PDF转化为可打印PDF
    远程桌面 函数不受支持
    ico 图标 生成 工具 网站
    WmiPrvSe.exe 的 cpu 占用
    v891 安卓平板的root
  • 原文地址:https://www.cnblogs.com/ZHONGZHENHUA/p/6475994.html
Copyright © 2011-2022 走看看