zoukankan      html  css  js  c++  java
  • ElasticSearch全文搜索引擎(A)

    文章:[Elasticsearch] 全文搜索 (一) - 基础概念和match查询

    全文检索,是从最初的字符串匹配和简单的布尔逻辑检索技术,演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的复合技术。

    概念:字符串匹配、非结构化数据、复合技术。(不全部分,自己补充)

    全文数据系统的构建,提出全文检索系统的实现技术,主要分为5个步骤:
    (1)数据准备:它是指针对计划加载到全文数据库中的数据进行收集、整理、归类等预先处理的过程。加载到全文数据中的数据可以从多种途径获得,常见的数据来源有:电脑打字产生的文件,电子印刷产生的文稿,计算机网上传送的文件,电子出版物,图文处理产生的文件,专门组织人力录入建库。
    (2)文本预处理:包括规范格式,当格式多种多样时,应加以整理,使文献的格式规范化;批式标引,文本预处理阶段完成的批式标引,不受全文数据库结构的限制,效率较高。
    (3)数据加载:数据准备好以后,便可以加载(拷入、输入)到数据库文件中去了。加载数据可有单篇方式或批量方式。单篇方式一次加载一篇,适于平时文献随时加载的情况。批量方式一次加载多篇,适于集中大量加载的情况。
    (4)数据检索:数据库建立起来之后,便可根据全文检索系统提供的检索功能对数据库进行检索。
    (5)数据维护:全文数据建立以后,需要经常对数据库的内容进行索引、更新、追加和清理。
     
     
     
     
     
  • 相关阅读:
    JAVA基础知识|HTTP协议-两个特性
    JAVA基础知识|TCP/IP协议
    Spring Cloud|高可用的Eureka集群服务
    Hadoop环境搭建|第四篇:hive环境搭建
    C#中Func与Action的理解
    C# lambda表达式
    WPF ControlTemplate
    sublime text3插件安装及使用
    Dev Express之ImageComboBoxEdit,RepositoryItemImageComboBox使用方式
    SQL查询结果增加序列号
  • 原文地址:https://www.cnblogs.com/Tpf386/p/8192317.html
Copyright © 2011-2022 走看看