zoukankan      html  css  js  c++  java
  • lucene全文检索技术

     1:lucene的介绍

       全文检索引擎工具包。作用:使用lucene进行全文检索 。可以直接运行。 

       什么是全文检索。全文检索的场景,搜索引擎,搜索商品。

       站内搜索,只会搜索自己站内的资源

       全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索的文档的目的

       这种先建立索引,在对索引进行搜索的过程就叫全文检索。

       索引就类似于书籍的目录,目标文档就相当于书籍中的内容

       搜索书籍中的内容,如果不通过目录,很费劲

       其实,全文检索就是相当于给书籍编写目录。

     2:Lucene实现全文检索的流程

       

       采集数据---》创建索引----》用户查询---》搜索索引---》展示显示

        全文检索的流程:索引流程和搜索流程

     3:入门程序

      a :索引

      b :搜索

       4:field域 

        搜索流程

          为啥要采集数据。如何采集数据,使用http协议,使用网络爬虫采集。数据库中的数据使用jdbc采集。文件系统中的数据,使用IO流读取文件中的内容。

             数据的分类:01非结构化数据02结构化数据

                     对结构化数据的搜索使用mysql搜索

                     对非结构化数据的搜索使用

      爬虫技术

        

                     

     5:索引维护  入门程序之创建索引。

     6:搜索

     7:相关度排序

     8:中文分词器 

    姓名:曹晓阳 联系方式:1076675163@qq.com
  • 相关阅读:
    织梦开发——相关阅读likeart应用
    织梦标签教程
    织梦专题调用代码
    HIT 2543 Stone IV
    POJ 3680 Intervals
    HIT 2739 The Chinese Postman Problem
    POJ 1273 Drainage Ditches
    POJ 2455 Secret Milking Machine
    SPOJ 371 Boxes
    HIT 2715 Matrix3
  • 原文地址:https://www.cnblogs.com/CAOXIAOYANG/p/6384449.html
Copyright © 2011-2022 走看看