zoukankan      html  css  js  c++  java
  • lucene全文检索技术

     1:lucene的介绍

       全文检索引擎工具包。作用:使用lucene进行全文检索 。可以直接运行。 

       什么是全文检索。全文检索的场景,搜索引擎,搜索商品。

       站内搜索,只会搜索自己站内的资源

       全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索的文档的目的

       这种先建立索引,在对索引进行搜索的过程就叫全文检索。

       索引就类似于书籍的目录,目标文档就相当于书籍中的内容

       搜索书籍中的内容,如果不通过目录,很费劲

       其实,全文检索就是相当于给书籍编写目录。

     2:Lucene实现全文检索的流程

       

       采集数据---》创建索引----》用户查询---》搜索索引---》展示显示

        全文检索的流程:索引流程和搜索流程

     3:入门程序

      a :索引

      b :搜索

       4:field域 

        搜索流程

          为啥要采集数据。如何采集数据,使用http协议,使用网络爬虫采集。数据库中的数据使用jdbc采集。文件系统中的数据,使用IO流读取文件中的内容。

             数据的分类:01非结构化数据02结构化数据

                     对结构化数据的搜索使用mysql搜索

                     对非结构化数据的搜索使用

      爬虫技术

        

                     

     5:索引维护  入门程序之创建索引。

     6:搜索

     7:相关度排序

     8:中文分词器 

    姓名:曹晓阳 联系方式:1076675163@qq.com
  • 相关阅读:
    ThinkPHP5 动态生成图片缩略图
    2020年python学习进阶方向
    2020年一线大厂月薪35K的Python开发要求
    swoole扩展怎么用
    如何在PHP框架里把Traits使用起来
    php与Redis实现一个100万用户的投票项目,如何实现实时查看投票情况?
    PHP高并发和大流量的解决方案
    phper使用MySQL 针对千万级的大表要怎么优化?
    swoole加密可破解吗
    轻松玩转windows之redis实战
  • 原文地址:https://www.cnblogs.com/CAOXIAOYANG/p/6384449.html
Copyright © 2011-2022 走看看