zoukankan      html  css  js  c++  java
  • Sqlserver2008实现全文检索

    一、开启 SQL Full-text 服务

    保证 SQL Full-text Filter Daemon Launcher服务处于开启状态,不同版本SQLServer全文检索服务名称可能稍有不同,如果服务列表中没有这个服务,请使用SQLServer安装光盘安装“全文检索”组件。

    二、启用全文检索

    执行SQL语句启用全文检索:EXEC sp_fulltext_database 'disable'   启用全文检索

                         EXEC sp_fulltext_database 'disable'   禁用全文检索

    三、设置全文语言为中文

    在服务器->属性->高级中,设置默认全文语言为2052(中文)。

    四、建立数据表

    在需要全文检索的数据表中,必须有一列字符型的字段存放文件类型,例如建表语句中的FileType。必须有一列Varbinary(Max)类型的字段存放文件内容,例如建表语句中的FileContent。

    建表SQL语句示例:

    1 CREATE TABLE SampleBlobTable
    2 (
    3 [PKID] int identity(1,1) primary key,
    4 [FileName] Nvarchar(255) null,
    5 [FileType] Nvarchar(32) null,
    6 [FileContent] VARBINARY(MAX) NULL,
    7 [AddTime] datetime default(getdate())
    8 )

    五、建立全文索引

      步骤1:建立全文索引

      在需要全文检索的数据表上点击右键->全文索引->定义全文索引。

      步骤2:选择唯一索引

      步骤3:选择列表

    选择表列,本例中以FileType列标明文件格式,将文件存入数据库时须正确填写此字段,此字段中的数据内容包括“doc”、“txt”、“xls”等。

    后续步骤无需更改默认值,点击下一步继续直至完成。

    六、支持PDF文件

      1.安装 Adobe iFilter
      Adobe iFilter6.0:

      http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=2611&fileID=2457

      Adobe iFilter9.0for 64bit:

      http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=4025&fileID=3941

      2.执行SQL语句
      execsp_fulltext_service 'load_os_resources', 1;

      exec sp_fulltext_service'verify_signature', 0;

      3.重新启动SQLSERVER
      4.检查支持文件
      执行下列语句:

      select document_type,path from sys.fulltext_document_types wheredocument_type ='.pdf',如查询结果为下图则表示成功,可以进行PDF的全文检索了。(原博本步骤没有图示)

    七、查询语法及示例

      5. 语法

     1 CONTAINS
     2 ( {column| * } , '<contains_search_condition >' 
     3 )
     4 
     5 < contains_search_condition >::=
     6 {< simple_term >
     7 | < prefix_term >
     8 | < generation_term >
     9 | < proximity_term >
    10 | < weighted_term >
    11 } 
    12 | { ( <contains_search_condition > )
    13 {AND | AND NOT | OR } < contains_search_condition > [ ...n ] 
    14 }
    15 
    16 < simple_term > ::=
    17 word |" phrase "
    18 
    19 < prefix term> ::=
    20 { "word * " | "phrase *"}
    21 
    22 < generation_term > ::=
    23 FORMSOF ( INFLECTIONAL , < simple_term > [ ,...n ] )
    24 
    25 < proximity_term > ::=
    26 {< simple_term > | < prefix_term > }
    27 { { NEAR | ~ } { < simple_term > | < prefix_term >} } [ ...n ]
    28 
    29 < weighted_term > ::=
    30 ISABOUT
    31 ( {{
    32 <simple_term>
    33 | < prefix_term >
    34 | < generation_term >
    35 | < proximity_term >
    36 } 
    37 [ WEIGHT ( weight_value ) ]
    38 } [ ,...n ] 
    39 )

      6.示例

      1.查找文件内容含“合同”的数据。

      select * from SampleBlobTable where contains(filecontent,'合同')

      注意:如果查询条件中包含空格,查询条件需用双引号括起来,如'”合同”',否则视为语法错误。

      2.查找文件内容含“归档”或“标题”的数据。

      select * from SampleBlobTable where contains(filecontent,'归档 OR 标题')

      注意:多个词之间用逻辑操作符连接 (包括 AND ,AND NOT,OR)。如果词中包含空格,那么这个词要用双引号括起来。

      3.查找文件内容含“北京?站”的数据。

      select * from SampleBlobTable where contains(filecontent,'北京Near 站')

      注意:上述SQL语句将返回包含“北京站”、“北京西站”、“北京东站”等“北京”与“站”无间隔或间隔一个汉字(如果是英文则为一个单词)的数据,不会包含“北京东南站”的数据。

      4.查找所有开头字母为”hu”的数据。

        select * from SampleBlobTable wherecontains(filecontent,'hu*')

      注意:上述SQL语句将返回包含”human”、”hungry”等单词的数据,此语法只针对英文有效,针对中文“*”符号无论有无,效果均相同。

      5.加权查询

       select * from SampleBlobTable where contains(filecontent,'ISABOUT (city weight (.8),county weight (.4))')

      注意:上述SQL语将将针对city和county两个词进行不同权重的查询,权重不同将影响返回数据集的显示顺序(如果限定返回数量,则间接影响是否返回数据)。

      6.多态查询

      select * from SampleBlobTable where contains(filecontent,'FORMSOF (INFLECTIONAL,dry)')

      注意:查询将返回包含”dry”,”dried”,”drying”等数据,针对英语有效。

    附:文档修改历史

    内容

    修改人

    时间

    备注

    创建

    卞吉东

    2012-03-29

     

    增补

    卞吉东

    2012-04-01

    增加支持PDF文件方法

    本文转载自:https://blog.csdn.net/xiaogechengxuyuan/article/details/10827229 

    创建索引及使用详情参考:https://www.cnblogs.com/qianzf/p/7131741.html

                https://jingyan.baidu.com/article/e5c39bf5fcd7dc39d76033a3.html

                https://blog.csdn.net/qq_24188927/article/details/82841329

  • 相关阅读:
    读入输出优化
    码表
    windows下bat批处理实现守护进程(有日志)
    cmd批处理常用符号详解
    批处理之 for/f 详解
    WINDOWS XP中用命令行管理用户 net user命令
    VacmMIB
    工作遇到
    snmp之GenericAddress
    snmp4j 之 ArgumentParser
  • 原文地址:https://www.cnblogs.com/xiaoyue1606bj/p/11002579.html
Copyright © 2011-2022 走看看