zoukankan      html  css  js  c++  java
  • 在SQL Server 2005中用存储过程实现搜索功能

    现在很多网站都提供了站内的搜索功能,有的很简单在SQL语句里加一个条件如:where names like ‘%words%’就可以实现最基本的搜索了。

     

       我们来看看功能强大一点,复杂一点的搜索是如何实现的(在SQL SERVER200/2005通过存储过程实现搜索算法)。

     

       我们把用户的搜索可以分为以下两种:

       1.精确搜索,就是把用户输入的各个词语当成一个整体,不分割搜索.

       2.像百度,GOOGLE一样的,按空格把输入的每一个词分离,只要包含这些词语,而不管出现的顺序,称为ALL-Word Search.

       3.对输入的词只要有一个出现就为匹配 称为Any-Word Search

     

    一、对搜索结果进行排序的算法

       在前面提到的LIKE语句最大的问题就是搜索的结果是没有经过排序的,我们不知道结果出现在的顺序是如何的,因为它是随机的。像百度,GOOGLE都会对结果用算法进行排序再显示的.好我们也来建立一个简单的排序法。一个很常见的算法是计算关键词在被搜索内容中出现的次数,次数最多的排在结果的第一位。我们的是在存储过程中实现这个算法的,而在SQLSERVER中没有提供计算关键词在被搜索内容中出现的次数这样的函数,我们要自己写一个UDF(User-Defined Functions),UDF是SQLSERVER的内部函数,可以被存储过程调用或者被其他UDF调用。函数如下:

    CREATE FUNCTION dbo.WordCount
     (@Word VARCHAR(15), 
     
     @Phrase VARCHAR(1000))
     
     RETURNS SMALLINT
     
     AS

    BEGIN

    /**//* 如果@Word 或者@Phrase 为空返回 0 */

    IF @Word IS NULL OR @Phrase IS NULL RETURN 0

    /**//* @BiggerWord 比@Word长一个字符 */

    DECLARE @BiggerWord VARCHAR(21)

    SELECT @BiggerWord = @Word + 'x'

    /**//*在 @Phrase用@BiggerWord替换@Word */

    DECLARE @BiggerPhrase VARCHAR(2000)

    SELECT @BiggerPhrase = REPLACE (@Phrase, @Word, @BiggerWord)

    /**//* 相减结果就是出现的次数了 */

    RETURN LEN(@BiggerPhrase) - LEN(@Phrase)

    END


    以上就是整个UDF,它用了一个很高效的方法来计算关键词出现的次数。

     

    二、参数传递

    用户输入的关键词从一个到多个不等,我们可以把参数固定为@word1~@word5,这样比较方面实现。当用户输入超过5个时,忽略不计,少于5个的地方视为空。其实GOOGLE也是这样做的,只是GOOGLE的最大词语限制是10个。

     

    三、搜索的实现过程

     

    假定我们对Product表进行搜索,Product字段有:Id,Name ,Descripton(产品描述),搜索要同时对Name 和 Description进行。

    Any-World Search实现如下:

    SELECT Product.Name, 
           3 * WordCount(@Word1, Name) + WordCount(@Word1, Description) +

           3 * WordCount(@Word2, Name) + WordCount(@Word2, Description) +

           

           AS Rank
    FROM Product

    这里对Name赋予权重为3,Description为1(大家根据实际情况赋予不同的权重),Rank是计算列,通过前面定义的UDF计算所关键词出现的次数乘上权重等到的。

     

    同样的All-Word Search实现如下:

    SELECT Product.Name, 

           (3 * WordCount(@Word1, Name) + WordCount(@Word1, Description)) *

           CASE 

              WHEN @Word2 IS NULL THEN 1 

                ELSE 3 * WordCount(@Word2, Name) + WordCount(@Word2, Description)

           END *

           

           AS Rank

    FROM Product


     这时把每个关键词出现的次数相乘只要一个没出现RANK就为0,为0就是搜索结果为空。

    还可以这样实现:

    SELECT Product.Name, 
           CASE 
             WHEN @Word1 IS NULL THEN 0 
             ELSE ISNULL(NULLIF(dbo.WordCount(@Word1, Name + ' ' + Description), 0), -1000)
           END +
           CASE 
             WHEN @Word2 IS NULL THEN 0 
             ELSE ISNULL(NULLIF(dbo.WordCount(@Word2, Name + ' ' + Description), 0), -1000)
           END +
           
           AS Rank
    FROM Product

    对没出现的关键词赋值-1000,这样Rank就肯定为负数,负数表示搜索结果为空。

     

     

    四、对结果进行分页

    搜索的结果可能很多,对结果分页可以提高性能。我在如何在数据层分页以提高性能已经说明了如何用存储过程进行分页了,这里就不在详细复述了。

    过程简单来说就是创建一个临时表,表中包含行号,读取时按行号来读取数据

     

    五、完整代码

         经过前面的分析,完整代码如下:

    CREATE PROCEDURE SearchCatalog 
    (      
     @PageNumber TINYINT,
     @ProductsPerPage TINYINT,
     @HowManyResults SMALLINT OUTPUT,
     @AllWords BIT,
     @Word1 VARCHAR(15) = NULL,
     @Word2 VARCHAR(15) = NULL,
     @Word3 VARCHAR(15) = NULL,
     @Word4 VARCHAR(15) = NULL,
     @Word5 VARCHAR(15) = NULL)
    AS
    /**//* 创建临时表,保存搜索的结果(Sql Server2005适用,Sql Server2000见如何在数据层分页以提高性能) */
    DECLARE @Products TABLE
    (RowNumber SMALLINT IDENTITY (1,1) NOT NULL,
     ID INT,
     Name VARCHAR(50),
     Description VARCHAR(1000),
    Rank INT)

    /**//* Any-words search */
    IF @AllWords = 0 
       INSERT INTO @Products           
       SELECT ID, Name, Description,
            3 * dbo.WordCount(@Word1, Name) + dbo.WordCount(@Word1, Description) +

            3 * dbo.WordCount(@Word2, Name) + dbo.WordCount(@Word2, Description) +

            3 * dbo.WordCount(@Word3, Name) + dbo.WordCount(@Word3, Description) +

            3 * dbo.WordCount(@Word4, Name) + dbo.WordCount(@Word4, Description) +

            3 * dbo.WordCount(@Word5, Name) + dbo.WordCount(@Word5, Description) 

              AS Rank

       FROM Product
       ORDER BY Rank DESC

    /**//* all-words search */

    IF @AllWords = 1

       INSERT INTO @Products           

       SELECT ID, Name, Description,

              (3 * dbo.WordCount(@Word1, Name) + dbo.WordCount

    (@Word1, Description)) *

              CASE 

               WHEN @Word2 IS NULL THEN 1 

               ELSE 3 * dbo.WordCount(@Word2, Name) + dbo.WordCount(@Word2, 

    Description)

              END *

              CASE 

               WHEN @Word3 IS NULL THEN 1 

               ELSE 3 * dbo.WordCount(@Word3, Name) + dbo.WordCount(@Word3, 

    Description)

              END *

              CASE 

               WHEN @Word4 IS NULL THEN 1 

               ELSE 3 * dbo.WordCount(@Word4, Name) + dbo.WordCount(@Word4, 

    Description)

              END *

              CASE 

               WHEN @Word5 IS NULL THEN 1 

               ELSE 3 * dbo.WordCount(@Word5, Name) + dbo.WordCount(@Word5, 

    Description)

              END

              AS Rank

       FROM Product

       ORDER BY Rank DESC

    /**//* 在外部变量保存搜索结果数 */

    SELECT @HowManyResults = COUNT(*) 

    FROM @Products 

    WHERE Rank > 0

    /**//* 按页返回结果*/

    SELECT ProductID, Name, Description, Price, Image1FileName,

     Image2FileName, Rank

    FROM @Products

    WHERE Rank > 0

      AND RowNumber BETWEEN (@PageNumber-1) * @ProductsPerPage + 1 

                        AND @PageNumber * @ProductsPerPage
    ORDER BY Rank DESC

    轉自:http://www.cnblogs.com/timone/archive/2006/11/16/563079.html

    申明

    非源创博文中的内容均收集自网上,若有侵权之处,请及时联络,我会在第一时间内删除.再次说声抱歉!!!

    博文欢迎转载,但请给出原文连接。

  • 相关阅读:
    Docker 容器默认root账号运行,很不安全!
    Prometheus阅读目录
    linux修改SSH远程登录端口 服务器安全篇
    linux 部署出现Fatal error: Class 'DOMDocument' not found。
    mysql开启远程访问权限
    linux 重置mysql 密码
    推送(极光推送)
    linux 搭建SVN
    C语言词频统计设计
    读《构建之法》有感
  • 原文地址:https://www.cnblogs.com/Athrun/p/564042.html
Copyright © 2011-2022 走看看