zoukankan      html  css  js  c++  java
  • Sphinx简介,司芬克斯

    一、  Sphinx简介

    Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎。意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。

    Sphinx的特性如下:

    a)  高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒);

    b)  高性能的搜索(在2 – 4GB 的文本数据上,平均每次检索响应时间小于0.1秒);

    c)  可处理海量数据(目前已知可以处理超过100 GB的文本数据, 在单一CPU的系统上可处理100 M 文档);

    d)  提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法;

    e)  支持分布式搜索;

    f)  支持短语搜索

    g)  提供文档摘要生成

    h)  可作为MySQL的存储引擎提供搜索服务;

    i)  支持布尔、短语、词语相似度等多种检索模式;

    j)  文档支持多个全文检索字段(最大不超过32个);

    k)  文档支持多个额外的属性信息(例如:分组信息,时间戳等);

    l)  支持断词;

    虽然mysql的MYISAM提供全文索引,但是性能却不敢让人恭维,另外数据库毕竟不是很善于做这样的事情,我们需要把这些活让给更适合的程序去做,减少数据库的压力。因此采用Sphinx来做mysql的全文索引工具是一个很好的选择。这个星期主要来学习这个这个工具的使用,下面将学习过程大致的记录一下,做个备忘,也希望能对学习这个工具的其他朋友有所启发。

  • 相关阅读:
    List<int>转化为逗号链接的字符串
    分页的总页数算法
    高性能SQLServer分页语句
    webconfig中的&符号问题解决
    检测SQLServer复制订阅进度
    jQuery自定义数组操作类(类似于List集合的增删改查)
    解决jquery绑定click事件出现点击一次执行两次问题
    IdentityServer4登陆中心
    AES加密解密通用版Object-C / C# / JAVA
    T-SQL 基本语法
  • 原文地址:https://www.cnblogs.com/andy0816/p/14511590.html
Copyright © 2011-2022 走看看