Redisearch实现的全文检索功能服务

zoukankan html css js c++ java

Redisearch实现的全文检索功能服务
“检索”是很多产品中无法绕开的一个功能模块，当数据量小的时候可以使用模糊查询等操作凑合一下，但是当面临海量数据和高并发的时候，业界常用 elasticsearch 和 lucene 等方案，但是elasticsearch对运行时内存有着最低限额，其运行时大小推荐 2G 以上的内存空间，并且需要额外的磁盘空间做持久化存储。

其实mongoDB 内置的正则匹配搜索文本以及自带的 text 索引和 search 关键字也是一套靠谱的解决方案，但是这一次我们带来一种更加高效经济的文本检索方案：Redisearch

Redis Modules 是 redis 4.0 引入的一种扩展机制，用户可以通过实现 redis module 提供的 C api 接口为 redis 服务添加定制化功能。 redisLab 也希望籍此来规范 redis 社区的 ecosystem 实现。

    redis module 本身的版本独立于redis，并且以编译成动态加载库 .so 文件的方式 release，不同版本的 redis 可以 load 同一版本 module.so 文件。

    redis 提供了两种加载方式。可以通过在 conf 文件中加入 loadmodule /path/to/mymodule.so ，也可以在 redis-cli中使用命令 MODULE LOAD /path/to/panda.so 动态加载，MODULE UNLOAD 卸载。

    特性

    基于文档的全文索引。
    高性能增量索引。
    支持文档评分，文档字段(field) 权重机制。
    支持布尔复杂查询。
    支持自动补全。
    基于 snowball 的词干分析，多语言支持。使用 friso 支持中文分词。
    utf-8 字符集支持。
    redis 数据持久化支持。
    自定义评分机制。



其原理是在 redis 的 hashmap 基础上就可以很容易实现倒排索引的结构。redisearch 倒排索引除了实现了基础功能外，还引入了内存管理等优化功能。如果有兴趣可以阅读源码中的 src/inverted_index.c 部分



    首先，安装Rediseach,记住一点你本地的redis服务版本必须在4.0以上，网上一大堆编译安装的攻略，繁琐又浪费时间，所以又到了Docker登场时间了，hub上有编译好的免费镜像供我们下载

1,安装redis
#下载rpm源并安装 yum install -y http://rpms.famillecollet.com/enterprise/remi-release-7.rpm #安装redis yum --enablerepo=remi install -y redis #启动redis服务 service redis start
2,安装Rediseach
docker pull redislabs/redisearch
```
下载后，直接在后台启动服务
```
docker run -d -p 6666:6379 redislabs/redisearch:latest
此时已经有一个docker容器在后台启动了，redis服务映射到了宿主的6666端口，我们来连接一下
redis-cli -h localhost -p 6666
检查 modules 是否成功加载

如果返回数组中存在 "ft" ，则表明 redisearch 已经成功加载。

Redisearch 的索引概念与elasticsearch 的 index 类似，表示某一类文档资源单元。

这里我们定义了一个 SMARTX_VM 索引，其中存储的文档包含了 title 和 desc 两个类型为 TEXT 的field。
FT.CREATE SMARTX_VM SCHEMA title TEXT WEIGHT 5.0 desc TEXT
然后向刚刚创建的这条索引加一个文档
FT.ADD SMARTX_VM vm-20190901 1.0 LANGUAGE "chinese" FIELDS title "中国" desc "我是中国人"
LANGUAGE "chinese" 参数表示使用中文分词器处理文本。默认为英文

此时我们进行文档检索
FT.SEARCH SMARTX_VM "中国" LANGUAGE "chinese"
注意检索的时候也要指定语言，这里我们用中文分词，默认的英文分词是无法检索中文的

可以看到已经返回了我们想要的结果。

Redisearch 是一个高效，功能完备的内存存储的高性能全文检索组件，十分适合应用在数据量适中，内存和存储空间有限的环境。借助数据同步手段，我们可以很方便的将redisearch 结合到现有的数据存储中，进而向产品提供全文检索，自动补全等服务优化功能。
查看全文

相关阅读:
RPC 在整个过程中，体现了逐层抽象，将复杂的协议编解码和数据传输封装到了一个函数中
 RPC 框架
 x86寄存器说明
 计算机组成原理—— 寻址方式－－
七种寻址方式(相对基址加变址寻址方式)---寄存器
 什么是寻址方式
 Intel寄存器名称解释及用途，%eax%ebx等都是什么意思
 CPU的内部架构和工作原理
 CPU工作流程
 8086内部寄存器

原文地址：https://www.cnblogs.com/xcsg/p/11442138.html