mysql 模糊匹配优化(全文索引)

zoukankan html css js c++ java

mysql 模糊匹配优化(全文索引)
背景：

批量插入单词时，存在单词匹配例句，批量插入时，like匹配批量插入时几十个单词挨个模糊匹配，接口超时，因为是后台管理系统，不打算接入ES，并且允许接口一定程度的慢，但接口超时得解决

方案：

1、正则表达式匹配，同样慢得令人发指

2、添加全文索引

只有Innodb和myisam存储引擎能用全文索引（innodb支持全文索引是从mysql5.6开始的）
CREATE FULLTEXT INDEX index ON table(`content`);
查看执行计划,确认走了索引

三种类型的全文搜索方式

natural language search（自然语言搜索）

通过MATCH AGAINST 传递某个特定的字符串来进行检，默认方式

boolean search（布尔搜索）

为检索的字符串增加操作符，如“+”表示必须包含，"-"不包含，"*" 表示通配符，即使传递的字符串较小或出现在停词中，也不会被过滤掉

query expansion search（查询扩展搜索）

搜索字符串用于执行自然语言搜索，然后，搜索返回的最相关行的单词被添加到搜索字符串，并且再次进行搜索，查询将返回来自第二个搜索的行

但是具体到执行时间，并没有太大得差别，难道问题不是出在这个like匹配上？
SELECT sentence FROM table a WHERE sentence LIKE CONCAT('%','one',' %' ) LIMIT 0,5; -- 0.0109 s SELECT sentence FROM table a WHERE match(sentence) against('one') LIMIT 0,5; -- 0.0049 s
后来恍然大悟，因为limit 得原因关键字太简单，查询5条，很快就能匹配上，满足5条直接返回。

经过测试，生僻一点的单词，like 大约需要消耗2s，全文索引匹配耗时并没有改变。
查看全文

相关阅读:
采坑总结01
Django设置联合唯一约束 -- migrate时报错处理
 Web前端开发资源整理
 kindEditor 使用
 Django模版语言自定义标签-实现前端关联组合过滤查询
 django views视图函数返回值 return redirect httpresponse总结
 前端图片实现以瀑布流样式显示
 性能优化中CPU、内存、磁盘IO、网络性能的依赖(转)
几种浏览器内核（百度百科）
特殊格式文件(视频、声音等) 在数据库中的存储方式

原文地址：https://www.cnblogs.com/magic101/p/12628245.html

mysql 模糊匹配优化(全文索引)

三种类型的全文搜索方式