zoukankan      html  css  js  c++  java
  • 专题实战 | 如何快速构建高质量电商行业搜索?

    简介:本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!

    电商搜索特点

    1. 关键词堆砌

    例如:明星同款夏季连衣裙包邮;

    2. 词序对语义影响不大

    例如:明星同款女夏季连衣裙包邮,女夏季连衣裙包邮明星同款;

    3. 类目预测问题

    例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌;

    4.查询召回文档相关性差

    核心词识别不准确,分词不准确;

    5. 搜索引导的业务转化比重较大

    据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上;

    6. 稳定性要求较高,支持弹性扩容

    活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定;

    开放搜索电商行业方案优势

    1. 基于淘系同款搜索引擎-问天(Ha3),提供更高性能的搜索服务,系统稳定高效,海量数据实时更新;
    2. 电商行业知识图谱能力,支持电商属性的分词、纠错、同义词、停用词、实体识别、词权重、类目预测等行业查询语义理解能力,精准定位用户搜索意图,提升业务转化,降低无结果率;
    3. 丰富的电商搜索服务经验,源自阿里巴巴内部搜索技术的云服务输出,集团内500+业务接入,阿里云电商客户服务数千家;
    4. 通过引擎侧的多路召回能力,支持搜索结果、下拉提示、底纹词等场景实现个性化搜索服务;
    5. 轻松接入,快速上手,一键式接入行业模板,可根据自身业务自定义选择功能,并满足非技术人员业务干预调优与数字化运营需求;

    了解更多电商搜索能力:https://c.tb.cn/F3.0VTxwn

    开放搜索电商增强版接入流程

    注册阿里云账号(已有账号无需注册),并实名认证,创建好实例,如果是非本人使用,可以授权子账号权限,更多详情查看>

    如果您已经对搜索有一定的了解或者是已经使用过开放搜索产品,则可以参考功能流程图以便更快速、更全面的了解开放搜索的能力。

    表结构设计

    接入开放搜索前,需要预先设计好表结构(可单表,可多表join),以便后期应对各种搜索业务场景和数据推送场景。目前开放搜索支持的多表场景如下:

    主辅表关系

    关联逻辑

    是否支持

    表A(主表)、表B

    表A(主表)-> 表B

    支持

    表A(主表)、表B、表C

    表A(主表)-> 表B -> 表C

    支持

    表A(主表)、表B、表C、表D

    表A(主表)-> 表B

    表A(主表)-> 表C

    表A(主表)-> 表D

    join层级不超过2层,辅表个数不超过10个

    支持

    表A(主表)、表B、表C、表D

    表A(主表)-> 表B -> 表C -> 表D

    超过2层多表数据关联

    不支持(独享型可支持3层)

    表A(主表)、表B

    表A->表B,表B->表A

    环状多表数据关联

    不支持

    表A(主表)、表B、表C … 表K

    表A(主表)-> 表B

    表A(主表)-> 表C

    ..

    表A(主表)-> 表K

    join层级不超过2层,但辅表个数超过10个

    不支持(独享型可扩展辅表个数)

    详情可参考应用结构--->创建多表join

    注意

    电商行业模板中以下字段是必须字段,类型、字段标签固定,字段名称可自定义:

    数据接入

    开放搜索支持用户通过数据源将数据接入搜索,也支持无数据源,通过API/SDK/控制台上传文件的方式导入数据详情如下:

    1. RDS数据源配置
    2. MaxCompute(原ODPS)数据源配置
    3. POLARDB数据源配置
    4. API/SDK数据导入

    电商行业模板配置

    选择分析器

    电商行业模板中以下索引标签、分析方式固定,索引名称可自定义:

    开放搜索还向用户提供了面向其他行业、语言的分析器,如有相应业务需求,可参考内置分析器

    设置查询分析规则

    查询分析模板请选择,系统默认勾选的分析包:

     查询分析的详情内容可点击此处进行参考。

    设置排序策略

    电商行业模板会自动根据用户配置的应用结构中的字段、索引去生成适合该应用的基础排序和业务排序,详情如下:

    基础排序

    0.6*static_bm25()+0.4*normalize(sales)

    业务排序

    query_match_ratio(cate_id) * 1000 + floor( if(field_match_ratio(brand) == 1, 1, field_match_ratio(brand) * query_match_ratio(brand)) + if(text_relevance(product_title) + text_relevance(cate_id) + text_relevance(brand) == 0, -1, 0) ) * 1000 + (text_relevance(product_title, default, true) * 0.3 + text_relevance(cate_id) + text_relevance(brand) + 0.5) * (normalize(sales) + 0.3) * if(is_sale, 1, 0.9) * timeliness_ms(up_time)

    开放搜索中的排序策略较为灵活,您可根据自己的业务需求进行修改或自定义,详情可参考排序表达式配置

    搜索引导服务

    下拉提示模型配置

    下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。

    热搜底纹模型配置

    热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。

    原文链接

    本文为阿里云原创内容,未经允许不得转载。 

  • 相关阅读:
    继承与多态
    本周总结
    总结
    周总结
    周总结
    第三周总结
    .......
    .....
    ....
    ....
  • 原文地址:https://www.cnblogs.com/yunqishequ/p/15812960.html
Copyright © 2011-2022 走看看