zoukankan      html  css  js  c++  java
  • python检索敏感词并描红输出

      一些带有过度宣传的词,在淘宝、京东对商品的宣传有一定的限制,这些最佳,最大、盗版、水货等词语都不能用于产品的宣传,可以使用程序检测敏感词,以下既是具体代码。

    #检索敏感词并描红输出
    #输入
    word = input("请输入或拷贝含有敏感词的宣传文字:")
    #敏感词库
    sensitive = ['第一','国家级','最高级','最佳','独一无二','一流','仅此一次','顶级',
                 '顶尖','尖端','极品','极佳','绝佳','绝对','终极','极致','首个','首选',
                 '独家','首发','首次']
    #在输入语句中发现的敏感词,放在列表中
    sensitive_find = []
    #newword用于标红敏感词,word用于循环
    newword = word
    #遍历敏感词库
    for item in sensitive:
        #将至少出现一次的敏感词放到sensitive_find中,然后标红
        if word.count(item)>0:
            sensitive_find.append(item+':'+str(word.count(item))+'')
            #newword存放标红后的整段话,word则不变
            newword = newword.replace(item,' 33[1;31m'+item+'33[0m')
    print('发现敏感词如下:')
    for item in sensitive_find:
        print(item)
    print('敏感词位置已用星号进行标注:
    '+newword)

    结果(ps结果中有标红的部分,这里未显示,下面用部分截图说明一下):

    请输入或拷贝含有敏感词的宣传文字:天猫首发,耀世登场,世界品质,庆伟制造。本产品目前是同类产品中最高级的。2018年全网销售量第一,瑶瑶领先同类产品。国内外顶级大师鼎力支持,是您居家生活的唯一选择。
    发现敏感词如下:
    第一:1次
    最高级:1次
    顶级:1次
    首发:1次
    敏感词位置已用星号进行标注:
    天猫 首发,耀世登场,世界品质,庆伟制造。本产品目前是同类产品中 最高级的。2018年全网销售量 第一,瑶瑶领先同类产品。国内外 顶级大师鼎力支持,是您居家生活的唯一选择。

    有标红部分的截图

     

  • 相关阅读:
    input 放大镜
    记住密码弹出事件
    thinkphp修改及编写标签库,编辑器的使用
    thinkphp 配合mongodb
    缓存技术
    php面试题目
    pdo 整套类的封装,保存修改查询
    mongodb 的备份恢复导入与导出
    mongodb 分组查询
    smarty 模板的入门使用
  • 原文地址:https://www.cnblogs.com/xiao02fang/p/12828835.html
Copyright © 2011-2022 走看看