zoukankan      html  css  js  c++  java
  • 过滤敏感词

    该过滤敏感词汇方法,主要思路是遍历原文件,读取每行数据,查看是否存在敏感词,如果存在敏感词,替换为**,把修改后的内容的输出到临时文件中,即:不改变原有文件内容

    当然也还有很多其他的方法,比如直接打印,或者源内容是字符串等,思路大概一致

    #过滤敏感词汇
    #读文件,输出带有敏感词汇进行*号替换
    word_lib=['小白','小黑','小绿','小蓝','小红','小紫',] #敏感词汇
    
    #过滤敏感词汇
    def word_filter(word_lib,old_file,new_file):
        for i in old_file: #遍历原文件
            for j in word_lib: #遍历词汇库
                if j in i: #判断每行是否存在敏感词
                   i=i.replace(j,'**') #对应存在的敏感词进行替换
            new_file.write(i) #敏感词替换的文件内容保存到临时文件
        close_file(old_file) #关闭文件
        close_file(new_file) #关闭文件
    
    #打开文件
    def open_file(filename,mode='r'): 
        result=open(filename,mode,encoding='utf-8')
        return  result #返回文件对象
    
    #关闭文件
    def close_file(file):
        file.close()
    
    word_filter(word_lib,open_file('a.txt'),open_file('c.txt','w')) #调取过滤敏感词函数
  • 相关阅读:
    JavaSE 基础 第54节 继承Thread类创建线程
    flask 项目部分业务逻辑
    js生成随机的uuid
    增量式爬虫
    分布式爬虫
    scrapy 的分页爬取 CrawlSpider
    scrapy 请求传参
    scrapy增加爬取效率
    scrapy框架
    模拟登陆request-session
  • 原文地址:https://www.cnblogs.com/xiaokuangnvhai/p/11187235.html
Copyright © 2011-2022 走看看