zoukankan html css js c++ java

过滤敏感词

该过滤敏感词汇方法，主要思路是遍历原文件，读取每行数据，查看是否存在敏感词，如果存在敏感词，替换为**，把修改后的内容的输出到临时文件中，即：不改变原有文件内容

当然也还有很多其他的方法，比如直接打印，或者源内容是字符串等，思路大概一致

#过滤敏感词汇
#读文件，输出带有敏感词汇进行*号替换
word_lib=['小白','小黑','小绿','小蓝','小红','小紫',] #敏感词汇

#过滤敏感词汇
def word_filter(word_lib,old_file,new_file):
    for i in old_file: #遍历原文件
        for j in word_lib: #遍历词汇库
            if j in i: #判断每行是否存在敏感词
               i=i.replace(j,'**') #对应存在的敏感词进行替换
        new_file.write(i) #敏感词替换的文件内容保存到临时文件
    close_file(old_file) #关闭文件
    close_file(new_file) #关闭文件

#打开文件
def open_file(filename,mode='r'): 
    result=open(filename,mode,encoding='utf-8')
    return  result #返回文件对象

#关闭文件
def close_file(file):
    file.close()

word_filter(word_lib,open_file('a.txt'),open_file('c.txt','w')) #调取过滤敏感词函数

查看全文

相关阅读:
JavaSE 基础第54节继承Thread类创建线程
 flask 项目部分业务逻辑
 js生成随机的uuid
增量式爬虫
 分布式爬虫
 scrapy 的分页爬取 CrawlSpider
scrapy 请求传参
 scrapy增加爬取效率
 scrapy框架
 模拟登陆request-session

原文地址：https://www.cnblogs.com/xiaokuangnvhai/p/11187235.html