筛选出一段文字中的中文

import re

comments ="abc大家好，浙江省，杭州市，西溪湿地"
pattern = re.compile(r'[u4e00-u9fa5]+')
filterdata = re.findall(pattern, comments)
print(filterdata)
# ['大家好', '浙江省', '杭州市', '西溪湿地']
# 连接所有中文 
resultdata = ''.join(filterdata)
print(resultdata)
# 大家好浙江省杭州市西溪湿地

取出文档中的中文

待续。。。

查看全文

相关阅读:
Socket网络编程--简单Web服务器(4)
GCC学习笔记
 字符分隔符'1'(u0001)的困惑
 g++编译时遇到问题undefined reference to
ROS学习笔记(三)
cJSON笔记
 ROS学习笔记(二)
ROS学习笔记(一)
ffmpeg推流方式采用TCP协议
 Android OS的image文件组成

原文地址：https://www.cnblogs.com/zhzhang/p/7208877.html