【python】中文的输出，打印，文件编码问题解决方法

zoukankan html css js c++ java

【python】中文的输出，打印，文件编码问题解决方法
直接在python中输入中文的字符串会报编译错误SyntaxError: Non-ASCII character，因为python文件默认编码方式是ASCII。如果想要打印中文字符，有两种方式：

1.在文件第一行加入# -*- coding: UTF-8 –*-，修改文件的默认编码方式。然后直接在python 文件编辑中文字符串即可，例如：string = “中文”

2. 将需要打印的中文字符转化成unicode编码并且加上u，例如要打印“我们”，则写成u“u6211u4eec”
print u'u6211u662f'
3. 如果遇到类似UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0错误，因为在定义中文字符串变量时候，没有加上u，例如：string = “中文”而不是string = u“中文”，

这个时候python会把按照默认的中文字符串用ASCII进行编码，则可能会出现一些错误，要想吧类似string = “中文”的字符串用utf8编码，在文件前面加上如下代码即可：

1 import sys 2 reload(sys) 3 sys.setdefaultencoding('utf8')

4.字符串前面加了U之后会变成unicode类型，这时候是python独立的一种类型，如果直接写入字符类型的数据库字段或者当成字符串进行操作，可能会遇到意想不到的错误。

5. 如何吧一个 string = 'u5168u56fd'变成 unicode类型？

用eval("u"+"'u5168u56fd'")方法即可

6. scrapy网络爬虫中文乱码问题解决

（1）判断抓取网页字符编码格式
import chardet code_format = chardet.detect(response.body)["encoding"]
（2）根据获取的编码方式进行解码，然后采用系统默认方式编码
import sys type = sys.getfilesystemencoding() response.body.decode(code_format).encode(type)
查看全文

相关阅读:
迭代器
 装饰器
 函数对象和闭包
 函数的使用
 文件操作
 基本数据类型及内置方法
 MySQL数据库
 网络编程进阶（进程、线程、协程、IO模型）
网络编程基础---网络通讯原理、ssh远程执行命令、粘包问题处理、文件传输处理
 面向对象、类、元类、封装、异常处理

原文地址：https://www.cnblogs.com/xiaoqu/p/3540506.html

热门文章
Mac 上设置 Chrome `Ctrl+Tab` 可以来回切换 tab
TRA-2021-01-24
TRA-2021-01-10
TRA-2020-12-27
TRA
TRA
模块
 匿名函数
 生成器
 多个装饰器