Python读取 csv文件中文乱码处理

需求：
按行解析读取csv文件存入关系型数据库——主要是中文字体解析；
遇到的问题：
直接解析出来的数据为list形式，而且编码格式为unicode;
解决问题：
前提了解：
　中文编码的规则 —— GB2312

　　字符串在Python内部的表示是unicode编码，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。

　　decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode(‘gb2312’)，表示将gb2312编码的字符串转换成unicode编码。

　　encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode(‘gb2312’)，表示将unicode编码的字符串转换成gb2312编码。

示例如下：
filepath:文件绝对路径
with open(filepath, mode='rb') as f:
    reader = csv.reader(f)
    # i 设置按行获取数据
    for i, rows in enumerate(reader):
        try:
            # 解决读取csv文件中文格式乱码——gb2312只支持普通中文字符
            row1 = [row1.decode('GB2312').encode('utf-8') for row1 in rows]
        except:
　　　　　　　#存在繁体时
            #gbk支持繁体中文和日文假文
            row1 = [row1.decode('GBK').encode('utf-8') for row1 in rows]

查看全文

相关阅读:
Fibonacci Again 分类： HDU 2015-06-26 11:05 13人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-LCM的个数分类：比赛 2015-06-26 10:37 18人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-完美素数分类：比赛 2015-06-26 10:36 15人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-经济节约分类：比赛 2015-06-26 10:34 19人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-字符的变化分类：比赛 2015-06-26 10:32 46人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-飞花的鱼塘分类：比赛 2015-06-26 10:30 43人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-飞花的线代分类：比赛 2015-06-26 10:29 10人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-飞花的糖果分类：比赛 2015-06-26 10:27 15人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-最大收益问题分类：比赛 2015-06-26 10:25 51人阅读评论(0) 收藏
 山东理工大学第七届ACM校赛-学区房问题分类：比赛 2015-06-26 10:23 89人阅读评论(0) 收藏

原文地址：https://www.cnblogs.com/dozn/p/8668201.html