编码转换

zoukankan html css js c++ java

编码转换
一、为什么要进行编码和转码

由于每个国家电脑的字符编码格式不统一（列中国：GBK），同一款软件放到不同国家的电脑上会出现乱码的情况，出现这种情况如何解决呢？！当然由于所有国家的电脑都支持Unicode万国码，那么我们可以把Unicode为跳板，先把字符编码转换为Unicode，在把Unicode转换为另一个国家的字符编码（例韩国），则不会出现乱码的情况。当然这里只是转编码集并不是翻译成韩文不要弄混了。
2、Python3.0进行编码转换
```
import sys,chardet

print (sys.getdefaultencoding())       #获取默认编码(UTF-8)
name = "你好"                        #此时name为Unicode编码
 
name_utf8 = name.encode("utf-8")      #转为UTF-8编码
print(name_utf8)
print(chardet.detect(name_utf8))       #注：Unicode编码无法用chardet查看编码格式
print(name_utf8.decode("utf-8"))     #编码为UTF-8后再转码为Unicode
 
name_gbk = name.encode("gbk")           #转为GBK编码
print(name_gbk)
print(chardet.detect(name_gbk))          #查看当前的字符编码格式
print(name_gbk.decode("gbk"))           #编码为GBK后再转码为Unicode
 
#utf-8
#b'xe8xbfx9exe5xbfx97xe9x9bxb7'
#{'confidence': 0.87625, 'encoding': 'utf-8'}
#你好
#b'xc1xacxd6xbexc0xd7'
#{'confidence': 0.73, 'encoding': 'windows-1252'}
#你好
```
```
3、Python2.0中的编码转换

① 声明字符编码（utf-8）
```
!/usr/bin/env python

-- coding:utf-8 --

Python2.0环境默认编码ascii

import sys
name = "你好" #ascii码里是没有字符“你好”的，此时的name为uft-8

print (sys.getdefaultencoding()) #获取默认编码
print(name.decode("utf-8")) #把uft-8码解码为Unicode

name_unicode=name.decode("utf-8")
print (name_unicode,type(name.decode("utf-8"))) #查看当前的字符编码

name_gbk=name_unicode.encode("gbk") #把字符有Unicode转换为gbk
print(name_gbk)

ascii

你好

(u'u4f60u597d', <type 'unicode'>)

��
```
② 使用默认字符编码（ascii）
```
!/usr/bin/env python

-Author-Lia

import sys
name = "nihao" #英文字符，且第二行字符声明去掉，此刻name为ascii码

print (sys.getdefaultencoding()) #获取系统编码
name_unicode = name.decode("ascii") #ascii码转换为unicode
print(name_unicode,type(name_unicode))

name_utf8=name_unicode.encode("utf-8") #unicode转换为utf-8
print(name_utf8,type(name_utf8))

name_gbk=name_unicode.encode("gbk") #unicode转换为gbk
print(name_gbk,type(name_gbk))

ascii

(u'nihao', <type 'unicode'>)

('nihao', <type 'str'>)

('nihao', <type 'str'>)
```
总结：Python2.x里默认字符编码为ascii，如果不声明编码格式，则输入的字符格式都是ascii码（中文不在ascii里面，输入报错）；如果要输入中文字符，则需要声明编码格式，此时中文字符的编码格式不跟随默认字符编码格式，而是与声明的编码格式一致（上面实例为utf-8），这些都需谨记。
```
查看全文

相关阅读:
win2008服务器，fastCGI完美设置教程
 IIS7中配置FastCGI运行PHP
Apple 移动设备绑定动态生成元素点击事件$(document).on('click',element,callback)失效解决方法
 MacOS Catalina 10.15 brew 安装 PHP 和使用 pecl 安装 Mcrypt
Redis 列表命令记录
 Redis hash类型命令
 Redis 字符串命令
 Redis 通用命令记录
 Redis 三种启动方式
 Mac 使用 wget 安装 Redis3.0

原文地址：https://www.cnblogs.com/flyhgx/p/6680456.html

最新文章
如何优化limit
MySQL 五大引擎之间的区别和优劣之分
 关于难易，推荐一句话
 MySQL
MySQL
MySQL
MySQL
MySQL
MySQL
Python

!/usr/bin/env python

-- coding:utf-8 --

Python2.0环境 默认编码ascii

ascii

你好

(u'u4f60u597d', <type 'unicode'>)

���

!/usr/bin/env python

-Author-Lia

ascii

(u'nihao', <type 'unicode'>)

('nihao', <type 'str'>)

('nihao', <type 'str'>)

Python2.0环境默认编码ascii

��