zoukankan      html  css  js  c++  java
  • IO(六)--- 编码和解码

    编码: 把看得懂的字符变成看不懂码值这个过程我们称作为编码。
     
    解码: 把码值查找对应的字符,我们把这个过程称作为解码。

    注意: 以后编码与解码一般我们都使用统一的码表。否则非常容易出乱码。

    常用码表:

    ASCII: 美国标准信息交换码。用一个字节的7位可以表示。

    ISO8859-1:   拉丁码表。欧洲码表,用一个字节的8位表示。又称Latin-1(拉丁编码)或“西欧语言”。ASCII码是包含的仅仅是英文字母,并且没有完全占满256个编码位置,所以它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入192个字母及符号,藉以供使用变音符号的拉丁字母语言使用。从而支持德文,法文等。因而它依然是一个单字节编码,只是比ASCII更全面。

    GB2312:   英文占一个字节, 中文占两个字节。中国的中文编码表。

    GBK:      中国的中文编码表升级,融合了更多的中文文字符号。

    Unicode:  国际标准码,融合了多种文字。所有文字都用两个字节来表示,Java语言使用的就是unicode。

    UTF-8: 英文占一个字节,中文占三个字节。    最多用三个字节来表示一个字符。

    UTF-16:  不管英文中文都是占两个字节。

    注意:接触最多的是iso8859-1、gbk、utf-8。Unicode是一种标准不是码表,如果写Unicode则默认使用UTF-16。

  • 相关阅读:
    蝴蝶自在——《萍踪侠影》
    学习OpenCV——关于三通道的CvMat的求和问题
    MFC中的OnTimer和SetTimer
    慎重选择博士后(或博士生)导师
    MFC界面的完善
    MFC CSplitterWnd的用法
    断言(ASSERT)的用法
    OpenCV中lib的添加
    【转】数据结构之位图
    【转】关于windows server 2003不能共享问题
  • 原文地址:https://www.cnblogs.com/nicker/p/6254112.html
Copyright © 2011-2022 走看看