zoukankan      html  css  js  c++  java
  • 计算机字符与编码

    ASCII码

        1. 使用7个bits就可以完全表示ASCII(American Standard Code for Information Interchange)码(包含95个可打印的字符,33个不可打印的字符,比如一些控制字符), 33+95=128=2的7次方。

        

       2. ASCII码很多国家的应用和符号是无法表示的,比如很多数学符号。

        Extended ASCII码 (扩展ASCII码)

        第一次对ASCII码扩充,7bits -> 9bits  128变成256 

        拓展的128多字符

    字符编码集的国际化
      1.欧洲,中东,东亚,拉丁美洲等国家语言的多样性。
      2.语言体系不一样,并且不以有限字符组合的语言,比如英文每个单子都是由a-z组成的,但是中文除了偏旁,每个字都是独立的。而且以中国,日本,韩国风语言最为复杂。


    中文编码集
      GB2312(国标2312): 1980年发明出来的,全称是《信息交换用汉字编码字符集-基本集》,简称国标2312。一共收录了7445个字符。包括了6763个汉字和682个其他符号。
    不过GB2312也是有问题的,不符合国际标准,后来又推出了GBK《汉字内码扩展规范》,GBK向下兼容GB2312,向上支持国际ISO标准。收录了21003个汉字,支持全部中日韩字符。

    Unicode

      GB2312在中国使用是没问题的,但是如果跨国就有问题,比如中国人开发一个中文网站,外国人去访问,如果他们电脑没安装GBK编码或者GB2312,在他们电脑上显示会变成乱码。
    所以这里就有了兼容全球的字符集Unicode。

      Unicode:统一码,万国码,单一码。
        Unicode定义了世界通用的符号集,它规定了符号的二进制代码,用UTF-*实现了编码,比如UTF-8,常见的UTF-8以字节为单位对Unicode进行编码。中国Windows系统默认使用GBK,但是编程推荐使用UTF-8。

  • 相关阅读:
    Oracle 10g 体系结构及安全管理
    Oracle 10g数据库概述
    jQuery Ajax应用
    ASP.NET Ajax核心对象
    ASP.NET XML
    jQuery插件的使用和编写
    jQuery中的Ajax应用
    弹窗下面的页面滚动问题
    报文过长,华为手机自动拦截报文
    手机抓包 配置步骤
  • 原文地址:https://www.cnblogs.com/songgj/p/13127168.html
Copyright © 2011-2022 走看看