zoukankan      html  css  js  c++  java
  • 常用字符集

    UTF-8:

    8bit变长编码,对于大多数常用字符集(ASCII中0~127字符)它只使用单字节,而对其它常用字符(特别是朝鲜和汉语会意文字),它使用3字节。
    Unicode 的实现方式不同于编码方式。
    一个字符的Unicode编码是确定的,但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。
    Unicode的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF)。
    UTF- 8是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的 字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显 示中文,他们无需下载IE的中文语言支持包

    ASCII:

    ASCII
    最早的也是最基本最重要的一种英美文字的字符集,也可以说是编码。ASCII被定为国际标准之后的代号为ISO-646。由于ASCII码只使用了低7位 二进制位,其他的认为无效,它仅使用了0~127这128个码位。剩下的128个码位便可以用来做扩展,并且ASCII的字符集序号与存储的编码完全相 同。

    GB2312:
    GB2312字集是简体字集,全称为GB2312(80)字集,共包括国标简体汉字6763个。

    GBK
    GBK字集是简繁字集,包括了GB字集、BIG5字集和一些符号,共包括21003个字符。GBK编码是GB2312编码的超集,向下完全兼容 GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。同 GB2312一样,GBK也支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。GBK还收录了GB2312不包含的 汉字部首符号、竖排标点符号等字符。

  • 相关阅读:
    java程序打包成jar 配置文件信息路径
    django 认证系统
    django 表单验证和字段验证
    python 面向对象编程
    Python new() 方法
    Django 分页 以及自定义分页
    django 自己编写admin
    Django CRM客户关系管理系统
    Django model中的 class Meta 详解
    Django CRM系统
  • 原文地址:https://www.cnblogs.com/zs6666/p/5861746.html
Copyright © 2011-2022 走看看