zoukankan      html  css  js  c++  java
  • 字符编码

    字符编码

      1.什么是字符编码

        字符编码表;人类的字符《======》数字

        1Bytes=8bit

        1B=8b    一个字节等于8个二进制

        ASCII码:只能识别英文字符,一个英文字符=8bit

        GBK:能识别汉字于英文,1汉字=16bit,1英文字符=8bit

        Shift_JIS日语编码

        Eur_kr 韩语编码

        unicode:能够识别万国字符,1字符=2Bytes=16bit

          两大特点:

            1,能够兼容万国字符

            2,与各个国家的字符编码都有映射关系

        utf_8:是Unicode的转换格式,1个英文字符=1Bytes    1个汉字=3bytes

    重点:

    1,编码与解码:

      字符-----编码---》Unicode的二进制------编码----》GBK的二进

      GRB 的二进制---解码----》Unicode的二进制---解码   ----字符

    2,解决乱码问题的核心法则:

         字符用什么编码格式编码,就应该用什么编码格式进行解码

    3,python解释器默认的字符编码

      python2:ASCII

      python:utf_8

      通过文件头可以修改python解释器默认使用的字符编码

      在文件首行写:#coding:文件当初存的时候用的字符编码

    为何人类要编码

      人类与计算机打交道用的 都是人类的字符,而计算机无法识别人类的字符,只能识别二进制,所以必须将人类的字符编码成计算机能识别的二进制数字

    如何用字符编码

        

  • 相关阅读:
    Hive 使用问题集锦
    scala def/val/lazy val区别以及call-by-name和call-by-value
    spark学习流程
    Hadoop
    Hive
    Chrome快捷键
    Java API帮助文档
    Java 访问修饰符与非访问修饰符
    java 关键字
    Solr配置Ikanalyzer分词器
  • 原文地址:https://www.cnblogs.com/frank007/p/9682685.html
Copyright © 2011-2022 走看看