zoukankan      html  css  js  c++  java
  • 关于Python 编码的一点认识

    在计算机中,所有数据的存储、运算以及传输都必须是二进制数字,因为计算机只认识0和1。

    当一个人把一份数据传给另一个人时,计算机传递的是其实是二进制数字,但这些数字需要被还原为原始信息。

    这个工作当然是由计算机完成。

    它完成的前提是,它要知道这些二进制数具体代表哪些字符。

    而这个需要人为定义。

    因为世界上的语言不尽相同,自然不可能全部使用同样的规则。

    于是出现了ASCII、Unicode、UTF-8、GBK等等对应规则。

    有了这些规则以后,计算机就能够将二进制数字翻译为我们能读懂的信息。

    但这个前提是,计算机要知道使用哪种对应规则,这个就需要我们去告诉它。

    当我们在Python中打开一个文件时,那一串串的二进制数字早就在那里等候了,于是就被计算机读取到了内存中。

    你要是不告诉计算机用哪种规则去还原这些0和1,那它可能就不会返回给你想要的信息。

    所以我们在打开文件时,写入encoding=“utf-8”,就是告诉计算机,将这些0和1以utf-8编码方式去解读。

    用什么规则进行的编码,就需要用相同的规则去解码,如果不一致,就是产生乱码的原因了。

  • 相关阅读:
    POJ 3007 Organize Your Train part II (字典树 静态)
    POJ 3096 Surprising Strings
    移动APP安全测试
    monkey亲测
    PHP笔记
    my sql 只展示 前10条数据的写法
    面试问的东西
    定时构建常用 设置
    jenkins 定时构建 位置
    jenkins 使用的python 不是指定的python 的解决方法
  • 原文地址:https://www.cnblogs.com/waterr/p/13383437.html
Copyright © 2011-2022 走看看