zoukankan      html  css  js  c++  java
  • python编码问题总结(持续更新)

            相信很多pythoner都对python 3.0之前版本的编码问题恨之入骨,我也对这个问题恨到基因里面。有时候也真的想放弃这个3.0之前的版本,直接奔3.0,不仅是因为3.0之前的版本编码问题,还有它不支持多核计算。但3.0也有很多缺憾,就是库类跟不上。没办法,只能硬着头皮跟它干。

      使用python一年多后,也总结了一些解决编码的方法。

      1、乱码的编码

      因为乱码基本上都不能用任何一种编码方式(“utf-8,gb18030”)去编码或解码,或者能utf-8编码,但不能gb18030编码;或者反过来。可程序要运行流畅怎么办?我想出了一套办法。

      查了一下ASCII码表,发现ASCII十进制值在126以下的字符是英文,数字,以及标点符号;而在127~255范围内的那些字符,是ASCII的扩展字符,经过chr(i),126 < i < 256 后,显示出来的都是乱码,根本看不懂,试着用

      chr(i).encode('utf-8'),chr(i).encode('gb18030'),chr(i).decode('utf-8'),chr(i).decode('gb18030')都无法通过编译。根据程序需要,因为乱码显示出来的信息基本上无用,程序也用不了这些编码,所以干脆把它过滤掉,省得去编码。如果程序需要解决这些乱码怎么办?基本上不可能,根本无法显示。那些可以显示的乱码的ASCII十进制值其实范围不在127~255之间,都可以通过编译。

    python,go,redis,mongodb,.net,C#,F#,服务器架构
  • 相关阅读:
    2020.4.13 机器学习相关数学基础
    2020.3.30 机器学习概述
    12.18语法制导的语义翻译
    12.11算符优先分析
    12.4自下而上语法分析
    11.27实验二 递归下降语法分析
    11.20LL(1)文法的判断,递归下降分析程序
    11.13消除左递归
    4.K均值算法--应用
    3.K均值算法
  • 原文地址:https://www.cnblogs.com/descusr/p/2704393.html
Copyright © 2011-2022 走看看