zoukankan      html  css  js  c++  java
  • python3下的编码检测——chardet

    ====================================================
    chardet 2.1.1 for py3
    ====================================================

        chardet 是python的第三方库,chardet是一个非常优秀的编码识别模块。但是一直没有python3的版本,
    由于自己需要用到,因此试着修改到python3下能够运行。

    一、本软件基于chardet-2.1.1,安装python 3的新特性和语法进行修改后修改版,修改时参照了此篇文章:
    http://woodpecker.org.cn/diveintopython3/case-study-porting-chardet-to-python-3.html#running2to3

    二、但由于版本不同,修改之处也不尽相同,修改点也多于文章中所提之处。
    本人测试环境为python3.3。

    三、另外,由于python3对于字符串编码的调整,因此对于str类型侦测编码就变得没有意义了,因此,修改过后的版本
    是用来检测bytes类型的编码的。

    四、测试程序test.py是根据该文章中的编码的来,原软件包中并无此文件。

    五、安装时仍用原有安装方式:python setup.py install

    六、其他事项参加chartdet的文档或网上文章。

    ====================================================
    ***********    佣工7001 2012.12.18       ***********
    ====================================================
    @@@注:本软件一切权利归属原作者,如果有问题,本人概不负责

    测试程序运行画面抓图

    chardet修改版源码下载

  • 相关阅读:
    c++ 面试注意的问题
    非root用户 gcc安装
    爱挑剔的acm程序员 acmer
    Add Digits
    Rectangle Area
    Contains Duplicate III 下标范围<=k 值范围<=t
    ruby第一次实践 ”hello world“
    判断一个 int 向量里是否有相同的数 并且距离在k之内 (2)
    判断一个 int 向量里是否有相同的数(1)
    字符串同构
  • 原文地址:https://www.cnblogs.com/dajianshi/p/2827083.html
Copyright © 2011-2022 走看看