zoukankan      html  css  js  c++  java
  • python文件操作 二

    问题:在传输的时候对方不知道是以什么格式传给用户,传来传去彼此都忘了什么格式:

        在编码的时候:utf8:是3个字符,gbk是2个字符,每个字符数字对应的字符,一段2进制串,如果10个字节全部都是中文,永远不能是utf-8,但是又要存成中文,就只能是gbk了,第三方的工具箱,会自动检测这段文字是什么编码。

    问题:假如你不知道你要处理的文件是什么格式编码可怎么办呢?

    #如果想用chardet需要安装第三方的工具包chardet
    import chardet
    f=open('log',mode='rb')
    data=f.read()
    f.close()
    result=chardet.detect(open('log',mode='rb').read())
    print(result)

    2.如下交大家安装chardet,

    以上文件自己创建和编写(可以编写gbk格式,或者其他的格式,自己使用上边的代码进行检测)

    执行的结果是个:字典;具体结果可以自行查看;

    3.对于我们上边的文件如果是会显示GB2312的编码,我们可以吧它转换为对应的编码格式;Unicode

    data.decode("gb2312")

    四:现在是文件内容比较小,如果文件内容比较大,我们怎么办呢?

  • 相关阅读:
    AngularJS(3)-过滤器
    AngularJS(2)-Scope作用域和控制器
    iOS局部刷新
    python(一)入门
    Java基础
    AngularJS(1)随笔
    mac下如何查看指定端口被谁占用并且杀死该进程
    Python 字节码bytecode
    Python 作用域和命名空间
    Python函数的默认参数的设计【原创】
  • 原文地址:https://www.cnblogs.com/surewing/p/9098063.html
Copyright © 2011-2022 走看看