zoukankan      html  css  js  c++  java
  • python37-能检测文件编码的模块

    我先把1.txt的内容贴出来:

    马纤羽     深圳    173   13711111111
    乔亦菲     广州    173   15811111111
    罗梦竹     北京    173   18511111111
    刘诺涵     北京    175   18511111111
    岳妮妮     深圳    173   18811111111
    贺婉萱     深圳    173   18511111111
    叶梓萱     上海    173   18011111111

    安装方式 :pip3 install chardet

     1 # @Time :2019/6/9 13:34
     2 #-*- encoding:utf-8 -*-
     3 
     4 import chardet
     5 
     6 with open('1.txt',mode='rb') as f:
     7 data = f.read()
     8 # print(data)
     9 
    10 print(chardet.detect(data))
    11 #输出为 {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
    12 
    13  print(data.decode('UTF-8'))

    解释:

    #{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
    'encoding': 'utf-8',这是检测出来可能的编码格式,
    'confidence': 0.99,相似度0.99
  • 相关阅读:
    C语言作业9
    C语言作业8
    学习体会
    C语言作业7
    C语言作业6
    C语言作业5
    C语言作业4
    C语言作业3
    丛铭俣 160809324 (作业12)
    丛铭俣 160809324 (作业10)
  • 原文地址:https://www.cnblogs.com/Demo-simple/p/11155047.html
Copyright © 2011-2022 走看看