zoukankan      html  css  js  c++  java
  • paip.utf-8,unicode编码的本质输出unicode文件原理 python

     paip.utf-8,unicode编码的本质输出unicode文件原理 python
     
     
     #别的语言,java php都是unicode,走十python不一样.
     
     #enddef
     #todo write to unicode encode
    fileHandle = open ( r"c:fmtSmpEnRst.txt", 'w',encoding="UTF-16" )      


     #todox utf8 not decode...now  UTF-16是Unicode
        lines=file2list(f, encode="utf-16")
        
        作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com
    转载请注明来源: http://blog.csdn.net/attilax


    #原理



    一般所谓的unicode 其实是utf-16,双字节或者4字节。

    utf-8是多字节。

    真正的unicode其实只是对文字的一个唯一编码,utf-8,utf-16都是这个编码到文件的一种实现方式。

     ,unicode和gbk是编码的值,而utf-8和utf-16是编码的表现形式

    是的,unicode准确说是一个字符编码表,而utf-32,utf-16,utf-8是unicode这个字符编码表的传输方式。比如  UTF-8    


    所以,甚至可以把utf-8,unicode,gbk理解成不同的编码,中间通过unicode转换,呵呵。
  • 相关阅读:
    [Luogu]小Z的AK计划
    [POI2006]OKR-Periods of Words
    [NOI2014]动物园
    [NOI2009]管道取珠
    [IOI2005]河流
    [国家集训队]Crash的文明世界
    [HDU5382]GCD?LCM!
    [AGC027E]ABBreviate
    [CF]Round510
    [NOIp2005]篝火晚会
  • 原文地址:https://www.cnblogs.com/attilax/p/5963998.html
Copyright © 2011-2022 走看看