zoukankan      html  css  js  c++  java
  • Unicode,unicoidebig,Asci,UTF8文件read和write

    Unicode,unicoidebig,Asci,UTF8四种格式,在文本导入时,

    之所以+2,是考虑到用unicode时,是两个字节一读,所以结束符必须为两个字节都为0x00;

    用Uedit32打开就知道,

    unicode前两个多余字节是0xff,oxfe.后接unicode编缉

    unicode big的前两个多余字节是0xfe,0xff.因为unide是两个字节一存,unicode big就是所有的这两个字节的位置互换

    utf-8的前三个多余字节是0xef,0xbb,0xbf.

    直接贴代码:

    得到的szText就是所需.

    当然,

    一般导出的txt文件如果要导出成unicode,unicode big时,要注意以下几点

    1、要将字符串转成UNICODE编码。
    2、换行要使用_T("/r/n")。
    3、如果需要被其他程序或编辑器识别,

        unicode需要在文件头加上0xFF 0xFE

        unicode big需要在文件头加上0XFE 0XFF

    一般导出的txt文件如果要导出成utf-8,asci时,要注意以下几点

    1、要将字符串转成多字节编码。
    2、如果需要被其他程序或编辑器识别,

        utf-8需要在文件头加上0XEF 0XBB 0XBF.

    去年五月份写的,太乱了,更新下.

  • 相关阅读:
    用class定义类--Python
    列表推导(list comprehension)--Python
    排序--Python
    腌制数据--python(pickle标准库)
    Python--异常处理
    Python--各种杂乱的笔记
    python--文件读写
    我靠 xmind居然可以在博客园这么分享
    思维导图记录
    思维导图记录
  • 原文地址:https://www.cnblogs.com/hgy413/p/3693709.html
Copyright © 2011-2022 走看看