zoukankan      html  css  js  c++  java
  • Unicode,unicoidebig,Asci,UTF8文件read和write

    Unicode,unicoidebig,Asci,UTF8四种格式,在文本导入时,

    之所以+2,是考虑到用unicode时,是两个字节一读,所以结束符必须为两个字节都为0x00;

    用Uedit32打开就知道,

    unicode前两个多余字节是0xff,oxfe.后接unicode编缉

    unicode big的前两个多余字节是0xfe,0xff.因为unide是两个字节一存,unicode big就是所有的这两个字节的位置互换

    utf-8的前三个多余字节是0xef,0xbb,0xbf.

    直接贴代码:

    得到的szText就是所需.

    当然,

    一般导出的txt文件如果要导出成unicode,unicode big时,要注意以下几点

    1、要将字符串转成UNICODE编码。
    2、换行要使用_T("/r/n")。
    3、如果需要被其他程序或编辑器识别,

        unicode需要在文件头加上0xFF 0xFE

        unicode big需要在文件头加上0XFE 0XFF

    一般导出的txt文件如果要导出成utf-8,asci时,要注意以下几点

    1、要将字符串转成多字节编码。
    2、如果需要被其他程序或编辑器识别,

        utf-8需要在文件头加上0XEF 0XBB 0XBF.

    去年五月份写的,太乱了,更新下.

  • 相关阅读:
    CDQ分治
    2-sat
    整体二分
    apache性能优化
    apache反向代理出现502调整
    hadoop学习笔记肆--元数据管理机制
    ssh 免密码登录配置,及其原理
    extjs 中的一些鲜为人知的属性(深渊巨坑)
    hadoop学习笔记叁--简单应用
    hadoop学习笔记贰 --HDFS及YARN的启动
  • 原文地址:https://www.cnblogs.com/hgy413/p/3693709.html
Copyright © 2011-2022 走看看