zoukankan      html  css  js  c++  java
  • Unicode,unicoidebig,Asci,UTF8文件read和write

    Unicode,unicoidebig,Asci,UTF8四种格式,在文本导入时,

    之所以+2,是考虑到用unicode时,是两个字节一读,所以结束符必须为两个字节都为0x00;

    用Uedit32打开就知道,

    unicode前两个多余字节是0xff,oxfe.后接unicode编缉

    unicode big的前两个多余字节是0xfe,0xff.因为unide是两个字节一存,unicode big就是所有的这两个字节的位置互换

    utf-8的前三个多余字节是0xef,0xbb,0xbf.

    直接贴代码:

    得到的szText就是所需.

    当然,

    一般导出的txt文件如果要导出成unicode,unicode big时,要注意以下几点

    1、要将字符串转成UNICODE编码。
    2、换行要使用_T("/r/n")。
    3、如果需要被其他程序或编辑器识别,

        unicode需要在文件头加上0xFF 0xFE

        unicode big需要在文件头加上0XFE 0XFF

    一般导出的txt文件如果要导出成utf-8,asci时,要注意以下几点

    1、要将字符串转成多字节编码。
    2、如果需要被其他程序或编辑器识别,

        utf-8需要在文件头加上0XEF 0XBB 0XBF.

    去年五月份写的,太乱了,更新下.

  • 相关阅读:
    delete误删除恢复
    oracle自增字段
    oracle唯一约束
    linux得到系统当前日期
    to_char+fm
    oracle范围分区
    oracle之use_hash用法
    oracle11g的regexp函数
    第一个脚本输入参数
    使用ctl将txt或csv文件导入表数据
  • 原文地址:https://www.cnblogs.com/hgy413/p/3693709.html
Copyright © 2011-2022 走看看