zoukankan      html  css  js  c++  java
  • 关于N900的TXT文本的编码注意事项 狼人:

      N900上TXT文本的编码格式为UTF-8。此格式不用说,是目前兼容性相当好的一种编码。但是比如PC上(特指中文系统的XP、win7等)建立的TXT文本默认是ANSI

      所以当存储有中文的ANSI编码的TXT文本在N900上中文显示成乱码,更有可能无法打开(大量特殊符号)。提示系统内部错误,这是因为编码不兼容所致。
      当然如果是全E文就不会发上以上问题。

      结论是,PC端生成的TXT文本最好另存为UTF-8编码。然后在N900上使用。(N900生成的TXT文本直接是UTF-8编码)

    大量特殊符号:ANSI所包含的符号远比UTF-8少,例如全角的·在ANSI编码文本里会无法显示,成为?号.

      知识角

      unicode和ansi都是字符代码的一种表示形式。
      为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字'中'在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。
      不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。
      不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。

  • 相关阅读:
    深入NET框架
    解决idea中maven的pom文件不会自动下载jar包问题
    JSP中的作用域
    转发与重定向
    JSP内置对象
    JNDI与连接池
    文件上传
    七大设计原则
    第六章 初始继承和多态
    C#和.NET框架
  • 原文地址:https://www.cnblogs.com/waw/p/2156690.html
Copyright © 2011-2022 走看看