zoukankan      html  css  js  c++  java
  • 关于N900的TXT文本的编码注意事项 狼人:

      N900上TXT文本的编码格式为UTF-8。此格式不用说,是目前兼容性相当好的一种编码。但是比如PC上(特指中文系统的XP、win7等)建立的TXT文本默认是ANSI

      所以当存储有中文的ANSI编码的TXT文本在N900上中文显示成乱码,更有可能无法打开(大量特殊符号)。提示系统内部错误,这是因为编码不兼容所致。
      当然如果是全E文就不会发上以上问题。

      结论是,PC端生成的TXT文本最好另存为UTF-8编码。然后在N900上使用。(N900生成的TXT文本直接是UTF-8编码)

    大量特殊符号:ANSI所包含的符号远比UTF-8少,例如全角的·在ANSI编码文本里会无法显示,成为?号.

      知识角

      unicode和ansi都是字符代码的一种表示形式。
      为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字'中'在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。
      不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。
      不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。

  • 相关阅读:
    HTML学习记录之HTML组成原理 PHP学习铺垫
    最长上升子序列(Longest increasing subsequence)
    进程保护(二)
    进程保护(一)
    屏幕广播的实现(三)
    vs2010 调试快捷键
    [整理]C#.Net的常见面试试题附答案(ZT)
    C# 中处理字符串常用的函数及方法详细说明
    Linux 系统下 /etc/group 档案结构
    C# Thread 多种写法总结
  • 原文地址:https://www.cnblogs.com/waw/p/2156690.html
Copyright © 2011-2022 走看看