编码DBCS - 走看看

zoukankan html css js c++ java

编码DBCS

今天在C#里试了下它使用的default encoding:（我的电脑是中文的windows7)

Encode defaultEncoding = Encode.Default;

Console.WriteLine("the system default encoding: ",defaultEncoding.ToString());

得出的结果是： DBCSCodePageEncoding, 于是对于这种编码很是奇怪，在网上搜寻了一翻，有所收获。

1. C#里参 Encode.Defalut的解释是： Gets an encoding for the operation system's current ANSI code page.

2.来自百度百科

DBCS：double-byte character set

最初的128个代码是ASCII,较高的128个代码中的某些总是跟随著第二个位元组(位,Bit)。这两个位元组(位,Bit)一起（称作首位元组和跟随位元组）定义一个字元，通常是一个复杂的象形文字。

虽然中文、日文和韩文共用一些相同的象形文字，但显然这三种语言是不同的，而且经常是同一个象形文字在三种不同的语言中代表三件不同的事。Windows支持四个不同的双位元组字元集：内码表932（日文）、936（简体中文）、949（韩语）和950（繁体汉字）（所谓的内码表，根据我的理解就是windows 里的code page）。只有为这些国家（地区）生产的Windows版本才支持DBCS。明白Unicode和DBCS之间的区别很重要。Unicode使用（特别在C程式设计语言环境里）宽字元集。Unicode中的每个字元都是16位元宽而不是8位元宽。在Unicode中，没有单单使用8位元数值的意义存在。相比之下，在双位元组字元集中我们仍然处理8位元数值。有些位元组自身定义字元,而某些位元组则显示需要和另一个位元组共同定义一个字元。

3.博客上有个人写了个C#程序得到了.net支持的所有的编码集：

http://www.cnblogs.com/skyivben/archive/2011/01/13/1935086.html

从文章中给的表可以看出DBCSCodePageEncoding包括中文，日文，朝鲜文及中文繁体的编码方式。

4.在百度文库里可以找到ASCII, DBCS, Unicode三种编码的区别：

http://wenku.baidu.com/link?url=Nn7712MBnorET9woMsTbkFAYkDKHbsb7vubHFN8JorB1qCKVYp5y_ujzvzuyAMsJhjAFJS5WxE0QPVp1DH-CpQk8h9lVB_hM5Uq9jyNPCim

5.还有一个新发现，原来在Linux下也可以支持C#语言的开发，

http://www.cnblogs.com/skyivben/archive/2009/11/19/1605821.html

查看全文

相关阅读:
如何改变常用编辑器(eclipse)的字号大小
 IOConsole Updater error
RNAfold的使用方法
 单因素方差分析(oneway ANOVA)
Perl内部保留变量（系统变量）
Perl 中的正则表达式
 Perl Eclipse 格式化代码
 卸载Oracle 9i
Ubuntu的菜鸟常用的基础命令
 linux as4u2 下安装openssh

原文地址：https://www.cnblogs.com/sunshore/p/3548154.html