1、ASCII编码
2、ANSI编码引入
2.1、ANSI编码根据国家不同,延伸出具体的编码不同
gbk
3、unicode字符集
3.1、unicode字符集延伸出的具体编码
//unicode与utf-8的关系
//https://blog.csdn.net/qq_36761831/article/details/82291166
4、URL编码
5、软件编程中字符存储的编码格式。
str = "a中";
5.1、与操作系统有关
5.2、与IDE有关
验证:
windows 下编写代码,
用不同的ide,设置不同的编码方式,验证str = "a中";的长度
linux下验证str = "a中";的长度
5.3、文件的编码方式与字符存储方式的关系。
5.3.1、文件的编码方式若ASCII并非为1个字节,我们都知道软件编程语言都是字母,asicc码表示,占用一个字节。
文件编码方式把ASCII都变为了多个字节,那么编译器就识别不了
#inlcude这些软件语言,自然无法编译解析无机器语言。
5.3.2、文件的编码方式与字符的存储方式
若文件编码方式为acsci, str = "中",编译器编译该套代码,将str对应的字符,在内存中以何种编码值去存储?
与文件编码方式一致?
与操作系统一致?
与IDE设置一致?
5.4、数据传输时字符以何种编码进行传输。
a机器 发送中文编码的数据给b;b收到的中文符是以何种方式进行编码的?
答: 取决于a机器对该字符在内存中存储的编码方式,如果utf8,那么发送过来的可能就是3个字节,
如果是unicode,那么发送过来的可能就是2个字节。
MBCS
上面说的ASCII、ASCII扩展字符集、ISO-8859中每个字符都是一个字节(8-bit)可以表示的,所以称为单字节字符集(Single-Byte Character Set,简称SBCS)。
而在亚洲,中、日、韩等国家,文字的数量远超256个,继续使用单字节字符集已经无法满足需求,于是他们制定了自己的字符集。使用2个或以上的字节数表示自己的字符集,这就是多字节字符集(Multi-Bytes Character Sets,简称MBCS)。
参考*:
https://www.cnblogs.com/douJiangYouTiao888/p/6473874.html
//ansi(gbk多字符字节流) - unicode - utf8 - ut8-url
https://blog.csdn.net/xuebing1995/article/details/79106316
https://blog.csdn.net/iteye_18561/article/details/82483453
//浏览器解析中文url
https://www.cnblogs.com/hannover/p/4657463.html
在线转化工具
http://www.knowsky.com/resource/gb2312tbl.htm //gb2312字体库
http://www.mytju.com/classcode/tools/encode_utf8.asp
http://tool.oschina.net/encode?type=2
//unicode or utf8 - utf8-url: 取决于字符怎么去存储
https://blog.csdn.net/gemo/article/details/8468311
codeblocks设置
https://www.xuebuyuan.com/2108751.html
https://www.jianshu.com/p/4570a4f969de
https://www.cnblogs.com/thingk/p/4224186.html
good
https://www.cnblogs.com/wynn518/p/8981203.html
https://blog.csdn.net/hongxingabc/article/details/82839812