在Linux下写C程序,尤其是网络通信程序时经常遇到编码转换的问题,这里要用到iconv函数库。
iconv函数库有以下三个函数
1
|
|
这三个函数的功能显而易见,分别是打开一个iconv_t句柄,转换字符串以及关闭一个iconv_t句柄。其中有必要一说的是iconv函数,这个函数十分容易用错。
iconv函数的五个参数中,第一个参数是iconv句柄,第二、三个参数是需要转换的字符串的地址和长度的地址,第四、五个参数是存储结果的字符串的地址和长度的地址,注意这里传的都是地址,因为这四个参数的值都有会被iconv
函数改变。iconv
会逐步的将*inbuf
中的字符转换到*outbuf
中,并增加*inbuf
指针减少*inbytesleft
的值,以及增加*outbuf
指针减少*outbytesleft
的值。
iconv函数会因为以下四种原因停止并返回:
*input
中遇到了一个非法的多字节序列,返回(size_t)-1并置errno=EILSEQ,返回时*inbuf
指向非法字符的开头。*input
全部转换完,返回不可转换的字符数。*input
中遇到了一个不完整的多字节序列,返回(size_t)-1并置errno=EINVAL,返回时*inbuf
指向不完整字符的开头。*output
空间不够,返回(size_t)-1并置errno=E2BIG。
以下给出一个示例函数,将一个字符串从utf-8转换成gbk后再重新转换成utf-8。
1
|
|
我用的xshell连接到虚拟机,先将terminal的编码设置为utf-8运行,结果如下
1
|
original : 你好,中南。- Hello, CSU.
|
再将terminal的编码设置为gbk运行,结果如下
1
|
original : 浣犲ソ锛屼腑鍗椼€? Hello, CSU.
|
可见,在相应的编码下,对应的字符串能正常显示。
http://vimersu.win/blog/2014/03/04/linux-iconv/