zoukankan      html  css  js  c++  java
  • C语言处理中文

    C语言处理中文 - 大萝卜的专栏 - 博客频道 - CSDN.NET

    C语言处理中文

    255人阅读 评论(0) 收藏 举报

    GBK 采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。 这是一个显示中西文混合字符串的参考程序。通过上面的分析可以得出,如果是汉字,则首字节在81-FE 之间,其最高位为1,所以补码小于0,应连续显示两个字节;如果是西文字符,则首字节在00-7F之间,其最高位为0,补码大于等于0,只需显示一个字节。

    1. #include <stdio.h>  
    2.  char *str="汉字里有english也能正确显示";  
    3.  int main() {  
    4.   int i = 0;  
    5.   while (str[i] != '/0') {  
    6.     if(str[i] < 0) {  
    7.        printf("%c%c/n", str[i], str[i+1]);  
    8.        i++;  
    9.     }  
    10.     else {  
    11.      printf("%c/n", str[i]);  
    12.     }  
    13.     i++;  
    14.    }  
    15.   return 0;  
    16. }  
  • 相关阅读:
    Go--指针
    Go--struct
    Go--函数
    Go基础
    流程控制
    Go前言
    变量与常量
    Django(三):HttpRequest和HttpResponse
    Django(二):url和views
    tensorflow(一):图片处理
  • 原文地址:https://www.cnblogs.com/lexus/p/2866476.html
Copyright © 2011-2022 走看看