zoukankan      html  css  js  c++  java
  • C# 怎样判断一个字符串的编码类型

    方法一
    http://blog.csdn.net/qiujiahao/archive/2007/08/09/1733169.aspx
    在unicode 字符串中,中文的范围是在4E00..9FFF:CJK Unified Ideographs。
     
    通过对字符的unicode编码进行判断来确定字符是否为中文。
     
    <!--[if !vml]--><!--[endif]-->
    <!--[if !vml]--><!--[endif]--> protected bool   IsChineseLetter(string input,int index)
    <!--[if !vml]--><!--[endif]-->    {
     
    <!--[if !vml]--><!--[endif]-->        int code = 0;
    <!--[if !vml]--><!--[endif]-->        int chfrom = Convert.ToInt32("4e00", 16);    //范围(0x4e00~0x9fff)转换成int(chfrom~chend)
    <!--[if !vml]--><!--[endif]-->        int chend = Convert.ToInt32("9fff", 16);
    <!--[if !vml]--><!--[endif]-->        if (input != "")
    <!--[if !vml]--><!--[endif]-->        {
    <!--[if !vml]--><!--[endif]-->             code = Char.ConvertToUtf32(input, index);    //获得字符串input中指定索引index处字符unicode编码
    <!--[if !vml]--><!--[endif]-->            
    <!--[if !vml]--><!--[endif]-->           if (code >= chfrom && code <= chend)     
    <!--[if !vml]--><!--[endif]-->            {
    <!--[if !vml]--><!--[endif]-->                 return true;     //当code在中文范围内返回true
    <!--[if !vml]--><!--[endif]-->
    <!--[if !vml]--><!--[endif]-->             }
    <!--[if !vml]--><!--[endif]-->            else
    <!--[if !vml]--><!--[endif]-->            {
    <!--[if !vml]--><!--[endif]-->                  return false ;    //当code不在中文范围内返回false<!--[if !vml]--><!--[endif]-->
    <!--[if !vml]--><!--[endif]-->             }
    <!--[if !vml]--><!--[endif]-->         }
     
              return false;
    <!--[if !vml]--><!--[endif]--> }
    
    方法二:
    http://hi.baidu.com/yhfd/blog/item/3222e1fca22cfb80b901a027.html
    public bool IsChina(string CString)
               {
                   bool BoolValue = false;
                   for (int i = 0; i < CString.Length; i++)
                   {
                       if (Convert.ToInt32(Convert.ToChar(CString.Substring(i, 1))) < Convert.ToInt32(Convert.ToChar(128)))
                       {
                           BoolValue = false;
                       }
                       else
                       {
                           return BoolValue = true;
                       }
                   }
                   return BoolValue;
               }
    
    方法三:
     
            /// <summary>
             /// 判断句子中是否含有中文     宁夏大学 张冬 zd4004.blog.163.com
             /// </summary>
             /// <param >字符串</param> 
             public bool WordsIScn(string words)
             {
                 string TmmP;
     
                for (int i = 0; i < words.Length; i++)
                 {
                     TmmP = words.Substring(i, 1);
     
                    byte[] sarr = System.Text.Encoding.GetEncoding("gb2312").GetBytes(TmmP);
     
                    if (sarr.Length == 2)
                     {
                         return true;
                     }
                 }
                 return false;
             }
     
    
    
    方法四:
    for (int i=0; i<s.length; i++)
     {
     Regex rx = new Regex("^[/u4e00-/u9fa5]$");
     if (rx.IsMatch(s[i]))
     // 是
    else
     // 否
    }
    正解!
    /u4e00-/u9fa5 汉字的范围。
    ^[/u4e00-/u9fa5]$ 汉字的范围的正则
    
    方法五
    unicodeencoding unicodeencoding = new unicodeencoding(); 
     byte [] unicodebytearray = unicodeencoding.getbytes( inputstring ); 
     for( int i = 0; i < unicodebytearray.length; i++ ) 
     { 
     i++; 
     //如果是中文字符那么高位不为0 
     if ( unicodebytearray[i] != 0 ) 
     { 
     } 
    ……   
    
    方法六
        /// <summary>
             /// 给定一个字符串,判断其是否只包含有汉字
            /// </summary>
             /// <param name="testStr"></param>
             /// <returns></returns>
             public bool IsOnlyContainsChinese(string testStr)
             {
                 char[] words = testStr.ToCharArray();
                 foreach (char word in words)
                 {
                     if ( IsGBCode(word.ToString()) || IsGBKCode(word.ToString()) ) // it is a GB2312 or GBK chinese word
                     {
                         continue;
                     }
                     else
                     {
                         return false;
                     }
                 }
                 return true;
             }
     
            /// <summary>
             /// 判断一个word是否为GB2312编码的汉字
            /// </summary>
             /// <param name="word"></param>
             /// <returns></returns>
             private bool IsGBCode(string word)
             {
                 byte[] bytes = Encoding.GetEncoding("GB2312").GetBytes(word);
                 if (bytes.Length <= 1) // if there is only one byte, it is ASCII code or other code
                 {
                     return false;
                 }
                 else
                 {
                     byte byte1 = bytes[0];
                     byte byte2 = bytes[1];
                     if (byte1 >= 176 && byte1 <= 247 && byte2 >= 160 && byte2 <= 254)    //判断是否是GB2312
                     {
                         return true;
                     }
                     else
                     {
                         return false;
                     }
                 }
             }
     
            /// <summary>
             /// 判断一个word是否为GBK编码的汉字
            /// </summary>
             /// <param name="word"></param>
             /// <returns></returns>
             private bool IsGBKCode(string word)
             {
                 byte[] bytes = Encoding.GetEncoding("GBK").GetBytes(word.ToString());
                 if (bytes.Length <= 1) // if there is only one byte, it is ASCII code
                 {
                     return false;
                 }
                 else
                 {
                     byte byte1 = bytes[0];
                     byte byte2 = bytes[1];
                     if ( byte1 >= 129 && byte1 <= 254 && byte2 >= 64 && byte2 <= 254)     //判断是否是GBK编码
                    {
                         return true;
                     }
                     else
                     {
                         return false;
                     }
                 }
             }
     
            /// <summary>
             /// 判断一个word是否为Big5编码的汉字
            /// </summary>
             /// <param name="word"></param>
             /// <returns></returns>
             private bool IsBig5Code(string word)
             {
                 byte[] bytes = Encoding.GetEncoding("Big5").GetBytes(word.ToString());
                 if (bytes.Length <= 1) // if there is only one byte, it is ASCII code
                 {
                     return false;
                 }
                 else
                 {
                     byte byte1 = bytes[0];
                     byte byte2 = bytes[1];
                     if ( (byte1 >= 129 && byte1 <= 254) && ((byte2 >= 64 && byte2 <= 126) || (byte2 >= 161 && byte2 <= 254)) )     //判断是否是Big5编码
                    {
                         return true;
                     }
                     else
                     {
                         return false;
                     }
                 }
             }
    

      

  • 相关阅读:
    nutch 存储到数据库
    66、多种多样的App主界面Tab(1)------ ViewPager实现Tab
    让TextView的drawableLeft与文本一起居中显示
    细说Java多线程之内存可见性
    八、图形与图像处理(2)
    65、TextView 字体设置不同颜色 --- 未完
    64、具有过渡动画效果的布局Layout( 2 )
    63、具有过渡动画效果的布局Layout
    62、常规控件(5)Navigation View –美观的侧滑视图
    61、常规控件(4)TabLayout-便捷实现标签
  • 原文地址:https://www.cnblogs.com/zhangxin1989/p/2820581.html
Copyright © 2011-2022 走看看