zoukankan      html  css  js  c++  java
  • 简单测试--C#实现中文汉字转拼音首字母

    第一种:

    这个是自己写的比较简单的实现方法,要做汉字转拼音首字母,首先应该有一个存储首字母的数组,然后将要转拼音码的汉字与每个首字母开头的第一个汉字即“最小”的汉字作比较,这里的最小指的是按拼音规则比较最小,例如a比h小,所以“爱”比“恨”小,同一个字母开头的拼音比较大小以此类推。最后实现的结果是只转汉字,对于中文特殊字符、标点符号和英文都原样输出,不转码。

    实现方法如下:

     1 using System;
     2 using System.Collections.Generic;
     3 using System.Globalization;
     4 using System.Linq;
     5 using System.Text;
     6 using System.Threading.Tasks;
     7 using System.Text.RegularExpressions;//先导入这个使用正则表达式
     8 
     9 namespace WritePinYin
    10 {
    11 
    12     public class SimplePinYin
    13     {
    14         //汉字每个首字母的拼音中最小的字,顺序不能乱
    15         private static char[] firstcn = { '', '', '', '', '', '', '', '',
    16                                    '', '', '', '', '', '', '', '',
    17                                    '', '', '', '', '', '', '' };
    18         //所有汉字首字母
    19         private static char[] firsten = { 'Z', 'Y', 'X', 'W', 'T', 'S', 'R', 'Q',
    20                                    'P', 'O', 'N', 'M', 'L', 'K', 'J', 'H',
    21                                    'G', 'F', 'E', 'D', 'C', 'B', 'A' };
    22 
    23         /// <summary> 
    24         /// 汉字转化为拼音首字母
    25         /// </summary> 
    26         /// <param name="str">汉字</param> 
    27         /// <returns>首字母</returns> 
    28         public static string GetFirstPinyin(string strcn)
    29         {
    30             int intlen = strcn.Length;
    31             int index = 0;
    32             char chartemp = char.MinValue;
    33             string strtemp = string.Empty;
    34             Regex reg = new Regex(@"[u4e00-u9fa5]");//u4e00-u9fa5用来判断是不是中文的正则表达式
    35             CultureInfo pinyin = new CultureInfo(0x804);//保存区域特定的信息,如关联的语言、子语言、国家/地区、日历和区域性约定,这里表示中文
    36             if (intlen > 0)
    37             {
    38                 char[] strchar = new char[intlen + 1];
    39                 for (int i = 0; i < intlen; i++)
    40                 {
    41                     strchar[i] = Convert.ToChar(strcn.Substring(i, 1));
    42                 }
    43                 foreach (char cstr in strchar)
    44                 {
    45                     chartemp = char.MinValue;
    46                     if (reg.IsMatch(cstr.ToString()))//对于中文汉字,不包括中文特定字符
    47                     {
    48                         foreach (char fstr in firstcn)
    49                         {
    50                             if (string.Compare(cstr.ToString(), fstr.ToString(), pinyin, CompareOptions.None) >= 0)//将汉字与设定的汉字按拼音比较大小
    51                             {
    52                                 index = Array.IndexOf(firstcn, fstr);
    53                                 chartemp = firsten[index];
    54                                 break;
    55                             }
    56                         }
    57                     }
    58                     else//对于非中文汉字,不作拼音码处理
    59                     {
    60                         chartemp = cstr;
    61                     }
    62                     strtemp += chartemp;
    63                 }
    64             }
    65             return strtemp;
    66         }
    67 
    68     }
    69 }

    调用:Console.WriteLine("{0}:{1}", strcn, SimplePinYin.GetFirstPinyin("我是托尔其!"));

    第二种:

    参考:http://www.cnblogs.com/yazdao/archive/2011/06/04/2072488.html

    使用微软的Visual Studio International Pack 类库提取汉字拼音首字母,首先下载Visual Studio International Pack 1.0,官方下载地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=44CAC7F0-633B-477D-AED2-99AEE642FC10&displaylang=zh-cn。下载完毕后解压,解压后可以发现7个MSI安装文件,其中CHSPinYinConv.msi是汉字拼音组件,CHTCHSConv.msi是进行繁简体互转组件,安装这两个MSI就可以了 (x86操作系统上的默认安装目录是 C:Program FilesMicrosoft Visual Studio International Pack) 。安装完毕后,需要在VS里添加引用,分别引用:C:Program FilesMicrosoft Visual Studio International PackSimplified Chinese Pin-Yin Conversion Library(拼音)下和C:Program FilesMicrosoft Visual Studio International PackTraditional Chinese to Simplified Chinese Conversion Library and Add-In Tool(繁简互转)下的dll 即可使用。

     1 using Microsoft.International.Converters.PinYinConverter;//导入拼音相关
     2 
     3 namespace WebApplication2
     4 {
     5     public class Class1
     6     {   
     7         /// <summary> 
     8         /// 汉字转化为拼音
     9         /// </summary> 
    10         /// <param name="str">汉字</param> 
    11         /// <returns>全拼</returns> 
    12         public static string GetPinyin(string str)
    13         {
    14             string r = string.Empty;
    15             foreach (char obj in str)
    16             {
    17                 try
    18                 {
    19                     ChineseChar chineseChar = new ChineseChar(obj);
    20                     string t = chineseChar.Pinyins[0].ToString();
    21                     r += t.Substring(0, t.Length - 1);
    22                 }
    23                 catch
    24                 {
    25                     r += obj.ToString();
    26                 }
    27             }
    28             return r;
    29         }
    30 
    31         /// <summary> 
    32         /// 汉字转化为拼音首字母
    33         /// </summary> 
    34         /// <param name="str">汉字</param> 
    35         /// <returns>首字母</returns> 
    36         public static string GetFirstPinyin(string str)
    37         {
    38             string r = string.Empty;
    39             foreach (char obj in str)
    40             {
    41                 try
    42                 {
    43                     ChineseChar chineseChar = new ChineseChar(obj);
    44                     string t = chineseChar.Pinyins[0].ToString();
    45                     r += t.Substring(0, 1);
    46                 }
    47                 catch
    48                 {
    49                     r += obj.ToString();
    50                 }
    51             }
    52             return r;
    53         }
    54     }
    55 }

    调用:Console.WriteLine("{0}:{1}", strcn, MSPinyin.GetFirstPinyin("我是托尔其!"));

  • 相关阅读:
    Ruby向Java发起挑战,红色风暴来了吗?
    学习语义网的好书
    Joel给计算机系学生们七条免费的建议
    ruby rails: 一个高开发效率的web开发框架
    推荐:《真正的执行》
    每个java程序员都应该看看Jakarta Commons
    上海IT俱乐部论坛开通了!
    重构的三个层次
    一些蔡志忠先生的漫画书!
    pythonchanllenge: 解决迷题,非常有趣的学习python的方式
  • 原文地址:https://www.cnblogs.com/CIreland/p/6882321.html
Copyright © 2011-2022 走看看