zoukankan      html  css  js  c++  java
  • C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

    用C#写了个汉字转拼音的小工具,和网上大部分工具不同,这个通过分词算法,解决了多音字的问题,并且提供声调,可开可关。

    如题,用"银行 行不行 行家说了算"举例,如果转拼音却不能识别多音字,就惨了。

    而这个小工具的效果如图:

    C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

    实现了3种分词算法:
    * 正向最大匹配
    * 反向最大匹配
    * 双向最大匹配
    (这个双向匹配的歧义处理办法,还是本人创新。。。)

    C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

    软件下载:
     http://pan.baidu.com/s/1mTg3T 

    -----------------分割线---------------------

    这里,不得不提一下分词算法这个事情。

    不过都写在这就太长了,还是放到下一篇再谈。

    -----------------源代码(含生成好的程序)--------------------

    百度网盘:
    http://pan.baidu.com/s/1ED1Ls 

    腾讯微云:
    http://url.cn/PnnMOU

    使用注意:
    * bin/release目录下,已经包含了生成的软件。

    * 显示拼音时,因为词库的中文单字非常不全,我引用了微软的ChnCharInfo.dll,来获得一些单字拼音。这个库是要下载Visual Studio International Pack安装到系统才会有的。

    不过你可以直接从bin/release里面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2个文件也不能删掉ChnCharInfo.xml和zh-CN目录下的 ChnCharInfo.resources.dll

  • 相关阅读:
    51nod 1284:2 3 5 7的倍数 容斥原理
    POJ 2006:Litmus Test 化学公式
    POJ 2039:To and Fro
    POJ 2014:Flow Layout 模拟水题
    南阳722--数独(Dfs)
    Poj2377--Bad Cowtractors(最大生成树)
    并查集知识点总结
    Poj1861--Network(最小生成树)
    杭电2824--The Euler function(欧拉函数)
    杭电1284--钱币兑换问题(有趣)
  • 原文地址:https://www.cnblogs.com/gc2013/p/3658230.html
Copyright © 2011-2022 走看看