zoukankan      html  css  js  c++  java
  • 深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式

    很高兴的告诉大家,感谢GitHub上的h4x3rotab提供python版的搜狗用户词库备份bin格式的解析算法,感谢tmxkn1提供了C#版的实现,深蓝词库转换终于迎来了一个重大更新,能够支持搜狗用户词库的bin格式备份的导出了。再也不用受到搜狗输入法的钳制,可以自由切换到其他输入法了。搜狗bin词库只解析到了用户词条和词频,没有拼音,所以如果要导出其他拼音输入法,中间转换工具会根据词条的内容重新生成拼音。

    image

    另外在2.4版中,增加了用户词频强制设置的功能,比如将搜狗用户词库bin格式备份转换为Win10自带的微软拼音,那么词频会导致该词条在微软拼音上的位置不对,那么我们就需要忽略掉搜狗bin格式解析出来词频,而是使用1表示词频,这样在微软拼音中才会显示正常。

    image

    设置了强制的默认词频后,所有词频将按照新词频算法生成。

    image

    导入到Win10自带微软拼音的用户自定义短语后的效果如图:

    image

    最新版的深蓝词库转换的下载地址:

    https://github.com/studyzy/imewlconverter/releases

    最后,再声讨一下一个叫“ 奥创词库转换”的,把我的深蓝词库转换代码拿来改一下界面,就变成了自己的软件,极度无耻和恶心。深蓝词库转换一直是免费绿色开源的,但是也看不惯这种无底线的剽窃行为,强烈谴责一下。

    【本文章出自博客园深蓝居,转载请注明作者出处,如果您觉得博主的文章对您有很大帮助,欢迎支付宝(studyzy@163.com)对博主进行打赏。】

    原文:https://www.cnblogs.com/studyzy/p/9801629.html

    /////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// 

    最新版的深蓝词库转换的下载地址:

    https://github.com/studyzy/imewlconverter/releases

    快捷下载通道:    https://files.cnblogs.com/files/beijinglaolei/Release_V2.6_Windows.rar

    ************************************************** *********************** ***************** 每个文章内容都是测试有效的
  • 相关阅读:
    4/5邀请赛的选拔赛,闷声滚大粗
    4.5邀请赛的选拔赛,闷声滚大粗
    hdu3068&&hdu3294,回文串,Manacher算法
    hdu3068&&hdu3294,回文串,Manacher算法
    BC78,hdu5655,5656。%%%%CA娘
    BC78,hdu5655,5656。%%%%CA娘
    深度懵逼计算机系统。。。DataLab。。
    深度懵逼计算机系统。。。DataLab。。
    设置ecShop网店用户名和email均可登录
    ecshop新建增加独立页面的方法
  • 原文地址:https://www.cnblogs.com/beijinglaolei/p/11310944.html
Copyright © 2011-2022 走看看