zoukankan      html  css  js  c++  java
  • 深蓝词库转换2.8发布——支持微软拼音自学习词库导入导出

    Win10自带的微软拼音一直以来有不少忠粉,但是词库导入导出一直是一个问题,因为微软拼音的自学习词库是自有格式,没有对外开放,所以一直没有解决。只能通过自定义短语的形式导入其他输入法的词库到微软拼音中。

    最近经过网友的提醒,再自我研究了几晚上,终于把微软拼音的自学习词库导入导出解决了。

    本次2.8版本的发布主要包含了以下更新:

    • 微软拼音自学习词库的导入和导出。
    • 转换词库时如果某些词条无法转换,通过错误窗口提示错误信息。
    • 增强了微软拼音自定义短语对多种双拼方案的支持。
    • 修改持续集成的实现方式,使用GitHub Action实现自动化的测试。

    微软拼音自学习词库对词库的支持是2W个词条,所以如果源词库太大,则无法导入,所以本转换工具也做了限制,只支持2W条内的词库转换,如果源词库太大,可以通过高级设置中的词条长度、词频等过滤条件,将词库控制在2W内。下面以搜狗拼音词库转微软拼音为例:

    搜狗拼音把用户词库导出成bin文件,然后打开深蓝词库转换,点击高级设置的“词条过滤设置”,设置一个合理的词频或者其他过滤,让最终文件词条小于2W。

    image

    然后点击“转换”按钮,完成微软拼音自学习词库的生成。

    搜狗转微软拼音自学习词库

    打开微软拼音的自学习词库导入页面,选择刚才生成的dat文件,进行导入,几秒后提示导入成功。

    image

    最近由于疫情原因,墙的火力很猛,可能无法下载,我这里也放一个下载地址:深蓝词库转换2.8

  • 相关阅读:
    合并两个有序列表
    根据前序遍历和中序遍历还原二叉树
    快速排序
    二叉树搜索的后序遍历序列
    最长回文子串
    爬楼梯
    Selenium EC 与 Wait
    爬取Django 绕过csrf实现批量注册
    Django 数据传递 个人汇总贴
    python bytes和str转换
  • 原文地址:https://www.cnblogs.com/studyzy/p/12638297.html
Copyright © 2011-2022 走看看