zoukankan      html  css  js  c++  java
  • paip.输入法编程词库多意义条目分割 python实现.

    paip.输入法编程---词库多意义条目分割 python实现.

    ==========子标题
    python mysql 数据库操作
    多字符分隔,字符串分割
    字符列表循环

     作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com
    来源: http://blog.csdn.net/attilax

    ===================主要的流程
    词库原来格式
    carp      n.鲤鱼;v.吹毛求疵    813

    需要意义分割..

    主要的流程如下:

    for   sqlQuery
    {
        #多分隔符转换为一个..
        clearFmt(row)
        clearBrakets
        split(",")  //
        for insert into grejx_def (en,cn)values('@en','@cn')"
    }

    ----------------------实际代码如下
    from db import *
    #多分隔符转换为一个..
    def clearFmt(Ss):
        Spos="prep.,pron.,n.,v.,conj.,s.,sc.,o.,oc.,vi.,vt.,aux.v.,a.,ad.,art.,num.,int.,u.,c.,pl.,adj."
        print(Spos)

        pos_a=Spos.split(",")
        for index,v in enumerate(pos_a):
            Ss=Ss.replace(v, ",")

        Ss=Ss.replace(";", ",")
        Ss=Ss.replace(",", ",")  
        Ss=Ss.replace(" ", "")  
        Ss=Ss.replace(",,", ",")  
        Ss=Ss.replace(",,", ",")  
        Ss=trim(Ss, ",")  
        print(Ss)
        return Ss
    """"
    Ssx="v.支持,赞成;容忍;n.表情"
    clearFmt(Ssx)
    """


    def splitInsert(id, cnstr, en):
        cnstr=clearFmt(cnstr)
        cnstr_a=cnstr.split(",")
     
        for index,v in enumerate(cnstr_a):
     
            sql=" insert into grejx_def (en,cn)values('@en','@cn')"
            sql=sql.replace("@en", trim(en)).replace("@cn", v.strip())
            print(sql)
            reslt= execute(sql)
            print("---insert resl:")
            print(reslt)
            
    from pkg import *
    from pkg.strUtil import *


    Sql="SELECT * FROM `grejx_def` where 1=1 and  ( nAdjV like '%;%'   or nAdjV like  '%,%'   or nAdjV like  '%...%'   or nAdjV like  '%,%'   or nAdjV like  '%;%'    or LENGTH(nAdjV)>5 ) limit 10000"
    print(Sql)
    fdata=rs(Sql, conn)
    for row in fdata:
        
        print(row)
        splitInsert(row['id'], row['nAdjV'], row['en'])
        
        
    """"
    for (en, cn, id) in cursor:
      print(cn)
    """

  • 相关阅读:
    vue学习笔记 样式 class style(五)
    vue学习笔记 计算属性(四)
    vue学习笔记 模板语法(三)
    vue学习笔记 实例(二)
    vue学习笔记 概述(一)
    Babel指南——基本环境搭建
    手动es6编译es5(命令行)
    TrimPath
    git 远程仓库管理
    CSS左侧固定宽 右侧自适应(兼容所有浏览器)
  • 原文地址:https://www.cnblogs.com/attilax/p/15199267.html
Copyright © 2011-2022 走看看