zoukankan      html  css  js  c++  java
  • python 参议院文本预处理的一维数组的间隔空间

    #!/usr/bin/python
    import re
    def pre_process_msg ( msgIn ):
        if msgIn=="":
            return "msgIn_Input_Error,should'nt Null, it is Strings"
        else:
             #1 trim
             msg = msgIn
             msg = msg.strip()
             #2 process msg internal special char replace with “ ”
             dst_replace_pattern1 = re.compile(' ')
             msg = dst_replace_pattern1.sub(" ",msg)
             dst_replace_pattern1 = re.compile(' ')
             msg = dst_replace_pattern1.sub(" ",msg)
             dst_replace_pattern1 = re.compile(' ')
             msg = dst_replace_pattern1.sub(" ",msg)
             #3 one or more space replaced with one space,to form srings with " " internal
             result=""
             result=re.sub(" {1,}", " ", msg)
             msg=result.strip()
             print "'"+msg+"'"
             return msg

    版权声明:本文博主原创文章,博客,未经同意不得转载。

  • 相关阅读:
    用jQuery写的一个简单的弹出窗口(IE7\IE8\FF3)
    live write test
    sql2
    查询所有表索引
    java初学问题记录(2012.02.092012.02.16)
    SQL
    centso7网卡bond
    vmware模板
    Dockerfile参考
    Docker简单介绍
  • 原文地址:https://www.cnblogs.com/hrhguanli/p/4904190.html
Copyright © 2011-2022 走看看