zoukankan      html  css  js  c++  java
  • 使用Python做简单的字符串匹配

        由于需要在半结构化的文本数据中提取一些特定格式的字段、数据辅助挖掘分析工作,以往都是使用Matlab工具进行结构化数据处理的建模,matlab擅长矩阵处理、结构化数据的计算,Python具有与matlab共同的特点:语法简洁、库丰富,对算法仿真来说都是一门简洁易用的语言。


    Python做字符串匹配相对来说上手比较容易,且具有成熟的字符串处理库re供我们使用;

    在re库的帮助下,只需简单的两步就可完成匹配工作,对做数据分析/算法的工作者来说,轻松了许多:

    step1:构建正则表达式模式,并使用compile()函数生产正则表达式对象

    step2:调用step1生成的正在表达式对象的方法、属性,返回匹配结果

    <span style="color:#333300;"># 导入正则表达式匹配模块 Py 3.0
    import re
    text = "today is 01/04/2015, happy new year..."
    
    #建立日期的正则表达式
    detepat = re.compile('(d+)/(d+)/(d+)')
    
    #进行匹配并打印结果
    result = detepat.finditer(text)
    for m in result:
        print(m.group())</span>
    记录一下,下次用到直接翻出来就好了~

  • 相关阅读:
    二叉搜索树的第k个结点
    序列化二叉树
    把二叉树打印成多行
    按之字形顺序打印二叉树
    对称的二叉树
    二叉树的下一个结点
    删除链表中重复的结点
    链表中环的入口结点
    字符流中第一个不重复的字符
    基数排序的理解和实现(Java)
  • 原文地址:https://www.cnblogs.com/cl1024cl/p/6205057.html
Copyright © 2011-2022 走看看