zoukankan      html  css  js  c++  java
  • Python 实现 Html 转 Markdown(支持 MathJax 数学公式)

    因为需要转 html 到 markdown,找了个 python 的库,该库主要是利用正则表达式实现将 Html 转为 Markdown。

    数学公式需要自己修改代码来处理。

    我 fork 的项目地址:https://github.com/fipped/tomd

    使用方法:

    把项目 clone 到当前路径,然后新建一个 python 文件:

    
    #coding:utf-8
    from tomd import tomd
    import os
    
    # 所有博客 html 文件在目录blog 里
    root="blog"
    for file in os.listdir(root):
    	path = os.path.join(root, file)
    	if os.path.isfile(path):
    		filename = os.path.splitext(file)
    		if filename[1] == '.html':
    			tomd.Tomd("".join(open(path).readlines()),root,file).export()
    

    运行完,就可在blog目录看到所有 html 对应的.md 文件了。

    正则的一些用法:

    • .*?.是除了换行的任意字符,*是重复任意次,?表示非贪婪匹配,所以 <h1.*?>(.*?)</h1>匹配完<h1.*?>后就会匹配最早出现的</h1>

    • [sS]*?s是空白符,包括空格、换行等,S是非空白符,所以就是任意字符重复任意次的非贪婪匹配。

    • ((?!sometext).)*?:这里就是非贪婪地匹配不是字符串sometext的任意内容任意次。

  • 相关阅读:
    php中的_GET和_POST
    CSS中的特殊符号
    Nginx简介
    php获得时间
    php中定义类
    AcWing 803. 区间合并
    AcWing 826. 单链表
    AcWing 2816. 判断子序列
    AcWing 790. 数的三次方根
    AcWing 802. 区间和
  • 原文地址:https://www.cnblogs.com/flipped/p/9669255.html
Copyright © 2011-2022 走看看