zoukankan      html  css  js  c++  java
  • python开发简易pdf阅读器,没开发,换个思路:pdf转word文档

    ---初学python---

    最近发现电脑里的pdf文件用浏览器全都打不开了,所以想到最近新学了python,为何不自己做一个呢?

    准备环境:

    • Python3.7

    • PyMuPDF

    • PyQt5

    首先安装 PyMuPDF 来解析 PDF ,如图:

    安装PyQt5 ,做视图操作文件:

     阅读器还没做,哈哈哈,但是最近想着直接转换成word文档不就好了吗,哈哈哈,就几行代码,如下:

    from pdfminer.high_level import extract_pages
    from pdfminer.layout import LTTextContainer
    from docx import Document
    
    #先创建doc对象
    doc = Document()  # 以默认模板建立文档对象
    #将pdf内容转换成文字
    for page_layout in extract_pages("test.pdf"):
        for element in page_layout:
            if isinstance(element, LTTextContainer):
                print(element.get_text())
                #写入内容
                paragraph = doc.add_paragraph(element.get_text())
        #最关键的一步,保存文档
        doc.save('test.docx')


    What do you want to be?
  • 相关阅读:
    flash 语法 入门
    flash 代码 雪花飘落
    test windows live writer
    网站索引
    [转]jquery入门简介
    forcast iframe 及 四款播放器
    flash
    flash 备忘
    浏览器默认HTML的CSS样式属性
    简单多线程拷贝单文件示例
  • 原文地址:https://www.cnblogs.com/CatsBlog/p/13729705.html
Copyright © 2011-2022 走看看