zoukankan      html  css  js  c++  java
  • Python应用【PDF处理-pypdf2】

    概述

    Python处理PDF文件需要安装相应的库:【PyPDF2】库

    使用场景
    工作中可能会涉及处理pdf文件,PyPDF2就是这样一个库, 使用它可以轻松的处理 pdf 文件,它提供了读、写、分割、合并、文件转换等多种操作。

    安装库

    网站

    使用说明

    PyPDF2 官方文档(documentation)

    学习网站

    博客

    # 导入相关类
    from PyPDF2 import PdfFileReader, PdfFileWriter
     
    # 定义输入文件和输出文件(路径)
    inputFile = 'read.pdf'
    outputFile = 'write.pdf'
    
    # 获取一个 PdfFileReader 对象 
    pdfReader = PdfFileReader(open(inputFile, 'rb')) 
    
    # 获取 PDF 的页数 
    pageCount = pdfReader.getNumPages() 
    print(pageCount) 
    
    # 返回一个 PageObject 
    page = pdfReader.getPage(i) 
    
    # 获取一个 PdfFileWriter 对象 
    pdfWriter = PdfFileWriter() 
    
    # 将一个 PageObject 加入到 PdfFileWriter 中 
    pdfWriter.addPage(page) 
    
    # 输出到文件中 
    pdfWriter.write(open(outputFile, 'wb'))
    

    GitHub

    提供了使用案例,当我们使用的时候再具体查看。

  • 相关阅读:
    清除所有标签的属性
    chm提取
    视频分享
    依赖注入
    python-markdown
    light sdk
    ~
    html标签引入外部html
    微信公众平台自定义菜单
    还在为需要ajax而导入jquery吗? 纯js封装ajax操作
  • 原文地址:https://www.cnblogs.com/brightyuxl/p/10051892.html
Copyright © 2011-2022 走看看