zoukankan      html  css  js  c++  java
  • 好用的pdf转excel的python脚本

    https://www.jianshu.com/p/f33233e4c712

    利用plumer把pdf转成excel表格

    # -*- coding: utf-8 -*-
    """
    Created on Fri May 17 2019
    @author: YangYang
    
    请确保你在运行这个代码的时候,已经安装了pdfplumber库
    如果没有安装,请在[附件-命令提示符]下输入:
    pip install pdfplumber
    """
    
    import pdfplumber
    import xlwt
    import sys
    
    # 定义保存Excel的位置
    workbook = xlwt.Workbook()  #定义workbook
    sheet = workbook.add_sheet('Sheet1')  #添加sheet
    i = 0 # Excel起始位置
    
    
    path = sys.argv[1]
    output = sys.argv[2]
    
    #path = "aaaaaa.PDF"  # 导入PDF路径
    pdf = pdfplumber.open(path)
    print('
    ')
    print('开始读取数据')
    print('
    ')
    for page in pdf.pages:
        # 获取当前页面的全部文本信息,包括表格中的文字
        # print(page.extract_text())                     
        for table in page.extract_tables():
            # print(table)
            for row in table:            
                print(row)
                for j in range(len(row)):
                    sheet.write(i, j, row[j])
                i += 1
            print('---------- 分割线 ----------')
    
    pdf.close()
    
    # 保存Excel表
    workbook.save(output)
    print('
    ')
    print('写入excel成功')
    print('保存位置:')
    print('./result.xls')
    print('
    ')
    input('PDF取读完毕,按任意键退出')
    
  • 相关阅读:
    PY个树状数组
    PY 个板子计划【雾
    PY个欧拉筛
    【NOI2007】项链工厂 ——老题新做.jpg
    Min-Max 容斥的证明
    51nod 1963 树上Nim
    ●BZOJ 3566 [SHOI2014]概率充电器
    ●BZOJ 3640 JC的小苹果
    ●BZOJ 1444 [Jsoi2009]有趣的游戏
    ●Joyoi Dotp 驱逐猪猡
  • 原文地址:https://www.cnblogs.com/shinedream/p/15433495.html
Copyright © 2011-2022 走看看