zoukankan      html  css  js  c++  java
  • 好用的pdf转excel的python脚本

    https://www.jianshu.com/p/f33233e4c712

    利用plumer把pdf转成excel表格

    # -*- coding: utf-8 -*-
    """
    Created on Fri May 17 2019
    @author: YangYang
    
    请确保你在运行这个代码的时候,已经安装了pdfplumber库
    如果没有安装,请在[附件-命令提示符]下输入:
    pip install pdfplumber
    """
    
    import pdfplumber
    import xlwt
    import sys
    
    # 定义保存Excel的位置
    workbook = xlwt.Workbook()  #定义workbook
    sheet = workbook.add_sheet('Sheet1')  #添加sheet
    i = 0 # Excel起始位置
    
    
    path = sys.argv[1]
    output = sys.argv[2]
    
    #path = "aaaaaa.PDF"  # 导入PDF路径
    pdf = pdfplumber.open(path)
    print('
    ')
    print('开始读取数据')
    print('
    ')
    for page in pdf.pages:
        # 获取当前页面的全部文本信息,包括表格中的文字
        # print(page.extract_text())                     
        for table in page.extract_tables():
            # print(table)
            for row in table:            
                print(row)
                for j in range(len(row)):
                    sheet.write(i, j, row[j])
                i += 1
            print('---------- 分割线 ----------')
    
    pdf.close()
    
    # 保存Excel表
    workbook.save(output)
    print('
    ')
    print('写入excel成功')
    print('保存位置:')
    print('./result.xls')
    print('
    ')
    input('PDF取读完毕,按任意键退出')
    
  • 相关阅读:
    [Lydsy1706月赛]大根堆
    某考试 T1 Function
    [SHOI2016] 随机序列
    某考试 T1 至危警告
    某考试 T2 yja
    bzoj1880 [Sdoi2009]Elaxia的路线
    bzoj1804 [Ioi2007]Flood 洪水
    bzoj4546 codechef XRQRS
    bzoj4547 小奇的集合
    bzoj1443 [JSOI2009]游戏Game
  • 原文地址:https://www.cnblogs.com/shinedream/p/15433495.html
Copyright © 2011-2022 走看看