zoukankan      html  css  js  c++  java
  • 读取word文档并提取和写入数据(基于python 3.6)

    #!/usr/bin/python3
    # -*- coding: utf-8 -*-
    # @File : delete_file
    # @Author : moucong
    # @Date : 2018/4/1 16:33
    # @Software: PyCharm

    #读取docx中的文本代码示例
    import docx
    import re

    #获取文档
    file=docx.Document("E:\python_word\word.docx")
    print("段落数:"+str(len(file.paragraphs))) #输出段落数
    file_word = docx.Document()

    #输出每一段的内容
    for para in file.paragraphs:
    print(para.text)

    #输出段落编号及段落内容
    para_data = []
    for i in range(len(file.paragraphs)):
    # for j in map(lambda x:x.split(' '),file.paragraphs[i].text):
    para_single = file.paragraphs[i].text.split(' ')
    while '' in para_single: # 移除空格
    para_single.remove('')
    # para_data.append(para_single)
    for data_number in range(len(para_single)):
    data_num = re.findall(r"d", para_single[data_number])
    data_num = ''.join(data_num)
    para_data.append(data_num + ' ')
    file_word.add_paragraph(para_data)
    file_word.save("E:\python_word\number.docx")

  • 相关阅读:
    chmod命令
    ls命令
    数组值去重-小技巧
    使用redis接管session
    使用redis接管cookie
    redis操作封装类
    HTTP协议详解
    Linux网络编程--多播
    Live555 分析(三):客服端
    Live555 分析(二):服务端
  • 原文地址:https://www.cnblogs.com/setname/p/8837024.html
Copyright © 2011-2022 走看看