zoukankan      html  css  js  c++  java
  • 读/写docx文件

    安装 
    
    pip  install  python-docx

    1.建立新Word文档
    建立新文档需要调用Document对象的save方法,
    一个Document对象代表一个Word文档,该方法的参数是保存的文件名。
    from docx import Document doc = Document() doc.save("test.docx")

    2.添加段落和段落文字
    调用Document对象的add_paragraph方法,返回值是一个Paragraph对象。
    调用Paragraph对象的add_run方法为该段落添加文字。add_run方法的返回值是一个Run对象,需要设置该对象属性。
    from docx import Document doc = Document() p = doc.add_paragraph('无格式的部分') p.add_run('加粗部分').bold = True p.add_run('无格式') p.add_run('斜体部分').italic = True doc.save(r". est.docx") 无格式的部分加粗部分 无格式 斜体部分

    3.读取文档的所有段落
    Document对象的paragraphs属性是一个包含文档所有Paragraph对象的列表对象,
    一个Paragraph对象代表文档的一个段落。对paragraphs属性进行循环遍历可以操作文档的所有段落。
    Paragraph对象的text属性代表该段落的文字。
    from docx import Document doc = Document("./test.docx") for p in doc.paragraphs: print(p.text)

    4.读取文档表格中的文字
    Document对象的tables属性是一个包含文档所有Table对象的列表对象,
    一个Table对象代表文档的一个表格。Table对象的cells属性是一个包含表格所有_Cell对象的列表
    ,一个_Cell对象代表表格的一个单元格。对表格的cells属性进行循环遍历可以操作表格的所有单元格。
    _Cell对象的text属性代表该单元格的文字。
    from docx import Document doc = Document("./Python.docx") for t in doc.tables: for c in t._cells: print(c.text)

  • 相关阅读:
    String
    Map和Set
    js的栈与堆
    js的私有属性
    随便谈一谈原型
    前端页面优化提速
    nth-child和nth-of-type
    重复输出字符串
    闭包
    mongodb内嵌文档的查询
  • 原文地址:https://www.cnblogs.com/hany-postq473111315/p/13253912.html
Copyright © 2011-2022 走看看