zoukankan      html  css  js  c++  java
  • Python操作Word【批量生成文章】

    http://www.cnblogs.com/codex/p/4668396.html

    需要做一些会议记录。总共有多少呢?五个地点x7个月份x每月4篇=140篇。虽然不很重要,但是140篇记录完全雷同也不好。大体看了一下,此类的记录大致分为四段。于是决定每段提供四种选项,每段从四选项里随机选一项,拼凑成四段文字,存成一个文件。而且要打印出来,所以准备生成一个140页的Word文档,每页一篇。

      需要用到win32com模块(下载链接:http://sourceforge.net/projects/pywin32/files/),

    通过COM让Python与Word建立连接。代码如下:

    复制代码
    # -*- coding: cp936 -*-
    
    #导入随机数模块
    import random
    
    #导入win32com模块,用来操作Word
    import win32com 
    from win32com.client import Dispatch, constants
    
    #创建新的WORD文档
    w = win32com.client.Dispatch('Word.Application')
    w.Visible = 0#0表示在后台操作。设为1则在前端能看到Word界面。
    w.DisplayAlerts = 0#不显示警告
    doc = w.Documents.Add()
    
    #准备对文档头部进行操作
    myRange = doc.Range(0,0)#从第0行第0个字开始:
    myRange.Style.Font.Name = "宋体"#设置字体
    myRange.Style.Font.Size = "16"#设置为三号
    
    #========以下为文章的内容部分=======
    
    #文章标题(用
    来控制文字的换行操作)
    title='XXXXX会
    会议时间: '
    
    #会议时间
    timelist=['1月9日','1月16日','1月23日','1月30日',
              '2月6日','2月13日','2月20日','2月27日',
              '3月6日','3月13日','3月20日','3月27日',
              '4月3日','4月10日','4月17日','4月24日',
              '5月8日','5月15日','5月22日','5月29日',
              '6月5日','6月12日','6月19日','6月26日',
              '7月3日','7月10日','7月17日','7月24日'
              ]
    
    #会议地点
    addrlist=['
    会议地点: 地点AXXX
    主持人: 张X
    ',
             '
    会议地点: 地点BXXXX主持人: 吴X
    ',
             '
    会议地点: 地点CXXXX
    主持人: 王X
    ',
             '
    会议地点: 地点DXXXX
    主持人: 冉X
    ',
             '
    会议地点: 地点EXXXX
    主持人: 李X
    ',
             ]
    #参加人员
    member='参加人员: XXX,XXX,XXX,XXX,XXX,XXX,XXX。
    会议内容:
     '
    
    #四段文字
    list1=['第一段(A型)
    ','第一段(B型)
    ','第一段(C型)
    ','第一段(D型)
    ']
    list2=['第二段(A型)
    ','第二段(B型)
    ','第二段(C型)
    ','第二段(D型)
    ']
    list3=['第三段(A型)
    ','第三段(B型)
    ','第三段(C型)
    ','第三段(D型)
    ']
    list4=['第四段(A型)
    ','第四段(B型)
    ','第四段(C型)
    ','第四段(D型)
    ']
    
    
    #开始循环操作,往Word里面写文字
    
        #先开始遍历地点(A,B,C,D,E四个地区)
    for addr in addrlist:
    
            #遍历28个日期
        for time in timelist:
    
            #随机生成四个数(范围0-3)
            aa=random.randint(0,3)
            bb=random.randint(0,3)
            cc=random.randint(0,3)
            dd=random.randint(0,3)
    
            #从文件开头依次插入标题、时间、地点、人物
            myRange.InsertAfter(title)
            myRange.InsertAfter(time)
            myRange.InsertAfter(addr)
            myRange.InsertAfter(str3)
    
            #在后面继续添加随机选取的四段文字
            myRange.InsertAfter(list1[aa])
            myRange.InsertAfter(list2[bb])
            myRange.InsertAfter(list3[cc])
            myRange.InsertAfter(list4[dd])
    
    #循环完毕,保存为 D:d.doc
    doc.SaveAs(r'D:d.doc')
    
    #退出操作
    doc.Close()
    w.Quit()
    复制代码

    最终结果如图:

    ================================================================

    ==============================================================

    写在最后:

      由于写的比较仓促,所以有些细节问题没能解决,花了20分钟手动调整了一下。觉得有些屈辱。问题如下:

    1.正文是三号字体,所以在range处的字号设置了“16”。想让题目是二号字体、居中显示。

    2.如何在第四段写完之后,自动插入一个分页符?这样每篇文章打印出来的都有独立的页,不至于出现“第2篇文章的标题紧跟在第1篇文章的屁股后面、打印在了同一张纸上”的情况。

    How to ? 求解!

  • 相关阅读:
    scipy.spatial.distance.cdist
    关于hstack和Svstack
    numpy.hstack(tup)
    numpy.random.uniform(记住文档网址)
    Python集合(set)类型的操作
    python+Eclipse+pydev环境搭建
    python数据挖掘领域工具包
    LVS 命令使用
    CMD mysql 备份脚本
    Windos Server Tomcat 双开配置
  • 原文地址:https://www.cnblogs.com/Jacklovely/p/5743817.html
Copyright © 2011-2022 走看看