zoukankan      html  css  js  c++  java
  • C#调用WORD处理的小项目 转

       http://www.cnblogs.com/happygrass/archive/2009/02/13/1388224.html

     最近一个朋友让我帮他做一个小功能,其实就是把WORD文档里的内容存到数据库里去,可以实现搜索并转EXCEL的功能,需求很简单,想不到加上部署折腾了我一个星期,我先把需求详细描述一下:

          提供一个WORD文档的样板,这个WORD文档里大部分是文本,其中插入了一个EXCEL表格,WORD的内容如下:

         

    房地产价值监证确认书

     

                         编号:(2009交)价确字第   号

     邓征兵  

    根据您的委托,我单位派遣专业评估人员对位于  大祥区翠园    的房地产(《房屋所有权证》)号为 0013210 ,房屋所有权人  邓文兵   房屋所在层次/总层数  6 / 8 ,进行了现场勘估。

    评定估价对象房屋的结构等级为    砖混     ,建成年代为 90年代末  ,成新度为   9成   

    确认房屋价值如下表:

    这里有个EXCEL表格

    监证目的:交易课税

     

    备注:                                                   

                                                           

    邵阳市房产产权监理处价格管理科

    现场评估:黄生忠

    审    批:

                                    2009 年 2 月 10 日

    就是把这个文件中相关内容存入数据库,同时要能够实现查询,比如根据委托人查询,同时要把查询的结果能转EXCEL。

    功能就是这样的,先把其中用到的技术点挑出来,

    一读WORD里的内容,这个并不难;

     


    Microsoft.Office.Interop.Word.ApplicationClass wordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
                
    object file = nam;
                
    object nullobj = System.Reflection.Missing.Value;
                
    try
                {
                    Microsoft.Office.Interop.Word.Document doc 
    = wordApp.Documents.Open(
                    
    ref file, ref nullobj, ref nullobj,
                    
    ref nullobj, ref nullobj, ref nullobj,
                    
    ref nullobj, ref nullobj, ref nullobj,
                    
    ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj);

                    
    //doc.ActiveWindow.Selection.WholeStory();
                    
                    
    //doc.ActiveWindow.Selection.Copy();

                    
    //IDataObject data = Clipboard.GetDataObject();
                    
                    fileContent 
    = doc.Content.Text;   //这里读取所有的WORD里的文本             
    }

     

    二读WORD文件里EXCEL里的数据,这个是比较困难的,我试了很多方式,也没有查到相关的资料,最后在国外论坛上看见了VB的代码,然后修改了一下,可以用;

     


    foreach (Microsoft.Office.Interop.Word.InlineShape ish in doc.InlineShapes)
                    {
                        
    if (ish.Type == Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapeEmbeddedOLEObject)
                        {
                            
    if (ish.OLEFormat.ProgID == "Excel.Sheet.8")
                            {
                                
    //ish.OLEFormat.DoVerb(ref nullobj);

                                ish.OLEFormat.Activate();
                                Microsoft.Office.Interop.Excel.Workbook objEXl 
    = (Microsoft.Office.Interop.Excel.Workbook)ish.OLEFormat.Object;
                                buildArea 
    = ((objEXl.Worksheets[1as Microsoft.Office.Interop.Excel.Worksheet).Cells[22as Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                
    if (buildArea != "")
                                {
                                    buildUnitPrice 
    = ((objEXl.Worksheets[1as Microsoft.Office.Interop.Excel.Worksheet).Cells[23as Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                    buildCountPrice 
    = ((objEXl.Worksheets[1as Microsoft.Office.Interop.Excel.Worksheet).Cells[24as Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                    userKind 
    = "住宅";
                                }
                                
    else
                                {
                                    buildArea 
    = ((objEXl.Worksheets[1as Microsoft.Office.Interop.Excel.Worksheet).Cells[32as Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                    buildUnitPrice 
    = ((objEXl.Worksheets[1as Microsoft.Office.Interop.Excel.Worksheet).Cells[33as Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                    buildCountPrice 
    = ((objEXl.Worksheets[1as Microsoft.Office.Interop.Excel.Worksheet).Cells[34as Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                    userKind 
    = "非住宅";
                                }                            
                                objEXl.Application.Quit();                            
                            }
                        }
                    }

     

    三正则表达式的应用,我要获取比如邓征兵这个委托人,我不可能用SUBSTRING来取数据吧,这样效果太低了;

     


    Regex reg1 = new Regex("[\u4E00-\u9FFF]+", RegexOptions.IgnoreCase);
                    userName 
    = reg1.Match(doc.Paragraphs[4].Range.Text).Value.Trim();//委托人
                    Regex reg2 = new Regex("评估人员对位于([\\S|\\s]+)的房地产", RegexOptions.IgnoreCase);
                    HouseAddr 
    = reg2.Match(fileContent).Groups[1].Value.Trim();//房子地址doc.Paragraphs[5].Range.Text
                    Regex reg3 = new Regex("号为([\\S|\\s]+),房屋所有权人", RegexOptions.IgnoreCase);
                    propertyNo 
    = reg3.Match(fileContent).Groups[1].Value.Trim();//房产证号doc.Paragraphs[5].Range.Text
                    Regex reg4 = new Regex("房屋所有权人([\\S|\\s]+)房屋所在层次", RegexOptions.IgnoreCase);
                    propertyUser 
    = reg4.Match(fileContent).Groups[1].Value.Trim();//房屋所有权人doc.Paragraphs[5].Range.Text
                    Regex reg5 = new Regex("层次/总层数([\\S|\\s]+),进行了现场勘估", RegexOptions.IgnoreCase);
                    buildCount 
    = reg5.Match(fileContent).Groups[1].Value.Trim();//层次/总层数doc.Paragraphs[5].Range.Text
                    Regex reg6 = new Regex("建成年代为([\\S|\\s]+),成新度为", RegexOptions.IgnoreCase);
                    buildYear 
    = reg6.Match(fileContent).Groups[1].Value.Trim();//建成年代doc.Paragraphs[6].Range.Text
                    Regex reg7 = new Regex("现场评估:([\\S|\\s]+)审", RegexOptions.IgnoreCase);
                    evaluateUser 
    = reg7.Match(fileContent).Groups[1].Value.Trim();//现场评估doc.Paragraphs[13].Range.Text
                    Regex reg8 = new Regex("[\\d|\\s]+年[\\d|\\s]+月[\\d|\\s]+日", RegexOptions.IgnoreCase);
                    evaluateDate 
    = reg8.Match(fileContent).Value.Trim();//doc.Paragraphs[15].Range.Text.Trim()时间

    四转EXCEL,网上很多人都是用datagrid直接转EXCEL,这样只能倒出第一页的数据,不适合我的程序;

     


    DataTable dt = GetAllData();
            StringWriter sw 
    = new StringWriter();
            sw.WriteLine(
    "序号\t委托方\t产权人\t产权证号\t房屋座落\t建筑面积(平方米)\t建成年代\t层次/层数\t使用性质\t评估单价(元/平方米)\t评估总价值(元)\t现场评估人员\t评估日期\t备注");

            
    if (dt != null)
            {
                
    foreach (DataRow dr in dt.Rows)
                {
                    sw.WriteLine(dr[
    "id"+ "\t" + dr["userName"+ "\t" + dr["propertyUser"+ "\t" + dr["propertyNo"+ "\t" +
                        dr[
    "HouseAddr"+ "\t" + dr["buildArea"+ "\t" + dr["buildYear"+ "\t" + dr["buildCount"+ "\t" +
                        dr[
    "userKind"+ "\t" + dr["buildUnitPrice"+ "\t" + dr["buildCountPrice"+ "\t" + dr["evaluateUser"]
                        
    + "\t" + dr["evaluateDate"+ "\t" + "");
                }
            }
            sw.Close();
            Response.AddHeader(
    "content-disposition""attachment; filename=MyExcelFile.xls");
            Response.ContentType 
    = "application/excel";
            Response.ContentEncoding 
    = System.Text.Encoding.GetEncoding("GB2312");
            Response.Write(sw);
            Response.End();

    五,KILL进程,我在查看WORD里EXCEL里的数据的时候,无法关闭EXCEL,需要用程序来关闭;

     


    public void KillProcess(string processName)
        {
            System.Diagnostics.Process myproc 
    = new System.Diagnostics.Process();
            
    //得到所有打开的进程  
            try
            {
                
    foreach (Process thisproc in Process.GetProcessesByName(processName))
                {
                    
    if (!thisproc.CloseMainWindow())
                    {
                        
    if (thisproc != null)
                            thisproc.Kill();
                    }
                }
            }
            
    catch (Exception Exc)
            {
                
    throw Exc;
                
    // msg.Text+=  "杀死"  +  processName  +  "失败!";  
            }
        }  
  • 相关阅读:
    3星|《全球电商进化史》:全球电商亲历记
    2星|陈春花《共生》:逻辑差语文差缺证据。不敢相信知名商学院教授的书居然这么差
    3星|《第五次开始》:考古学家写的人类简史与未来简史
    4星|《财经》2018年第21期:互联网处方能解决药品质量和价格问题
    2.5星|托夫勒《权力的转移》;30年旧书,现在看理论有点牵强肤浅,预测有的准有的不准
    2018左其盛好书榜(截至9月15日)
    沟通交流技巧相关的11本书点评
    没睡好觉的上级更容易辱骂下属:3.5星|《哈佛商业评论》第9期
    3星|《利润模式》:20年旧书,30种模式
    在 C# 中通过 P/Invoke 调用Win32 DLL
  • 原文地址:https://www.cnblogs.com/bestsaler/p/1835789.html
Copyright © 2011-2022 走看看