zoukankan      html  css  js  c++  java
  • c# 提取word文件中的图片问题

    最近遇到一个项目就是要从一份word中提取出所有的图片信息,功能看起来不是很难,只要使用office自带的Microsoft.Office.Interop.Word就可以解决问题。网上也有不少的文章来说明如何去实现。不过总体来说网上的内容分为两派一个是使用剪贴板来实现,一个是通过将图片转为byte数组来完成。个人倾向于后者,但是在实践过程中遇到了问题。

    问题一:通过byte的方式来实现图片的提取会导致提取出来的图片的质量严重下降,这样的图片质量下降是无法通过修改图片质量的代码来优化和提高的。目前为止我还没有想到什么办法来很好的解决,只能是换方法来实现, 不过个人猜想是因为word中图片的dpi问题导致,因为原本很小的图片导出后就会变的很大(尺寸)。所以不得不使用剪贴板的方法来实现,但是用第一种方法也会有局限性。

    下面分别的贴出实现的代码

     第一种,通过byte的方式,关键语句为(byte[])shape.Range.EnhMetaFileBits;

    foreach(InlineShape shape in item.Range.InlineShapes)
    {
      if (shape.Type == WdInlineShapeType.wdInlineShapePicture)
      {
        //获取Word中的图片
        byte[] img = (byte[])shape.Range.EnhMetaFileBits;
        Bitmap bmp = new Bitmap(new MemoryStream(img));
      }
    }

     第二种,通过剪贴板,如下

    foreach (InlineShape shape in item.Range.InlineShapes)
    {
        //判断类型
        if (shape.Type == WdInlineShapeType.wdInlineShapePicture)
        {
            //利用剪贴板保存数据
            shape.Select(); //选定当前图片
            WordApp.Selection.Copy();//copy当前图片
            if (Clipboard.ContainsImage())
            {
                Bitmap bmp = new Bitmap(Clipboard.GetImage());
                fileName = System.Guid.NewGuid() + defaultPicExtension;
                bmp.Save(savePath + fileName, System.Drawing.Imaging.ImageFormat.Png);
            }
        }
    }

    问题二:通过控制台的方式编写程序可能会遇到剪贴板无法使用的事情,需要引用System.Window.Form来解决问题。 
     

    希望有经验的朋友可以帮忙解释一下第一种方法的问题所在,最后贴上实现的全部代码
     

    private void bt_readreport_Click(object sender, EventArgs e)
    {
        //初始化控件值
        ClearControl();
        StringBuilder reportContent = new StringBuilder();

        object Nothing = System.Reflection.Missing.Value;
        object filename = "文件完整路径和名称";
        Microsoft.Office.Interop.Word.Application WordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
        Microsoft.Office.Interop.Word.Document WordDoc = WordApp.Documents.Open(ref filename, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing);
        //循环文章中的各个章节
        foreach (Paragraph item in WordDoc.Paragraphs)
        {
            if (item != null)
            {
                if (item.Range.Text.Trim() != "")
                {
                    //判断该范围内是否存在图片
                    if (item.Range.InlineShapes.Count != 0)
                    {
                        foreach (InlineShape shape in item.Range.InlineShapes)
                        {
                            //判断类型
                            if (shape.Type == WdInlineShapeType.wdInlineShapePicture)
                            {
                                //利用剪贴板保存数据
                                shape.Select(); //选定当前图片
                                WordApp.Selection.Copy();//copy当前图片
                                string fileName = "";
                                if (Clipboard.ContainsImage())
                                {
                                    Bitmap bmp = new Bitmap(Clipboard.GetImage());
                                    fileName = System.Guid.NewGuid() + ".png";
                                    bmp.Save(savePath + fileName, System.Drawing.Imaging.ImageFormat.Png);
                                }
                            }
                        }
                    }
                    //在总目录中添加相应信息
                    reportContent.AppendLine(item.Range.Text.Trim());
                }
            }
        }
        WordDoc.Close(ref Nothing, ref Nothing, ref Nothing);
        WordApp.Quit(ref Nothing, ref Nothing, ref Nothing);

     对了,Png的效果要比JPG好,而且文件也不大,推荐使用

  • 相关阅读:
    PHP设计模式之适配器模式
    PHP设计模式之注册模式
    PHP中 构造函数(__construct)和析构函数(__destruct)
    PHP中 extends、implements、abstract、interface 的区别
    proxysql
    安装xtrabackup并进行全量备份
    锁解析
    索引与算法
    约束
    show语句
  • 原文地址:https://www.cnblogs.com/Alex80/p/5076027.html
Copyright © 2011-2022 走看看