zoukankan      html  css  js  c++  java
  • asp.net word内容读取到页面

    1、添加Microsoft.Vbe.Interop.dll引用。

    2、以下方法可以简单的读取到word文档文字内容,不包括图片、格式等。

    private string ReadWordFile(string file)
        {
            string filePath = Server.MapPath(file);
            if (System.IO.File.Exists(filePath))
            {
                Microsoft.Office.Interop.Word.ApplicationClass wordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
                object fileobj = filePath;
                object nullobj = System.Reflection.Missing.Value;
                //打开指定文件(不同版本的COM参数个数有差异,一般而言除第一个外都用nullobj就行了) 
                Microsoft.Office.Interop.Word.Document doc = wordApp.Documents.Open(ref fileobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj);
                //取得doc文件中的文本 
                string outText = doc.Content.Text;             //关闭文件 
                doc.Close(ref nullobj, ref nullobj, ref nullobj);             //关闭COM 
                wordApp.Quit(ref nullobj, ref nullobj, ref nullobj);             //返回 
                return outText;
            }
    
            return null;
        }

    3、把word文档正确展示出来,把word转换成html文档,然后读取出来。

    private void ChangeWordToHtml(string docFilePath, string htmlFilePath)
        {
            ApplicationClass word = new ApplicationClass();
            Type wordType = word.GetType();
            Documents docs = word.Documents;
    
            Type docsType = docs.GetType();
            object file = docFilePath;
            Document doc = (Document)docsType.InvokeMember("Open", BindingFlags.InvokeMethod, null, (object)docs, new Object[] { file, true, true });
            object nullobject = System.Reflection.Missing.Value;
    //判断与文件转换相关的文件是否存在,存在则删除。(这里,最好还判断一下存放文件的目录是否存在,不存在则创建) if (File.Exists(htmlFilePath)) { File.Delete(htmlFilePath); } //每一个html文件,有一个对应的存放html相关元素的文件夹(html文件名.files) if (Directory.Exists(htmlFilePath.Replace(".html", ".files"))) { Directory.Delete(htmlFilePath.Replace(".html", ".files"), true); } Type docType = doc.GetType(); object saveFileName = htmlFilePath; docType.InvokeMember("SaveAs", BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, WdSaveFormat.wdFormatHTML }); doc.Close(ref nullobj, ref nullobj,ref nullobj);

    // 退出 Word wordType.InvokeMember("Quit", BindingFlags.InvokeMethod, null, word, null); }
    private string LoadFileContent(string fileName)
        {
            if (fileName != "")
            {
                string path ="~/path/";
                string docFilePath = Server.MapPath(path + fileName);
                string htmlFilePath = Server.MapPath(path + fileName.Split('.')[0] + ".html");
                ChangeWordToHtml(docFilePath, htmlFilePath);
                if (File.Exists(htmlFilePath))
                {
             
         string content = File.ReadAllText(htmlFilePath, Encoding.Default); return content; } } return null; }
  • 相关阅读:
    在App_Data中创建数据库获取连接串简便方法!
    ObjectDataSource配合存储过程(采用数据集)的使用(删除可以解决,但是编辑出错好像它的方法也无法解决
    金鹰dreamweaver视频教程下载地址
    ASP.NET里创建Microsoft Word文档
    net3:Calendar控件的使用
    vs2005做的留言本——天轰川下载
    Wiley出版 SQL Server 2005宝典
    ADO:防止更新的数据含有单引号而出错
    用 Bitcron 搭博客:你只管写作,它负责呈现
    如何去掉Myeclipse对JS等文件的验证
  • 原文地址:https://www.cnblogs.com/flywing/p/4414008.html
Copyright © 2011-2022 走看看