zoukankan      html  css  js  c++  java
  • .net 后台读取pdf的值

    在网上找了内容

    下载了这个插件

    引用在了项目中

    然后找到pdf中的位置 进行读取

      string pdfPath = Server.MapPath("~/ViewPatPdf.pdf");
                    PDDocument doc = PDDocument.load(pdfPath);
                    PDFTextStripper stripper = new PDFTextStripper();
                    string txt = stripper.getText(doc);
                    Response.Write(txt);

    上面是第一种

     下面用itextsharp进行读取

    下载itextsharp.dll进行引用

    然后写方法

     public string ReadPdfFile(string fileName)
            {
                StringBuilder text = new StringBuilder();
                PdfReader pdfReader = new PdfReader(fileName);
                for (int page = 1; page <= pdfReader.NumberOfPages; page++)
                {
                    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                    string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                    text.Append(currentText);
                }
                pdfReader.Close();
                return text.ToString();
            }

    filename也是pdf的路径

    然后就可以读取出来了

    这个读取pdf上面的内容,纯粹的把pdf上面的内容进行读取

  • 相关阅读:
    pageX,clientX,screenX,offsetX的区别
    不同的浏览器内核了解学习
    小游戏模仿
    浏览器兼容性
    hack是什么
    DOM对象
    Browser对象
    html状态码与缓存学习
    javascript对象(2)
    javascript对象(1)
  • 原文地址:https://www.cnblogs.com/jiangyou-lz/p/5688963.html
Copyright © 2011-2022 走看看