zoukankan      html  css  js  c++  java
  • C#仪器数据文件解析-PDF文件

    不少仪器工作站输出的数据报告文件为PDF格式,PDF格式用于排版打印,但不易于数据解析,因此解析PDF数据需要首先读取到PDF文件中的文本内容,然后根据内容规则解析有意义的数据信息。

    C#解析PDF文件常用的库有PDFBox和iTextSharp,PDFBox为Java库,通过IKVM使用,因此调用方法、属性等比较变扭。

    PDFBox解析PDF文本示例:

     PDDocument doc = PDDocument.load(input);
     str = new PDFTextStripper().getText(doc);
     doc.close();
    

    iTextSharp解析PDF文本示例:

    PdfReader reader= new PdfReader(fileName);
      for (int pageNumber = 1; pageNumber <= reader.NumberOfPages; ++pageNumber)
                        stringBuilder.AppendLine(PdfTextExtractor.GetTextFromPage(reader, pageNumber));
    reader.Close();
  • 相关阅读:
    爬虫学习
    微软命令行安装第三方库
    Python复习(拾遗)3
    Python拾遗2
    Python复习(拾遗)
    python练习 自动绘图
    多分支结构
    turtle
    Python练习
    随便写点…
  • 原文地址:https://www.cnblogs.com/mahongbiao/p/7652788.html
Copyright © 2011-2022 走看看