zoukankan      html  css  js  c++  java
  • php word转pdf 读取pdf内容

    1.word转pdf 需要用到 LibreOffice 便携版  如果是linux可以去官网查看安装命令

      下载地址:https://zh-cn.libreoffice.org/download/portable-versions/

    $retval = 1;
    // exec() might be disabled url需要填写相对地址
    $cmd = "D:LibreOfficePortable/LibreOfficeWriterPortable.exe  --headless --convert-to pdf D:phpstudy_proWWWReadWordupload\$name.docx --outdir  D:phpstudy_proWWWReadWordupload\";
    if (function_exists('exec')){
        @exec($cmd, $output, $retval);
    }
    // Did it work?
    if ($retval > 0){
        exit('process_failed');
    }else{
        sleep(5);
        header('location:./phpword.php?name='.$name);
    }

    2.pdf 读取

      1.需要安装composer

      2.在项目下面 composer require smalot/pdfparser  安装扩展 安装成功你会看到 vendor文件夹

      

    include 'vendor/autoload.php';
    
    $parser = new SmalotPdfParserParser();
    $pdf = $parser->parseFile("./upload/$name.pdf");
    $text = $pdf->getText();
    
    //读取出来的内容是字符串
    // Retrieve all pages from the pdf file.
    $pages  = $pdf->getPages();
     
    // Loop over each page to extract text.
    foreach ($pages as $page) {
        echo $text = $page->getText();
        // $text = explode("
    ",$text);
        // echo '<pre>';
        // print_r($text);
        // foreach($text as $kk => $vv){
        //   echo $vv.'<br>';
        // }
        
    }

      

  • 相关阅读:
    1月5日学习记录||1月8日学习
    1.1学习记录|1.2日学习记录|1.3日
    RNA-seq数据为什么要去噪
    12.16日学习记录
    12.15学习记录
    transformer和bert简要学习
    关系抽取学习
    12.14周六学习记录
    12.5日学习记录
    12.4周三学习记录
  • 原文地址:https://www.cnblogs.com/LF-place/p/13569412.html
Copyright © 2011-2022 走看看