zoukankan      html  css  js  c++  java
  • php html模板对比相似度(百分比)

    两个源文件11.html和test.html 基本是一样的,现在需要匹配相似度的百分比,并且引入Simple_html_dom.php文件进行去标签处理,代码如下:

    <?php

    include 'Simple_html_dom.php';
    $str = file_get_contents("11.html");
    $html = file_get_contents("test.html");
    //第一个模板
    $dom = str_get_html($html);
    //第二个模板
    $dom2 = str_get_html($str);

    //去标签之后对比
    similar_text($dom->plaintext,$dom2->plaintext,$c);

    //不去标签对比
    similar_text($html,$str,$d);
    echo $c;
    echo '<br/>';
    echo $d;

    执行结果如下:

    事实上没有去标签的时候,相似度反而更高,经过去标签处理,只留文字相似度反而低了,不过项目要求去标签而已。

  • 相关阅读:
    2020软件工程作业02
    自我介绍
    Requests的使用
    爬虫基本原理
    2019春总结作业
    十二周作业
    十一周作业
    第十周作业
    intellij idea 的全局搜索快捷键方法
    Oracle多表关联
  • 原文地址:https://www.cnblogs.com/ayanboke/p/10075197.html
Copyright © 2011-2022 走看看