解决火车头7.6版本无法采集部分https网站处理方法 - 走看看

zoukankan html css js c++ java

解决火车头7.6版本无法采集部分https网站处理方法

因为现在大多数网站都采取https，导致很多网站无法采集。那哪行，肯定得有解决办法，今日就说说关于火车头采集器7.6版本无法采集部分https网站处理方法。

火车头7.6版本由于发布时间久远，虽然采集器大部分功能都还可以正常使用，但是现在很多网站都从之前的http协议切换到了https协议。

现在怎么解决呢？办法就是通过php进行抓取数据，把文章标签都获取

只要网站目录新建一个接口，例如geturl/index.php

代码附下载，你们下载，放在网站根目录建个文件夹，例如：geturl，调用如下：

在接口后面/geturl/index.php?https://www.wood888.net/xinwens/qiyexingxiang-2.html

例如获取数据：/geturl/index.php?https://www.wood888.net/xinwens/qiyexingxiang-2.html

获取内容页面就是通过火车头手动提取设置，把链接加入接口提取出来

这样就能获取文章了

好了，这样就完美解决了

插件下载地址：http://www.68xi.com/591.html

千行代码，Bug何处藏。纵使上线又怎样，朝令改，夕断肠。

查看全文

相关阅读:
DevOps平台中的自动化部署
 GitLab的安装及使用教程
 Nginx配置相关
 Shell常用模块
 PostgreSQL基础
 大数据集群监控工具
 大数据常用组件
 kafka知识
 数据结构可视化（包括红黑树动态演示）
python 周考1

原文地址：https://www.cnblogs.com/68xi/p/14830113.html

Copyright © 2011-2022 走看看