zoukankan      html  css  js  c++  java
  • 采集工具大比拼

    以下纯属个人感悟

    目前站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个

    1.火车头 使用人数上应该是最多的,主要集中在新站
    特色:功能多,速度快
    优点:功能比较齐全,采集速度比较快,主要针对cms,短时间可以采集很多,过滤,替换都不错,比较详细,很多人写接口,发布,接口比较齐全,适合不太懂程序的站长
    技术:技术主要是论坛支持,帮助文件多,上手容易。有收费,免费版本
    缺点:功能增多,越来越大,费内存,速度快,采集的质量有些降低,不稳定

    2.三人行 主要针对论坛,可以称的上是第一
    特色:针对各大论坛,搬家,移动,速度快,准确度高
    优点:还是针对论坛,适合开论坛的
    技术:收费技术,免费有广告
    缺点:对cms支持比较差

    3.ET工具
    特色:无人值守,稳定,几乎不占内存
    优点:无人值守,自动更新,适合长期做站,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,关键是软件免费,听说已经增加采集中英文翻译功能。
    技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易
    缺点:似乎帮助文件少才是这个软件的缺点

    4.海纳
    特色:海量,关键词抓取,可以预览采集内容,不用写规则
    优点:海量,可以抓取网站很多一个关键词文章,似乎适合做网站的专题
    技术:无论坛 收费,免费有功能限制
    缺点:分类不方便,也就说采集文章归类不方便,要手动(自动容易混淆),特定接口

    总结:追求功能齐全的,似乎应该选择火车头,火车头被称之为“无所不能”,初期作站,可以迅速采集很多的资源,充实网站内容。如果做论坛,那选择三人行,没错了,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,当然选择ET了,花点时间,弄懂,是个长期受益的事情。写好规则,设置好过滤替换,然后可以像开QQ一样,长期运行,不费内存,自动采集更新,分类明确,采集内容完整,可是说,一个站,一个站长+ET足够了。至于海纳,似乎不写规则,上手容易,但是对文章的发布上,不能如ET一劳永逸,反而觉得增加很多工作,但是可以做专题,这是网站专题一个不错的选择。

  • 相关阅读:
    zabbix 配置发送邮件报警
    sql server 修改表结构语法大全
    SQL Server日期与字符串之间的转换
    Convert.ToDateTime(值),方法可以把一个值转化成DateTime类型。
    Oracle trunc()函数的用法
    Oracle job procedure 存储过程定时任务
    向数据库中插入一个DateTime类型的数据到一个Date类型的字段中,需要转换类型。TO_DATE('{0}','YYYY-MM-DD'))
    逗号分隔的字符串转换为行数据(collection)(续)
    Oracle中INSTR、SUBSTR和NVL的用法
    oracle中substr() instr() 用法
  • 原文地址:https://www.cnblogs.com/wzg0319/p/1951392.html
Copyright © 2011-2022 走看看