zoukankan      html  css  js  c++  java
  • 免费zencart网站图片采集器下载版本1.0

    这个zencart图片采集器是我在业余时间写的,测试网站是 http://www.fashioneasylife.com/,目前采集器已经成功了目标网站列表页的图片,产品页的图片也是可以采集的,只是我是在 测试的时候,一直没换代理,频繁地做测试,被目标网站发现后,把我的ip给封了,所以产品页的采集应该还会有些地方要小改一下。等有时间,发布 zencart采集器的2.0版本就会彻底的做一次修改。

    先上代码包的下载链接地址:

    下载地址>>

    文件说明:共四个文件

    1.multi.php,这个是公共函数文件,里面有四个函数,都有非常详细的注解,这个文件不需要做改动。

    multi_get_url(),这个是用来多线程抓取页面的。

    crawurls(),抓取列表分页的urls。

    rexg(),正则匹配函数。

    valid(),这个是用来验证图片资源是否响应有效。

    2.retrive.php,这个是使用文件,需要根据目标url填入相应的参数。

    这个文件有几个重要的参数需要说明一下:

    $mission , 这个变量可以有两个字符串参数选择:"ls_contents_url" 采集产品内容页的内容, "ls_img"采集产品列表页的内容。

    $url, 填入你采集的目标网站域名:$url= "http://www.fashioneasylife.com/nike-air-jordan-mens-c-104.html"。

    $urls,在函数中填入你想要采集的页数:$urls = crawurls($url,$param,10);

    $domain,填入你的目标网站域名:$domain = "http://www.fashioneasylife.com/";

    $param ,网页的动态参数,比如有个网址的分页参数是 'page',你就可以写成:$param = 'page';

    3.ls.php,这个是用来放入列表页图片采集函数的,需要对正则部分做修改。

    getimgs(),这个函数用来获取指定URL的所有图片,需要根据网站修改的参数有$preg

    4.grab.php,这个是用来抓取zencart详细产品页面图片的,需要修改的参数仍是正则式

    geturls(),这个函数用来抓取列表页内容页面的url,也就是产品详细内容页面的url。

    get_product_content(),这个函数用来抓取单个内容页面的图片,(注意:这个函数可能有错误,需要在细节部分做些改动,敬请期待 2.0版本zencart采集器),需要修改$preg参数。

    写在最后的话:如果大家有什么好的建议,可以发邮件给我。错误地方还请不吝赐教。本采集器将会不断完善,有需要的读者朋友们可以回到电商沙龙首页,点击头部导航栏下面的按钮,订阅本站。

    原创文章,转载请注明: 转载自电商沙龙ec-shalom.com,专研电商艺术。

    本文链接地址: 免费zencart网站图片采集器下载-版本1.0

  • 相关阅读:
    eclipse里打包时排除.svn目录
    UltraEdit搭建python IDE环境+设置快捷键
    Window下 VC2008 Express 配置 OpenGL
    N73 getRGB createRGBImage 透明色的问题
    Iphone UIApplication openURL能帮助你运行Maps,SMS,Browser, Calling甚至其他的应用程序
    Eclipse配置KEmulator
    洛谷P1439 【模板】最长公共子序列 (DP,离散化)
    Codeforces Round #642 (Div. 3) D. Constructing the Array (优先队列)
    Codeforces #6241 div2 C. Orac and LCM (数学)
    洛谷P1469 找筷子 (位运算)
  • 原文地址:https://www.cnblogs.com/futan/p/3045857.html
Copyright © 2011-2022 走看看