zoukankan      html  css  js  c++  java
  • 爬虫配置文件

    <?xml version="1.0" encoding="utf-8"?>
    <template>
        <id>××××.com</id>
        <!--行政区域-->
        <page threads="false" dynamic="false" desc="index" setcookie="false" pattern="^http://www.×××××.com/search/category/d+/d+(/)?(rd+)?(pd+)?$">
            <enqueue>
                <xpath>//ul[@data-key='region']/li/a/@href</xpath>
                <xpath>//ul[@class='detail']/li[1]/a[1]/@href</xpath>
                <xpath>//div[@class='Pages']/a/@href</xpath>
            </enqueue>
        </page>
        <!--商品页-->
        <page threads="false" dynamic="false" desc="non-index" setcookie="false" pattern="^http://www.*****.com/shop/d+(?KID=d+)?$">
            <check>
                <!--这个是无用的-->
                <xpath>//*[@id="pt1:pgl4"]</xpath>
                <pattern>d+.00</pattern>
            </check>
        </page>
    </template>
  • 相关阅读:
    学姐学长们的测试
    loli的测试——搜索
    搜索-2
    单调队列
    乱搞题 (不知道怎么分类)
    对拍及数据生成
    搜索-1
    矩形重叠
    拼写单词
    java笔记
  • 原文地址:https://www.cnblogs.com/i80386/p/3944329.html
Copyright © 2011-2022 走看看