zoukankan      html  css  js  c++  java
  • 利用php抓取蜘蛛爬虫痕迹的示例代码

    // 获取蜘蛛爬虫名或防采集
    function isSpider(){
        $bots = array(
            'Google'    => 'googlebot',
            'Baidu'     => 'baiduspider',
            'Yahoo'     => 'yahoo slurp',
            'Soso'      => 'sosospider',
            'Msn'       => 'msnbot',
            'Altavista' => 'scooter ',
            'Sogou'     => 'sogou spider',
            'Yodao'     => 'yodaobot'
        );
        $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']);
        foreach ($bots as $k => $v) {
            if (strstr($v, $userAgent)) {
                return $k;
                break;
            }
        }
        return false;
    }
    
    // 获取哪种蜘蛛爬虫后保存蜘蛛痕迹。
    // 根据采集时HTTP_USER_AGENT是否为空来防止采集
    // 抓蜘蛛爬虫
    $spi  = isSpider();
    if ($spi) {
        $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
        $file = 'robot.txt';
        $time = date('Y-m-d H:i:s',mktime());
        $handle = fopen($file,'a+');
        $PR = $_SERVER['REQUEST_URI'];
        fwrite($handle, "Time:{$time} ROBOT:{$spi} AGENT:{$tlc_thispage} URL:{$PR} 
    
    ");
        fclose($handle);
    }
  • 相关阅读:
    (九)分类展示上
    (八)用户退出
    (七)用户登陆
    opencord视频截图
    (六)电子邮件
    (五)密码加密
    (四)用户注册
    (三)首页处理
    this关键字在继承中的使用
    03.swoole学习笔记--web服务器
  • 原文地址:https://www.cnblogs.com/chenjiacheng/p/6628354.html
Copyright © 2011-2022 走看看