zoukankan      html  css  js  c++  java
  • [PHP自动化-进阶]002.CURL模拟登录带有验证码的网站

    引言:继前文《模拟登录并采集数据》,大家似乎看不过瘾,这会再出一发,模拟实现带验证码网站的登录。

    这篇文章主要介绍了PHP使用CURL实现对带有验证码的网站进行模拟登录的方法,可以帮助读者加深对CURL操作的理解与应用,需要的朋友可以参考下。

    网上的很多模拟登录程序,大都是通过服务程序Apache之类的运行,获取到验证码之后显示在网页上,然后填上再POST出去,这样虽然看起来很友好,但是既然模拟登录,登录后所干的事情就不一定是短时间完成的,所以这就要受到php最大执行时间的限制,而且有些操作还有可能权限不足。

    本文提供了一个程序实例,思路就是获取到验证码之后把验证码存储为一个图片,然后程序休眠20秒,在20秒之内由用户手动查看图片,并把验证码填写到code.txt文件中,20秒休眠完成后,程序会读code.txt的验证码,这样再带着验证码进行登录操作。

    简单,恶心,粗鲁,粗暴……。

    切入主题


    下面直接上高清代码,:)。

    ///////////////
    // 初始化变量
    ///////////////
    // Cookie文件名称
    $cookie_file = "tmp.cookie";
    // 验证码文件名称
    $vcode_file  = "code.txt";
    // 登录网址
    $login_url   = "http://xxx.com/logon.php";
    // 验证码网址
    $vcode_url   = "http://xxx.com/verifyCode.php";
    
    
    echo "===================================
    ";
    echo "正在获取COOKIE...                  
    ";
    echo "===================================
    ";
    // 初始化CURL对象
    $ch = curl_init();
    
    // 设置请求URL
    curl_setopt($ch, CURLOPT_URL, $login_url);
    // 设置不输出到浏览器(说明:直接返回字符串,否则直接输出)
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    // 设置连接超时时间(说明:5秒)
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
    // 设置Cookie保存文件(说明:把返回来的cookie信息保存在$cookie_file文件中)
    curl_setopt($ch,CURLOPT_COOKIEJAR, $cookie_file);
    
    // 执行请求
    $contents = curl_exec($ch);
    // 关闭连接
    curl_close($ch);
    
    
    
    echo "===================================
    ";
    echo "COOKIE获取完成,正在取验证码...    
    ";
    echo "===================================
    ";
    // 初始化CURL对象
    $ch = curl_init();
    
    // 设置请求URL
    curl_setopt($ch, CURLOPT_URL, $vcode_url);
    // 设置Cookie使用文件(说明:使用指定路径下的cookie文件,并跟随请求传递)
    curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
    // 设置返回响应头信息[无](说明:该设置通常是需要加上的,用于制作下一次请求的肥料。)
    curl_setopt($ch, CURLOPT_HEADER, 0);
    // 设置不输出到浏览器(说明:直接返回字符串,否则直接输出)
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    
    // 执行请求(说明:获得图片字符集)
    $img = curl_exec($ch);
    // 关闭连接
    curl_close($ch);
    
    
    
    echo "===================================
    ";
    echo "正在保存验证码图片...              
    ";
    echo "===================================
    ";
    $fp = fopen("verifyCode.jpg", "w");
    fwrite($fp, $img);
    fclose($fp);
    
    
    
    echo "===================================
    ";
    echo "验证码取出完成,正在休眠...        
    ";
    echo "20秒内请把验证码填入code.txt并保存.
    ";
    echo "===================================
    ";
    // 线程睡眠20秒
    sleep(20);
    
    
    
    echo "===================================
    ";
    echo "休眠完成,开始取验证码...          
    ";
    echo "===================================
    ";
    $code = file_get_contents(vcode_file);
    echo "验证码成功取出:$code
    ";
    
    
    
    echo "===================================
    ";
    echo "正在准备模拟登录...                
    ";
    echo "正在准备模拟登录...                
    ";
    echo "===================================
    ";
    // 初始化CURL对象
    $ch = curl_init();
    
    // 设置请求URL
    curl_setopt($ch, CURLOPT_URL, $url);
    // 设置返回响应头信息[无](说明:该设置通常是需要加上的,用于制作下一次请求的肥料。)
    curl_setopt($ch, CURLOPT_HEADER, false);
    // 设置不输出到浏览器(说明:直接返回字符串,否则直接输出)
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    // 设置请求携带数据
    curl_setopt($ch, CURLOPT_POSTFIELDS, "username=superdo&pwd=do.org.cn&verifycode=$code");
    // 设置Cookie使用文件(说明:使用指定路径下的cookie文件,并跟随请求传递)
    curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
    
    // 执行请求
    $result = curl_exec($ch);
    // 关闭连接
    curl_close($ch);
     
    // 这一块根据自己抓包获取到的网站上的数据来做判断
    if (substr_count($result, "登录成功")) {
        echo "登录成功
    ";
    } else {
        echo "登录失败
    ";
        exit;
    }
     
    // OK,开始做你想做的事吧。。。。。

    未完待续……。

     

    本站文章为 宝宝巴士 SD.Team 原创,转载务必在明显处注明:(作者官方网站: 宝宝巴士 
    转载自【宝宝巴士SuperDo团队】 原文链接: http://www.cnblogs.com/superdo/p/4791957.html

     

  • 相关阅读:
    win10 在当前目录下 打开cmd
    Python 出现 can't use a string pattern on a bytes-like object
    Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
    python urllib2模块
    安装pip最简单的方法
    Thread.run方法是同步方法
    curl命令总结
    自己构建的Lumbda表达式
    将github上的项目源码导入eclipse详细教程
    JButton点击事件
  • 原文地址:https://www.cnblogs.com/superdo/p/4791957.html
Copyright © 2011-2022 走看看