zoukankan      html  css  js  c++  java
  • httpclient 人人网

    登录的站点是3g.renren.com 因为是手机人人, 页面比较简单

    首先用HttpGet取出"http://3g.renren.com"的html代码, 是用Jsoup解析出登录表单, 包括验证码的图片的url

    因为没法做到绕过验证码,所以用验证码的url构建一个image, 显示出来让用户自己填写

    构建image时一定要用httpget, 开始使用了ImageIO.read(new URL(url)); 这样, HttpClient实例中没有管理session

    不写了, 全放到注释里去了, 直接上代码

    因为程序很依赖html源码, 哪天人人的前台改动了html代码说不定就用不了了

    [java] view plaincopy
     
    1. package com.renren.main;  
    2.   
    3. import java.awt.Graphics;  
    4. import java.awt.Image;  
    5. import java.awt.event.ActionEvent;  
    6. import java.awt.event.ActionListener;  
    7. import java.awt.image.BufferedImage;  
    8. import java.io.IOException;  
    9. import java.io.InputStream;  
    10. import java.util.ArrayList;  
    11. import java.util.HashMap;  
    12. import java.util.List;  
    13. import java.util.Map;  
    14.   
    15. import javax.imageio.ImageIO;  
    16. import javax.swing.JButton;  
    17. import javax.swing.JFrame;  
    18. import javax.swing.JPanel;  
    19. import javax.swing.JPasswordField;  
    20. import javax.swing.JTextArea;  
    21. import javax.swing.JTextField;  
    22.   
    23. import org.apache.http.HttpEntity;  
    24. import org.apache.http.HttpResponse;  
    25. import org.apache.http.HttpStatus;  
    26. import org.apache.http.NameValuePair;  
    27. import org.apache.http.client.ClientProtocolException;  
    28. import org.apache.http.client.HttpClient;  
    29. import org.apache.http.client.ResponseHandler;  
    30. import org.apache.http.client.entity.UrlEncodedFormEntity;  
    31. import org.apache.http.client.methods.HttpGet;  
    32. import org.apache.http.client.methods.HttpPost;  
    33. import org.apache.http.impl.client.BasicResponseHandler;  
    34. import org.apache.http.impl.client.DefaultHttpClient;  
    35. import org.apache.http.message.BasicNameValuePair;  
    36. import org.apache.http.protocol.HTTP;  
    37. import org.jsoup.Jsoup;  
    38. import org.jsoup.nodes.Document;  
    39. import org.jsoup.nodes.Element;  
    40. import org.jsoup.select.Elements;  
    41.   
    42. public class Login extends JFrame implements ActionListener{  
    43.     private JTextField email;  
    44.     private JPasswordField password;  
    45.     private JTextField verifycode;  
    46.     private JButton login;  
    47.     private ImageBoxPanel imageBox;  
    48.     private Image image;  
    49.     private MsgBox box;  
    50.       
    51.     private final HttpClient client;  
    52.     private HttpPost post;  
    53.     private HttpGet get;  
    54.     private HttpResponse response;  
    55.     private ResponseHandler<String> responseHandler;  
    56.       
    57.     private Map<String, String> form_map;  
    58.     private boolean flag;//有没有验证码  
    59.     private String html;  
    60.       
    61.     public Login() {  
    62.         super("人人登录");  
    63.         client = new DefaultHttpClient();  
    64.         responseHandler = new BasicResponseHandler();  
    65.         form_map = new HashMap<String, String>();  
    66.         Object obj;  
    67.         setLayout(null);  
    68.         setDefaultCloseOperation(EXIT_ON_CLOSE);  
    69.         setResizable(false);  
    70.         email = new JTextField("<email>");  
    71.         password = new JPasswordField("<password>");  
    72.         verifycode = new JTextField();  
    73.         login = new JButton("登录");  
    74.         login.addActionListener(this);  
    75.         html = view("http://3g.renren.com");  
    76.           
    77.         init();  
    78.           
    79.         try {  
    80.             imageBox = new ImageBoxPanel(createBufferedImage());  
    81.         } catch (Exception e) {  
    82.             e.printStackTrace();  
    83.             imageBox = new ImageBoxPanel();  
    84.         }  
    85.         //layout  
    86.         this.setBounds(500, 300, 280, 220);  
    87.         email.setBounds(10, 10, 250, 30);  
    88.         password.setBounds(10, 50, 250, 30);  
    89.         verifycode.setBounds(10, 90, 150, 30);  
    90.         imageBox.setBounds(205, 80, 54, 46);  
    91.         login.setBounds(10, 130, 250, 30);  
    92.           
    93.         add(email);  
    94.         add(password);  
    95.         add(verifycode);  
    96.         add(imageBox);  
    97.         add(login);  
    98.         setVisible(true);  
    99.     }  
    100.   
    101.     private BufferedImage createBufferedImage() {  
    102.         InputStream inputstream=null;  
    103.         try {  
    104.             String source = view("http://3g.renren.com");  
    105.             String url = getVerifycodeUrl(source);  
    106.             if("error".equals(url)) {  
    107.                 return null;  
    108.             }  
    109.             ///rndimg?post=_REQUESTFRIEND_de6073b242a6fc34b67d228abf982916&rnd=1335096399071  
    110.             //分析登录表单可以发现如果某次登录需要验证码, 则表单中会有verifykey和verifycode  
    111.             //而verifykey 的值正好是验证码地址中的一部分(中间的32位字符), 所以把verifykey取出来  
    112.             String key = url;  
    113.             key = key.replaceAll("http[\d\D]*ND_", "");  
    114.             key = key.replaceAll("&[\d\D]*", "");  
    115.             form_map.put("verifykey", key);//更新下verifykey,和当前验证码对应  
    116.             System.out.println(key);  
    117.               
    118.             get = new HttpGet(url);  
    119.             response = client.execute(get);  
    120.             if(HttpStatus.SC_OK == response.getStatusLine().getStatusCode()) {//以下两个if是网上摘来得  
    121.                 HttpEntity entity = response.getEntity();  
    122.                 if (entity != null) {  
    123.                     inputstream = entity.getContent();  
    124.                     //本来返回的是一个InputStream, 但是在finally中调用get.abort()后好像会变成null, 没办法, 所以直接构造出BufferedImage返回  
    125.                     return ImageIO.read(inputstream);  
    126.                 }  
    127.             }  
    128.         } catch (Exception e) {  
    129.             e.printStackTrace();  
    130.         } finally {  
    131.             get.abort();              
    132.         }  
    133.         return null;  
    134.     }  
    135.   
    136.     /** 
    137.      * 获取某个url的html代码 
    138.      * @param url 
    139.      * @return 
    140.      */  
    141.     private String view(String url) {  
    142.         String html;  
    143.         try {  
    144.             get = new HttpGet("http://3g.renren.com/");  
    145.             html = client.execute(get, responseHandler);  
    146.         } catch (Exception e) {  
    147.             e.printStackTrace();  
    148.             html = "error";  
    149.         } finally {  
    150.             get.abort();  
    151.         }  
    152.         return html;  
    153.     }  
    154.       
    155.     /** 
    156.      * 获取验证码图片的地址 
    157.      * @param source 某个页面的页面源代码 
    158.      * @return  
    159.      */  
    160.     private String getVerifycodeUrl(String source) {  
    161.         String url;  
    162.         flag = true;  
    163.         try {  
    164.             Document doc = Jsoup.parse(source);  
    165.             //分析表单可知此句可用, 不过用这种方法来做比较不好的一点就是一旦人人页面稍微改动下, 这个程序就可能用不了了  
    166.             Element e = doc.getElementsByAttributeValueContaining("alt", "此处为验证码").get(0);  
    167.             url = e.attr("src");  
    168.             url = "http://3g.renren.com" + url;  
    169.         } catch (Exception e) {  
    170.             //本来会打印异常信息, 不过看着不舒服, 就删了  
    171.             //大致就是有时没有验证码, 那么上面的get(0)肯定就行不通了  
    172.             System.out.println("没有验证码~");  
    173.             url = "error";  
    174.             flag = false;//标记有没有验证码, 可以让verifykey 和 verifycode 两个属性是否通过表单传过去  
    175.         }  
    176.         return url;  
    177.     }  
    178.       
    179.     private void init() {  
    180.         String html = view("http://3g.renren.com");  
    181.         Document doc = Jsoup.parse(html);//取出3g.renren.com代码  
    182.         Element form = doc.getElementsByTag("form").get(0);  
    183.         String action = form.attr("action");  
    184.         form_map.put("action", action);  
    185.         Elements es = form.getElementsByTag("input");  
    186.         for(Element e: es) {  
    187.             form_map.put(e.attr("name"), e.attr("value"));  
    188.         }  
    189.     }  
    190.   
    191.     @Override  
    192.     public void actionPerformed(ActionEvent e) {  
    193.         login();  
    194.         System.out.println(view("http://3g.renren.com"));  
    195.         //登录成功后显示发心情的界面, 主要实现了个功能, 没有考虑到其他的方面  
    196.         //包括是否登录成功啊, 是否发心情成功失败啊  
    197.         //不过这些还是挺简单的, 无非就是解析post后的html代码, 看会不会出现哪些错误信息  
    198.         box = new MsgBox();  
    199.     }  
    200.     private boolean login() {  
    201.         post = new HttpPost(form_map.get("action"));  
    202.         //据说有些网站如果不设置头会被过滤掉, 毕竟人人还是蛮大的一个网站, 就加上吧  
    203.         post.setHeader("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.3 (KHTML, like Gecko) Chrome/6.0.472.63 Safari/534.3");  
    204.         List<NameValuePair> nvp = new ArrayList<NameValuePair>();  
    205.         nvp.add(new BasicNameValuePair("origURL", form_map.get("origURL")));  
    206.         nvp.add(new BasicNameValuePair("lbskey", form_map.get("lbskey")));  
    207.         nvp.add(new BasicNameValuePair("c", form_map.get("c")));  
    208.         nvp.add(new BasicNameValuePair("ref", form_map.get("ref")));  
    209.         nvp.add(new BasicNameValuePair("email", email.getText()));  
    210.         nvp.add(new BasicNameValuePair("password", new String(password.getPassword())));  
    211.         nvp.add(new BasicNameValuePair("pq", form_map.get("pq")));  
    212.         if(flag) {  
    213.             nvp.add(new BasicNameValuePair("verifycode", verifycode.getText()));  
    214.             nvp.add(new BasicNameValuePair("verifykey", form_map.get("verifykey")));  
    215.         }  
    216.     //  System.out.println(form_map.get("verifykey"));  
    217.         try {    
    218.             post.setEntity(new UrlEncodedFormEntity(nvp, HTTP.UTF_8));    
    219.             //response = client.execute(post);  
    220.             client.execute(post);  
    221.         } catch (Exception e) {    
    222.             e.printStackTrace();    
    223.             return false;    
    224.         } finally {    
    225.             post.abort();    
    226.         }  
    227.         return true;    
    228.     }     
    229.       
    230.     public static void main(String[] args) {  
    231.         Login renren = new Login();  
    232.     //  System.out.println(renren.view("http://3g.renren.com"));  
    233.     }  
    234.       
    235.     class MsgBox extends JFrame implements ActionListener {  
    236.         JTextArea msg;  
    237.         JButton submit;  
    238.         //某条心情发送次数, 本来想搞个刷屏的, 不过不太给力, 设置了休眠一段时间还是可以成功的  
    239.         JTextField time;  
    240.           
    241.         public MsgBox() {  
    242.             setLayout(null);  
    243.             setResizable(false);  
    244.             setBounds(500, 500, 365, 125);  
    245.             msg = new JTextArea();  
    246.             submit = new JButton("发送~");  
    247.             time = new JTextField("1");  
    248.               
    249.             msg.setBounds(10, 10, 250, 80);  
    250.             time.setBounds(270, 10, 81, 40);  
    251.             submit.setBounds(270, 50, 80, 40);  
    252.               
    253.             submit.addActionListener(this);  
    254.               
    255.             add(msg);  
    256.             add(submit);  
    257.             add(time);  
    258.               
    259.             setVisible(true);  
    260.         }  
    261.           
    262.         @Override  
    263.         public void actionPerformed(ActionEvent e) {  
    264.               
    265.             for(int i = 0; i < Integer.parseInt(time.getText()); i++) {  
    266.                 post = new HttpPost("http://3g.renren.com/status/wUpdateStatus.do");//反正都是从先认为的登录, 再把一些信息抓下来  
    267.                 post.setHeader("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.3 (KHTML, like Gecko) Chrome/6.0.472.63 Safari/534.3");  
    268.                 List<NameValuePair> nvp = new ArrayList<NameValuePair>();  
    269.                 nvp.add(new BasicNameValuePair("_rtk", "xxxxxxxx"));//这个不知道是怎么产生的, 可能每一个id都有对应一个把  
    270.                 nvp.add(new BasicNameValuePair("sour", ""));  
    271.                 nvp.add(new BasicNameValuePair("loginbybm", ""));  
    272.                 nvp.add(new BasicNameValuePair("status", msg.getText() + i));//其他几个都无关紧要, 不过还是留着  
    273.                 nvp.add(new BasicNameValuePair("pid", ""));  
    274.                 nvp.add(new BasicNameValuePair("empty", "1"));  
    275.                 try {    
    276.                     post.setEntity(new UrlEncodedFormEntity(nvp, HTTP.UTF_8));  
    277.                     response = client.execute(post);  
    278.                     System.out.println(response);  
    279.                     Thread.sleep(1000L);//没有设置休眠应该是被人人过滤掉了,具体多少时间间隔可以发一次没有测试过, 不过估计500毫秒应该是没有问题的吧  
    280.                 } catch (Exception e1) {    
    281.                     e1.printStackTrace();    
    282.                 } finally {    
    283.                     post.abort();    
    284.                 }  
    285.             }  
    286.         }  
    287.     }  
    288. }  
    289.   
    290. class ImageBoxPanel extends JPanel {  
    291.     private Image image;  
    292.     public ImageBoxPanel(Image image) {  
    293.         this.image = image;  
    294.     }  
    295.     public ImageBoxPanel() {  
    296.     }  
    297.     @Override  
    298.     protected void paintComponent(Graphics g) {  
    299.         g.drawImage(image, 0, 0, 54, 46, null);  
    300.     }  
    301. }  
    302. 转载出处:http://blog.csdn.net/ping_qc/article/details/7487352
  • 相关阅读:
    Day 13 匿名函数 :内置函数: 闭包
    Day 12 生成器:生成器表达式:列表表达式:yield:yield from:内置函数
    最近这些天
    正则表达式 I
    Python 软件规范开发
    模块
    常用模块介绍 time datetime os sys hashlib json pickle collections
    模拟博客园登录 基础版
    SQL 必知必会
    Python中的线程和进程
  • 原文地址:https://www.cnblogs.com/Struts-pring/p/4302799.html
Copyright © 2011-2022 走看看