zoukankan      html  css  js  c++  java
  • (java)Jsoup爬虫学习--获取智联招聘(老网站)的全国java职位信息,爬取10页

    Jsoup爬虫学习--获取智联招聘(老网站)的全国java职位信息,爬取10页,输出

    职位名称*****公司名称*****职位月薪*****工作地点*****发布日期

    import java.io.IOException;
    
    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    import org.jsoup.select.Elements;
    
    public class JsoupHtml {
        public static void main(String[] args) {        
            new JsoupHtml().getZhiLianWork();   
        }
        
        public void getZhiLianWork(){
            try {
                for (int i=0;i<10;i++) {
                        System.out.println("*********开始遍历第"+(i+1)+"页的求职信息*********");
                        Document doc = Jsoup.connect("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=-1&kw=java&p="+(i+1)+"&isadv=0").get();
                        Element content = doc.getElementById("newlist_list_content_table");            
                        Elements zwmcEls = content.getElementsByClass("zwmc");
                        Elements gsmcEls = content.getElementsByClass("gsmc");            
                        Elements zwyxEls = content.getElementsByClass("zwyx");            
                        Elements gzddEls = content.getElementsByClass("gzdd");            
                        Elements gxsjEls = content.getElementsByClass("gxsj");
                        for(int j = 0;j<zwmcEls .size();j++){
                            
                            System.out.println(
                                    zwmcEls.get(j).tagName("a").text()+"*****"+gsmcEls.get(j).tagName("a").text()+
                                    "*****"+zwyxEls.get(j).tagName("a").text()+"*****"+gzddEls.get(j).tagName("a").text()+
                                    "*****"+gxsjEls.get(j).tagName("a").text());
                            System.out.println();
                    }
                        System.out.println("*********结束遍历第"+(i+1)+"页的求职信息*********");
                
                }
                
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
        }
    }

    输出结果示例:

    产品经理??*****微贷(杭州)金融信息服务有限公司*****4500-8000*****杭州-滨江区*****置顶

    软件工程师??*****重庆建工信息技术有限公司*****5000-7000*****重庆*****置顶

    php高级研发工程师??*****西安联合创想电子商务有限公司*****15000-30000*****西安*****置顶

  • 相关阅读:
    形象的理解Strong和Weak
    iOS开发中常见的一些异常
    离屏渲染
    如何从海量IP中提取访问最多的10个IP
    XJOI3363 树3/Codeforces 682C Alyona and the Tree(dfs)
    XJOI 3578 排列交换/AtCoder beginner contest 097D equal (并查集)
    XJOI 3605 考完吃糖(DAG图dfs)
    POJ 3660 Cow Contest(传递闭包)
    XJOI 3601 技能(贪心+二分)
    51nod 1421 最大MOD值(高妙的调和级数复杂度)
  • 原文地址:https://www.cnblogs.com/xiao02fang/p/9382590.html
Copyright © 2011-2022 走看看