zoukankan      html  css  js  c++  java
  • (java)Jsoup爬虫学习--获取智联招聘(老网站)的全国java职位信息,爬取10页

    Jsoup爬虫学习--获取智联招聘(老网站)的全国java职位信息,爬取10页,输出

    职位名称*****公司名称*****职位月薪*****工作地点*****发布日期

    import java.io.IOException;
    
    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    import org.jsoup.select.Elements;
    
    public class JsoupHtml {
        public static void main(String[] args) {        
            new JsoupHtml().getZhiLianWork();   
        }
        
        public void getZhiLianWork(){
            try {
                for (int i=0;i<10;i++) {
                        System.out.println("*********开始遍历第"+(i+1)+"页的求职信息*********");
                        Document doc = Jsoup.connect("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=-1&kw=java&p="+(i+1)+"&isadv=0").get();
                        Element content = doc.getElementById("newlist_list_content_table");            
                        Elements zwmcEls = content.getElementsByClass("zwmc");
                        Elements gsmcEls = content.getElementsByClass("gsmc");            
                        Elements zwyxEls = content.getElementsByClass("zwyx");            
                        Elements gzddEls = content.getElementsByClass("gzdd");            
                        Elements gxsjEls = content.getElementsByClass("gxsj");
                        for(int j = 0;j<zwmcEls .size();j++){
                            
                            System.out.println(
                                    zwmcEls.get(j).tagName("a").text()+"*****"+gsmcEls.get(j).tagName("a").text()+
                                    "*****"+zwyxEls.get(j).tagName("a").text()+"*****"+gzddEls.get(j).tagName("a").text()+
                                    "*****"+gxsjEls.get(j).tagName("a").text());
                            System.out.println();
                    }
                        System.out.println("*********结束遍历第"+(i+1)+"页的求职信息*********");
                
                }
                
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
        }
    }

    输出结果示例:

    产品经理??*****微贷(杭州)金融信息服务有限公司*****4500-8000*****杭州-滨江区*****置顶

    软件工程师??*****重庆建工信息技术有限公司*****5000-7000*****重庆*****置顶

    php高级研发工程师??*****西安联合创想电子商务有限公司*****15000-30000*****西安*****置顶

  • 相关阅读:
    排列组合之全排列
    Shell脚本学习指南 [ 第一、二章 ] 背景知识、入门
    Scala基础知识[一]
    Hadoop JVM调整解决 MapReduce 作业超时问题
    PL_SQL学习
    Oracle实用操作
    Fernflower 反编译.class文件
    Java命名规范
    Oracle学习笔记1
    JDBC连接MySQL与Oracle
  • 原文地址:https://www.cnblogs.com/xiao02fang/p/9382590.html
Copyright © 2011-2022 走看看