Jsoup爬虫学习--获取智联招聘(老网站)的全国java职位信息,爬取10页,输出
职位名称*****公司名称*****职位月薪*****工作地点*****发布日期
import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class JsoupHtml { public static void main(String[] args) { new JsoupHtml().getZhiLianWork(); } public void getZhiLianWork(){ try { for (int i=0;i<10;i++) { System.out.println("*********开始遍历第"+(i+1)+"页的求职信息*********"); Document doc = Jsoup.connect("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=-1&kw=java&p="+(i+1)+"&isadv=0").get(); Element content = doc.getElementById("newlist_list_content_table"); Elements zwmcEls = content.getElementsByClass("zwmc"); Elements gsmcEls = content.getElementsByClass("gsmc"); Elements zwyxEls = content.getElementsByClass("zwyx"); Elements gzddEls = content.getElementsByClass("gzdd"); Elements gxsjEls = content.getElementsByClass("gxsj"); for(int j = 0;j<zwmcEls .size();j++){ System.out.println( zwmcEls.get(j).tagName("a").text()+"*****"+gsmcEls.get(j).tagName("a").text()+ "*****"+zwyxEls.get(j).tagName("a").text()+"*****"+gzddEls.get(j).tagName("a").text()+ "*****"+gxsjEls.get(j).tagName("a").text()); System.out.println(); } System.out.println("*********结束遍历第"+(i+1)+"页的求职信息*********"); } } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
输出结果示例:
产品经理??*****微贷(杭州)金融信息服务有限公司*****4500-8000*****杭州-滨江区*****置顶
软件工程师??*****重庆建工信息技术有限公司*****5000-7000*****重庆*****置顶
php高级研发工程师??*****西安联合创想电子商务有限公司*****15000-30000*****西安*****置顶