zoukankan      html  css  js  c++  java
  • 网上爬取快递100的快递公司名称和公司编码

    import com.google.common.collect.Lists;
    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    import org.jsoup.select.Elements;
    
    import java.util.Date;
    import java.util.List;
    
    /**
     * 网上爬取快递100的快递公司名称和公司编码 工具类
     */
    public class ExpressCodeUtil {
        public static void main(String[] args) {
            String url = "https://my.oschina.net/u/3291736/blog/843843";
            try {
                Document doc = Jsoup.connect(url).get();
                //获取第一个表格
                Element element = doc.select("table").first();
                Elements els = element.select("tr");//一个tr是一个快递公司编码
                List<ExpressCodeTbl> list = Lists.newArrayList();//ExpressCodeTbl是用来装快递公司名称和公司编码的实体类
                for (int i = 0; i< els.size();i++) {
                    ExpressCodeTbl code = new ExpressCodeTbl();
                    if (i != 0) {
                        //每个快递编码处理
                        Elements ele = els.get(i).select("td");
                        code.setExpressName(ele.get(0).toString().replaceAll("<td>", "").replaceAll("</td>", ""));
                        code.setExpressCode(ele.get(1).toString().replaceAll("<td>", "").replaceAll("</td>", ""));
                        code.setAddTime(new Date());
                        list.add(code);
                    }
                }
                //保存数据到数据库
                //ex.saveAll(list);
                for (ExpressCodeTbl code:list){
                    //输出快递公司名称和编码
                    System.out.println(code);
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
  • 相关阅读:
    关于16位的OS尝试(2)
    关于16位的OS尝试(2)
    键盘幽灵程序源代码
    socks5协议转http协议源码
    溢出专题(二) widechar的字符串缓冲溢出攻击技术
    超强:bat写的exploit
    键盘幽灵程序源代码
    超强:bat写的exploit
    socks5协议转http协议源码
    高质量C /C编程指南第3章 命名法例
  • 原文地址:https://www.cnblogs.com/wanghj-15/p/12158146.html
Copyright © 2011-2022 走看看