urllib
正则表达式 lxml、XPath Beautiful Soap(html、xml解析器)
异常处理 错误重试
python3 网络爬虫开发实战 崔庆才 https://cuiqingcai.com/1052.html