如何用JAVA爬取AJAX加载后的页面(利用phantomjs)【以天眼查为例】
https://www.jianshu.com/p/96220e239c35
[Jsoup] 使用HtmlUnit + Jsoup解析js动态生成的网页
https://bluetata.blog.csdn.net/article/details/79035779
利用JAVA+phantomjs爬取深交所互动易股票数据(翻页:非URL显示)
https://www.jianshu.com/p/ba7c0f51eb1f
在用jsoup爬晋江的时候,模拟登陆后仍获取不到v章内容。经验证,是因为jsoup无法解析JavaScript,而v章内容是js动态获取的。经过查阅资料,最后使用htmlunit+jsoup来实现
登陆和获取cookies在上一篇已经写了,不再赘述。
http://www.manongjc.com/article/79807.html