主要用于微信的文章采集,如果用单纯的HttpClient采集,会出现页面无法渲染的情况;
经过研究发觉公众文章html页面是经过渲染之后显示的,那么思路来了,如果在dotnet的环境下,用WebBrowser控件能采集到渲染后的HTML。
那么可以通过dotnet下用WebBrowser实现文章采集:
预留位置