zoukankan html css js c++ java

.NET DotnetSpider--WebDrvierSpider(ajax动态加载的数据获取)

　　爬虫获取数据时，可能会遇到AJAX加载的页面，如果无法分析出接口的话，就只能使用秘密武器——WebDriverDownloader。不过最好还是分析出接口为好，WebDriver的性能实在是太低了。现在是Puppeteer的天下了，可以看看这个。

            #region WebDriverDownloader
            var option = new Option();
            option.LoadImage = false;
            option.LoadFlashPlayer = false;
            option.AlwaysLoadNoFocusLibrary = false;
            option.Headless = true;
            IWebDriverAction webDriverAction = new Click();//webDriver事件
            List<IWebDriverAction> webDriverActions = new List<IWebDriverAction>();//webDriver事件链表
            webDriverActions.Add(webDriverAction);//add webDriver事件
            var downloader = new WebDriverDownloader(Browser.Chrome, 5000, option);
            downloader.Actions = webDriverActions;//绑定到浏览器，等其执行完成load后执行
            spider.Downloader = downloader;
            #endregion

    /// <summary>
    /// 点击操作的实现
    /// </summary>
    public class Click : IWebDriverAction
    {
        /// <summary>
        /// 滚动次数
        /// </summary>
        public int ClickTimes { get; set; } = 1;

        /// <summary>
        /// 点击操作的具体实现
        /// </summary>
        /// <param name="webDriver">WebDriver</param>
        /// <returns>是否操作成功</returns>
        public bool Invoke(RemoteWebDriver webDriver)
        {
            try
            {
                //webDriver.Manage().Window.Maximize();
                for (var i = 0; i < ClickTimes; i++)
                {
                    Thread.Sleep(2000);
                    string sJavascriptCode = "window.open("https://www.baidu.com/");";
                    webDriver.ExecuteScript(sJavascriptCode);
                    Thread.Sleep(1000);
                }
            }
            catch (Exception)
            {
                return false;
            }
            return true;
        }
    }

查看全文

相关阅读:
BFPRT（中位数的中位数算法）
View的事件体系
 Android的消息机制
 BInder机制总结
 Service总结
 IPC机制总结
 AIDL使用绑定启动远程Service出现Service Intent must be explicit: Intent
线程协作与并发流程控制&AQS
TCP相关问题整理
 USACO 2015 US OPEN Gold T3: Trapped in the Haybales

原文地址：https://www.cnblogs.com/TTonly/p/10346236.html