zoukankan      html  css  js  c++  java
  • .NET DotnetSpider--WebDrvierSpider(ajax动态加载的数据获取)

       爬虫获取数据时,可能会遇到AJAX加载的页面,如果无法分析出接口的话,就只能使用秘密武器——WebDriverDownloader。不过最好还是分析出接口为好,WebDriver的性能实在是太低了。现在是Puppeteer的天下了,可以看看这个

                #region WebDriverDownloader
                var option = new Option();
                option.LoadImage = false;
                option.LoadFlashPlayer = false;
                option.AlwaysLoadNoFocusLibrary = false;
                option.Headless = true;
                IWebDriverAction webDriverAction = new Click();//webDriver事件
                List<IWebDriverAction> webDriverActions = new List<IWebDriverAction>();//webDriver事件链表
                webDriverActions.Add(webDriverAction);//add webDriver事件
                var downloader = new WebDriverDownloader(Browser.Chrome, 5000, option);
                downloader.Actions = webDriverActions;//绑定到浏览器,等其执行完成load后执行
                spider.Downloader = downloader;
                #endregion
        /// <summary>
        /// 点击操作的实现
        /// </summary>
        public class Click : IWebDriverAction
        {
            /// <summary>
            /// 滚动次数
            /// </summary>
            public int ClickTimes { get; set; } = 1;
    
            /// <summary>
            /// 点击操作的具体实现
            /// </summary>
            /// <param name="webDriver">WebDriver</param>
            /// <returns>是否操作成功</returns>
            public bool Invoke(RemoteWebDriver webDriver)
            {
                try
                {
                    //webDriver.Manage().Window.Maximize();
                    for (var i = 0; i < ClickTimes; i++)
                    {
                        Thread.Sleep(2000);
                        string sJavascriptCode = "window.open("https://www.baidu.com/");";
                        webDriver.ExecuteScript(sJavascriptCode);
                        Thread.Sleep(1000);
                    }
                }
                catch (Exception)
                {
                    return false;
                }
                return true;
            }
        }
  • 相关阅读:
    [bzoj1576] [Usaco2009 Jan]安全路经Travel
    [坑][poj2396]有上下界的最大流
    bzoj1458 士兵占领
    [Ahoi2013]差异
    bzoj2424 [HAOI2010]订货
    bzoj1741 [Usaco2005 nov]Asteroids 穿越小行星群
    bzoj2251 [2010Beijing Wc]外星联络
    bzoj1977 [BeiJing2010组队]次小生成树 Tree
    bzoj2729 [HNOI2012]排队
    bzoj1925 [Sdoi2010]地精部落
  • 原文地址:https://www.cnblogs.com/TTonly/p/10346236.html
Copyright © 2011-2022 走看看