zoukankan      html  css  js  c++  java
  • cefsharp作为采集工具(学习笔记)

    cefsharp(webkit内核)浏览器替代webbrowser用来采集页面数据。

    需要在页面form加载完毕,用异步方式自动获取sourcecode。

    由于国内cefsharp的资料相对比较少,在google英文资料后得到方法,这里做个笔记备忘:

    2015-05-26_061621

    2015-05-26_061703

    IWebBrowser.cs 这个接口文件里面
    36行: event EventHandler<FrameLoadEndEventArgs> FrameLoadEnd; 页面加载完的“事件”。

    262行:GetSourceAsync() 会返回string 结果,可以用来返回html代码

    只需要页面一加载完毕就GetSourceAsync() ,加了个Async后缀(异步的意思),之前的名字叫做GetSource()。

    以前的GetSource():

    2015-05-26_065127

    下载了最新的cefsharp就不用纠结为何cefsharp找不到GetSource()方法了,现在.net 4  和.net4.5作者都改成GetSourceAsync() 。

    具体看下面截图,是因为有人提出来过这个建议,所以作者就改了:

    2015-05-26_065814

    具体等页面加载完毕,自动获得页面source code的代码如下:

                var task1 = browser.GetSourceAsync();
                task1.Wait();
                string html = task1.Result;

    2015-05-26_075937

    以上例子是在CefSharp.MinimalExample完成。更多的用法,可以参考:https://github.com/cefsharp/CefSharp/issues/646

  • 相关阅读:
    最近邻插值
    tp类型自动转换和自动完成
    tp读取器和写入器
    tp模型和数据库操作方法
    tp数据库操作
    tp请求和响应
    tp配置+路由+基本操作
    git的常见操作方法
    php 检查该数组有重复值
    公众号的TOKEN配置PHP代码
  • 原文地址:https://www.cnblogs.com/caianhua/p/4529530.html
Copyright © 2011-2022 走看看