zoukankan      html  css  js  c++  java
  • python爬虫之Phantomjs安装和使用

    phantomjs:

      PhantomJS是一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,JSON,Canvas 以及SVG。

    phantomjs:

      1、无UI界面的网站测试

      2、屏幕快照

      3、页面操作自动化

    官方文档:http://phantomjs.org/api/command-line.html

    官方下载:http://phantomjs.org/download

    1、下载完成后放到自己喜欢的一个位置,然后进入bin文件夹,然后把这个路径添加到环境变量里面。

     使用:

     学习过Selenium的同学都知道webdriver.chrome(),使用谷歌浏览器打开爬取页面(或者是测试页面),如果是.PhantomJS()的话就直接省去了系统打开页面的步骤。

    browser = webdriver.Chrome()
    browser = webdriver.PhantomJS(service_args=SERVICE_ARGS)
    

     service_args= 这里写的是参数,参数如下:

      1、不加载图片

      2、启用硬盘缓存

    SERVICE_ARGS = ['--load-images=false','--disk-cache=true']
    

      

      

  • 相关阅读:
    前端小tite(随笔)
    算法两数之和 python版
    常用标签
    pip install 遇到的问题
    不常用的模块
    约束和约束关系
    Django初识
    前端—Bootstrap
    前端—jQuery
    前端—BOM和DOM
  • 原文地址:https://www.cnblogs.com/lei0213/p/7689540.html
Copyright © 2011-2022 走看看