zoukankan      html  css  js  c++  java
  • Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

    1.安装selenium

    pip install selenium
    Collecting selenium
      Downloading selenium-3.4.1-py2.py3-none-any.whl (931kB)
        100% |████████████████████████████████| 942kB 573kB/s 
    Installing collected packages: selenium
    Successfully installed selenium-3.4.1
    

    2.安装phantomjs

    下载地址:http://phantomjs.org/download.html

    下载的版本是:phantomjs-2.1.1-linux-x86_64.tar.bz2

    解压下载好的文件,并把文件夹移动到/usr/local目录下

    sudo mv phantomjs-2.1.1-linux-x86_64 /usr/local/phantomjs
    

     在/etc/profile下添加,之后source /etc/profile

    export PHANTOMJS_HOME=/usr/local/phantomjs
    export PATH=$PATH:$PHANTOMJS_HOME/bin
    

    测试是否安装成功

    phantomjs -v
    2.1.1
    
  • 相关阅读:
    简易表格练习
    CSS圆角样式
    力不从心
    学渣在努力~
    嫌疑人
    poj1308 Is it a tree?
    悲剧文本
    迷宫问题
    n皇后问题
    油田
  • 原文地址:https://www.cnblogs.com/tonglin0325/p/6791956.html
Copyright © 2011-2022 走看看