zoukankan      html  css  js  c++  java
  • selenium+PhantomJS简单爬虫

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    '''
    Created on 2017年10月19日
    @author:
    '''
    import time
    from selenium import webdriver
    from selenium.common import exceptions
    
    #注意:Python文件名或者包名不要命名为selenium,会导致无法导入
    
    def main():
        #browser = webdriver.Ie(executable_path='C:geckodrivergeckodriver.exe')
        browser = webdriver.PhantomJS(executable_path='C:geckodriverphantomjs.exe')
        try:
            browser.get(r'https://.com/index.shtml')
            #time.sleep(5)
            html = browser.find_element_by_css_selector('.banner').get_attribute('innerHTML')
            print(html)
        except exceptions.TimeoutException as ex:
            print(ex)
    
    if __name__ == '__main__':
        main()

     版本说明:

    py3.6

    selenium3.6

    geckodriver-v0.19.0-win64

    phantomjs-2.1.1-windows

  • 相关阅读:
    Django url
    Django 命令
    MVC和MTV模式
    pymysql操作
    mysql 基本操作
    jquery基本操作
    外边距内边距
    css
    Html
    __name__ __main__ 作用
  • 原文地址:https://www.cnblogs.com/OnlyDreams/p/7691910.html
Copyright © 2011-2022 走看看