zoukankan      html  css  js  c++  java
  • selenium练习

    爬取豆瓣top250电影:https://movie.douban.com/top250

    from selenium import webdriver
    import time
    
    bro = webdriver.Chrome(executable_path='./chromedriver.exe')
    # 设置隐士等待
    bro.implicitly_wait(10)
    
    try:
        bro.get('https://movie.douban.com/top250')
        # 找到包含信息的li标签
        li_list = bro.find_elements_by_css_selector('.grid_view li')
        # print(li_list)
        # 遍历list,取出需要的信息
        for li in li_list:
            # 取出电影信息
            v_info = li.find_element_by_css_selector('.info .hd a').text
            # print(v_info)
            # 取出图片url
            photo_url = li.find_element_by_css_selector('.pic img').get_attribute('src')
            # print(photo_url)
            # 取出电影描述信息
            v_a_info = li.find_element_by_css_selector('.bd>p').text
            # print(v_a_info)
            # 取出电影的评价人数
            v_comment_count = li.find_element_by_xpath("//div[@class='star']//span[4]").text
            # print(v_comment_count)
            # 取出电影标签
            v_mark = li.find_element_by_css_selector('.inq').text
            print('''
            电影标题:%s
            电影图片url:%s
            电影描述信息:%s
            电影的评价人数:%s
            电影标签:%s
            ''' % (v_info, photo_url, v_a_info, v_comment_count, v_mark))
            time.sleep(2)
    except Exception as e:
        print(e)
    
    finally:
        bro.close()
  • 相关阅读:
    3D 图片播放焦点图插件Adaptor
    深入浅出 RPC
    深入浅出 RPC
    Fragment学习(一) :生命周期
    Activity学习(二):Activity的启动模式(转载)
    Activity学习(一):生命周期
    AsyncTask的使用
    Handler用法总结
    深入理解java泛型
    mysql多表连接和子查询
  • 原文地址:https://www.cnblogs.com/baicai37/p/13437257.html
Copyright © 2011-2022 走看看