zoukankan      html  css  js  c++  java
  • 20171012 动态爬虫爬取预约挂号有号信息

    1. -- 目标:针对医院有些医生有预约号不确定时间点有号,晚了就挂不到了,能有个监测爬去,有号就提醒的机制。

    可能会用到:scrapy + PhantomJS + Selenium

    环境: windows10 + vs 2015 + python 2.7

    安装 : scrapy

    创建项目: 命令提示符 界面 使用语句 scrapy startproject s_scrapy

    成功后会提示创建的目录地址

    cd s_scrapy

    进入目录

    tree /f

    树形结构读取目录文件

    在vs中创建一个python的项目,再增加现有文件s_scrapy到项目中,这样所有的项目文件都导入了,方便操作

     下载PhantomJS ,Windows环境下载好后,解压得到PhantomJS.exe

    放到cmd可以执行的路径下面,再通过cmd 执行语句phantomjs ./test.js http://baidu.com

    当然了./test.js   路径要对,可以自己改

    -- python 2.7 安装selenium 目的是为了调用PhantomJS 这种没有界面的浏览器,来实现交互功能

    也许并不是你需要的内容,这只是我人生的一些痕迹. -- soar.pang
  • 相关阅读:
    Hadoop-CDH源码编译
    HBase框架基础(四)
    HBase框架基础(三)
    Scala基础简述
    HBase框架基础(一)
    NOI2015 软件包管理器
    可持久化数据结构入门
    树链剖分 入门
    NOIP2009 最优贸易
    高斯消元 模板
  • 原文地址:https://www.cnblogs.com/Soar-Pang/p/7654512.html
Copyright © 2011-2022 走看看