目标网址:http://www.51eliao.com/WinBidType.aspx?typeid=0
地区:【郴州市】
最终表格所需表头:采集网址 医院名称 省 市 中标时间 项目名称 项目编号 供应商名称 供应商地址 联系人 联系电话 产品 品牌 厂家 规格型号 数量 单价 金额(元)
页面中能获取的信息:采集网址 中标时间 项目名称
自己规定的信息:医院名称 省 市
Let's begin~
修改字段:点击图标【笔】进行修改字段(即表头)
拖动字段位置:鼠标按住字段(如——12345678——共848页—连接)前的6个点(两列点点)拖动
删除不需要的字段(如【——12345678——共848页1】),把需要的字段改名(【采集网址】、【项目名称】)
页面中能获取的信息:【采集网址】√、【中标时间】(下一个就是你!)、【项目名称】√
鼠标移动到①的位置,点击,出现②,确定
修改字段名后,
页面中能获取的信息:【采集网址】√ 、【中标时间】√ 、【项目名称】√
接下来添加固定字段
自己规定的信息:【医院名称 】【省 】【市】
【省】、【市】的操作与【医院名称】一致
现在我们已经得到了6个字段!
√ 页面中能获取的信息:采集网址 中标时间 项目名称
√ 自己规定的信息:医院名称 省 市
剩下的部分只需要表头,不需要数据【项目编号 供应商名称 供应商地址 联系人 联系电话 产品 品牌 厂家 规格型号 数量 单价 金额(元)】
操作跟【医院名称】差不多,如图:
最终有18个字段,可以从左侧的【采集流程】,点小齿轮
进入以下界面
-----------------------------------------------------到此为止,表格头和已知信息已出。------------------------------------------------------
接下来是筛选机制啦~
刚才的界面拉到底,看到【触发器】,点击【新建触发】
这个小实验中,只有【采集网址】、【中标时间】、【项目名称】从网页上获取,多变
所以在这3个里设定触发条件。
我是根据【项目名称】筛选的。
---------------------------到此为止,触发条件结束啦--------------------------------
最后是优化采集,因为规定地区为【郴州市】,所以先搜索【郴州市】再采集中标信息更加便捷。
不规定,遍历848页;规定后,遍历66页。
更新!在【公告名称】中输入【所需要的医院名称】,速度更快!
左侧流程图出现下图:
再把这个操作步骤放到上面,因为我之前就有了,所以数字标没对上号。
---------------------------流程配置完成------------------------------------
最后就是采集了
出来一个新窗口,是采集的,记下来只需要等待采集完成,会有弹框提示采集完成。
弹框提示:
有重复是会弹出 去重
最后表格展示
tips:
字段名不变,修改文本的内容,如下
我是固定值,下图所示