“希希敬敬对”百度贴吧小爬虫任务计划
今天的团队讨论照片:
龙江腾(队长) 201810775001
完成 "贴吧名字关键字与URL关联"代码检查。明天将要完成任务“对贴吧前10页进行爬取任务”。
杨希 201810812008
完成“贴吧名字关键字与URL关联任务。明天将要完成“对贴吧前10页进行爬取任务”代码review。
何敬上 201810812004
完成 "贴吧名字关键字与URL关联"代码检查。明天将要完成任务“对贴吧前10页进行爬取任务”。
遇到问题:
URL地址与贴吧名称关联过程,发现在浏览器中复制URL地址会出现乱码,不能和关键字匹配,而且输入关键字不能带“吧”字。
比如要搜索“东华理工大学吧”,只能搜索“东华理工大学”。没有实现关键字与URL完全匹配。
燃尽图:
程序代码: