相关代码已经修改调试成功----2017-4-22
一、说明
1.目标网址:知乎登入后的首页
2.实现:如图字段的爬取
zhihu_question表:
zhihu_answer表:
3.数据:存放在百度网盘,有需要的可以拿取 链接:http://pan.baidu.com/s/1qYQ6rk4 密码:ociz
zhihu_question表结果:
zhihu_answer表结果:
二、运行
运行我就不多说了,直接运行main.py就好了,相关的参数变一下就好了。有点基础的应该都会。
三、学习笔记
本项目爬取知乎的问题和回答的相关信息。本项目和伯乐在线项目差不多,新知识就是一个模拟登录。
四、问题----欢迎留言提出问题
1.暂时没有很大的问题解决不了,后期如果遇到再贴出来
如果本项目对你有用请给我一颗star,万分感谢。
想要看代码请移步我的github:https://github.com/pujinxiao/zhihu_spider
作者:今孝
出处:http://www.cnblogs.com/jinxiao-pu/p/6748042.html
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。