今天开始做信息领域热词分析,实在不知道该从哪里爬取数据。后来同学给了我个网址,看起来信息领域的词汇挺全,然而热不热就不知道了,但是总归是有可以爬取的网站了。
https://baike.baidu.com/wikitag/taglist?tagId=76607
页面是用Ajax更新的,回传的值是json对象。地址有了,要传输的参数也有了,python爬数据就简单了。