通过原有的接口,继续进行数据的爬取操作,让自己使用接口更加熟练,收集的数据集,达到最少五十万以上(最好100万以上)。
通过我获取的文档信息,对支持下载的数据文档进行下载,做到能下载的尽量全部下载下来。
按类型进行文档的爬取例如:人工智能、大数据等等。 按作者进行文档的爬取例如:张三、李四等等
梳理自己的思路,完善自己的开题报告和毕设开题ppt
初步对摘要的内容进行关键字的提取等操作。