上一周,我打算从新建一个书库,从网上爬取一些小说来存放到书库中,用户可以自己来下载书库中的书。但是我找到网页源代码比较麻烦,所以还没有将书籍下载下来。但是我发现有书评,所以我打算把书评下载下来,可以用于后期的分析数据。我这一周的计划如下:
1.爬取书评,将书评存放在用户的批注表中。
2.因为书评中的批注没有分类,用户可以自己对书评中的批注进行分类。
3.完成用户评价书籍的功能。
4.完成自动分类的算法。将已经分类的批注信息作为训练数据,没有分类的数据作为测试数据。