实验步骤
1、数据导入展示: 将所有类别的新闻导入数据库中。以树形目录形式展示新闻类别,每个树形节点代表 新闻分类,括号中代表该类新闻的数量,选择每个新闻,以列表形式显示新闻标题,点击新 闻标题,可以查看详细信息。
2、文章统计: 统计各个类别的文章总数,以柱状图表示。
3、文章分词: 使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方 式展示,点击词云图中该词语,显示其数量。
4、选择某一类文章,绘制该类型新闻文章词云图,例如汽车类新闻词云图。