石家庄铁道大学 2021 年秋季
2019 级课堂测试试卷-基于中文新闻分词绘制词云图
课程名称: 大型数据库应用技术 任课教师: 王建民 测试时间:150 分钟
一、 测试内容:基于中文新闻分词绘制词云图
(http://www.idatascience.cn/case-detail?experimentId=38)
1、数据导入展示:
将所有类别的新闻导入数据库中。以树形目录形式展示新闻类别,每个树形节点代表
新闻分类,括号中代表该类新闻的数量,选择每个新闻,以列表形式显示新闻标题,点击新
闻标题,可以查看详细信息。
(参考样式) 第 2 页 共 3 页
这是做出来的效果
首先把数据导入到mysql
分别从不同的数据表中找到数据,然后进行展示
点击连接就可以查看文章的内容
2、文章统计:
统计各个类别的文章总数,以柱状图表示。
3、文章分词:
使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方
这里分词统计出热词和他相应的数量
式展示,点击词云图中该词语,显示其数量。 第 3 页 共 3 页
4、选择某一类文章,绘制该类型新闻文章词云图,例如汽车类新闻词云图。
二、
测试报告:
1、按照测试题目顺序,将实验步骤说明和结果截图存储到答题纸上,文件名以班级学号
姓名词云图命名。