数据类别:
介绍
大街上,满眼都是广告——说明市场经济发达,这是好事情。再观察一下广告,多是以各种样式的图形呈现,而不是简简单单地把数字呈现出来——即使是数字,也想办法把数字搞得像图一样。这样做的目的是要吸引人的注意,并且能够让人一眼就能看到想要看的。
别以为这是广告商的策略,其实,他们只是顺应了大脑的特点(具体请参考有关心理学和脑科学的研究成果)
--》用某种适合的图形来表示某些数据 !!!
分类:
艺术性可视化:
配置了表示数字的图示,并且都很形象,人的视觉无形中就被图示所吸引了。把数字本来的抽象意义,用直观的方式表达出来,更刺激人的大脑。(从视觉的维度让人感受到一种震撼)
它通常不会科学、准确地反映数据的含义,而是为了某个目的追求感官刺激
数学性可视化:
比较理智的反映了数据。但是,给人的印象不是很深刻,或者没有让人感到受刺激
更趋真实地反映了对象的本质
图形展示:
散点图:
绘制散点图,要有对应的两组数据(二维图);
两组数据所对应的两个变量是连续变量;
散点图的用途在于发现变量之间的关系。
-->PM2.5 指数,这也是一种散点图,通过这种散点图就能够看到污染城市的地理分布规律
柱形图:
适用于二维数据集,但是有一个维度的数据需要具有比较意义
柱形图不适合大数据,
条形图:
柱状图横过来,对于数值都是大于 0 的数据而言,画出来的条形图可以这样理解
折线图:
数据量大 !!(数据变化的趋势)
对这份数据实现可视化,比较好的选择是绘制折线图
折线图最典型的应用应该算是在股票方面了,范围大一点可以说是“金融数据分析”方面
直方图:
直方图是以各个矩形的面积描述各组的频数,所有矩形的面积之积为各组频数的和
想直观地了解这个数据集中数字分布的特征,就可以利用直方图
图中可以看出,虽然是随机生成的,但是数据的分布还是有规律的,这就是统计学中的正态分布
饼图:
用于表达某些量所占比例的情况。
显示了不同量占据总量的百分比,通过饼状图就能够对比分类数据的数值大小。当然,如果类别太多,会把“饼”分成太多的小份,不美观,也不易于观察。
箱型图:
称盒须图、盒式图或箱线图
通过箱形图,可以观察到如下信息:
数据的统计值为中位数、最大值、最小值等
数据集中是否存在异常值,以及异常值的具体数值
数据是否是对称的
数据的分布是否密集、集中
数据是否有偏向性
图形的名称:
柱形图
堆积柱形图
条形图
气泡图
直方图
箱形图
热力图
散点图
雷达图
环形图
饼图
折线图
K 线图
仪表盘
词云
---> 对数据进行可视化的时候,要根据数据特征、绘图目的选择适合的图像
总结:
数学性可视化:即基于统计学基本知识,运用编程技能实现数据可视化。这种方式特别适用于大数据的问题中