ad

学会《大数据可视化技术》_轻松读懂你的数据_2.5 数据可视化的基本图表

admin 66 2023-10-25

【摘要】 本书摘自《大数据可视化技术》一书中第2章,第5节,杨尚森、许桂秋主编。

2.5 数据可视化的基本图表

统计图表是最早的数据可视化形式之一,作为基本的可视化元素仍然被广泛使用。 对很多复杂的大型可视化系统而言,这类图表更是不可或缺的基本组成元素。

基本的可视化图表按照其所呈现的信息和视觉复杂程度可以分为三类:原始数据绘 图、简单统计值标绘和多视图协调关联。

2.5.1 原始数据绘图

学会《大数据可视化技术》_轻松读懂你的数据_2.5 数据可视化的基本图表

原始数据绘图用于可视化原始数据信息的直观呈现。其典型方法有数据轨迹、柱状 图、条形图、折线图、直方图、饼图、等值线图、走势图、散点图、气泡图、维恩图、 热力图和雷达图等。实际选择图表时应先从总体上观察数据,然后细化到具体的分类和 其他的特性。

1. 数据轨迹

数据轨迹是一种标准的单变量数据呈现方法: x轴显示自变量, y轴显示因变量。数 据轨迹可直观地呈现数据分布、离群值、均值的偏移等。图2-22所示为中兴通讯[00763] 股票随时间的价格走势图。

2. 柱状图

柱状图采用长方形的形状和颜色编码数据的属性。柱状图的每根直柱内部也可以用 像素图方式编码,称为堆叠柱状图。柱状图适用于二维数据集,但只有一个维度需要比 较,柱状图利用柱子的高度反应数据的差异。柱状图的局限在于只适用于中小规模的数 据集。图2-23左边的柱状图为2013—2017年国内生产总值及其增长率;图2-23右边的堆 叠柱状图为2013—2017年三次产业增加值占国内生产总值比重。

3. 条形图

条形图是柱形图向右旋转了90°的呈现方式,如图2-24所示。当条目数较多时,如 大于12条时,移动端上的柱状图会显得拥挤不堪,这时更适合用条形图。条形图的条目 数一般要求不超过30条,否则易带来视觉和记忆上的负担。

4. 折线图

拆线图可用于二维大数据集,适用于趋势比单个数据点更重要的场合。图2-25为 2018年11月1日北京市的24小时气温预报折线图,通过观察该图,用户就能够清晰地了 解当天的气温变化情况。

5. 直方图

直方图是对数据集中某个数据属性的频率统计。对于单变量数据,其取值范围映射 到横轴,并分割为多个子区间。每个子区间用一个直立的长方块表示,高度正比于该属 性值子区间内数据点的个数。直方图可以呈现数据的分布、离群值和数据分布的状态。 直方图的各个部分之和等于单位整体,而柱状图的各个部分之和则没有限制,这是两者 的主要区别。图2-27所示为我国某高校的体重 (kg) 的概率直方图。

6. 饼图

饼图采用环状方式呈现各分量在整体中的比例。由于人眼对面积的大小不敏感,当 饼图各个分量比例相差不大时,应用柱状图替代饼图。图2-28所示为2017年全国居民人 均消费支出及其构成,采用饼图的形式,用户就能够直观地看出各个消费部分的占比。

除饼图外,环形图(甜甜圈图)也可以表示占比,其差异是将饼图的中间区域挖 空,在空心区域显示文本信息,比如标题,优势是其空间利用率更高,如图2-29所示。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 [email protected] 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:从《Python数据分析案例教程》中_领悟数据和Python的魅力_4.1 认识Pandas
下一篇:《认知计算与深度学习》_基于物联网云平台的智能应用_2.4 laaS、PaaS 和 SaaS 云的案例研究
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×