ad

学会《大数据可视化技术》_轻松读懂你的数据_3.2 连续型数据处理

admin 77 2023-10-25

摘要】 本书摘自《大数据可视化技术》一书中第3章,第2节,杨尚森、许桂秋主编。

3.2 连续型数据处理

连续型数据就是指任意两个数据点之间可以细分出无限多个数值,它表现的是不断 变化的现象。例如:温度这种数据就是连续型,可以测量它一天内的任意时刻的温度。 还有股市实时行情也是一种连续型数据。这类的实例很多,那如何处理这些数据呢?那 就用到数据的可视化处理,人们通常会想象可视化应该是什么样子,或者去找出一个想 要模仿的例子。但是,在实践的时候,才意识到要么需要数据很多,要么就是制作的 图表不适合——常见的错误就是先视觉形成,后找数据。其实是反过来的,应该先有数 据,再进行可视化。所以,选择合适的可视化形式也很重要,它更易于大家的理解。下 面讲述了连续型数据的几个可视化形式。3.2.1 阶梯图

阶梯图是曲线保持在同一个值,直到发生变化,直接跳跃到下一个值。它的形状就 类似于平时楼道里面的楼梯。比如说,银行的利率,它一般会持续几个月不变,然后某 一天出现上调或下调。楼盘价格长时间停留在某个值,突然有一天因为各种调控,出现 调整。对于这类的数据类型就可以使用阶梯图,如图3-2所示。

Python实现代码如下:

from pyecharts import Line

line= Line(“美国邮票阶梯图)

学会《大数据可视化技术》_轻松读懂你的数据_3.2 连续型数据处理

datax=[1995,1996,1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,20091

datay =[0.32,0.32,0.32,0.32,0.33,0.33,0.34,0.37,0.37,0.37,0.37,0.39,0.41,0.42,0.44]

line.add("Price"datax, datay, is step = True,is label show = True,yaxis_min =0.3,yaxis_max=0.45)

line.render()

上述代码功能是这样的,事先数据准备,这里用2个列表存储数据, datax存储的是 时间数据, datay存储的是邮费数据。如果数据量大的话可以用文件存数据,在3.2.2节 中会涉及,这里就不加概述。最后用pyecharts.Line来画这个梯形图,另外如果将line. add()函数中的is step去掉就会呈现一个折线图。有兴趣可以试试,其图表效果如图3-4 所示,也就是下面3.2.2部分所要讲的内容,这里就不赘述了

3.2.2 折线图

折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化 趋势。在时间数据中,折线图沿水平轴均匀分布的是时间,沿垂直轴均匀分布的是所有 值数据。折线图比较适用于趋势类的需求。常用于人口增长趋势、书籍销售量、粉丝增 长进度等。这种图表类型的基本框架如图3-6所示。

拟合曲线

拟合曲线是根据所给定的离散数据点绘制的曲线,称为不规则曲线。实际工作中, 变量间未必都有线性关系,曲线拟合是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。所谓曲线拟合方法是由给定的离散数据点,建立数 据关系(数学模型),求出一系列微小的直线段把这些插值点连接成曲线,只要插值点 的间隔选择得当,就可以形成一条光滑的曲线。比如获取的数据很多,或者数据很杂 乱,可能很难甚至无法辨认出其中的发展趋势和模式。所以为了估算出一条趋势,从而 就用到拟合估算。图3-9显示了拟合的基本框架。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 [email protected] 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:《零基础Linux 从入门到精通》_从零开始_轻松掌握Linux操作系统_21.1 防火墙介绍
下一篇:《JAVA服务端研发知识图谱》_让你更懂Java后台研发_1.4 对象
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×