ad

从《Python数据分析案例教程》中_领悟数据和Python的魅力_1.2 数据分析与数据挖掘

admin 87 2023-10-25

【摘要】 本书摘自《Python数据分析案例教程》书中第1章,第2节,由万念斌、肖伟东、叶丰标编著。

1.2 数据分析与数据挖掘

从《Python数据分析案例教程》中_领悟数据和Python的魅力_1.2 数据分析与数据挖掘

数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息 的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、 统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖 掘出潜在的模式,可帮助决策者调整市场策略,减少风险,做出正确的决策。数据挖掘是通 过分析每个数据,从大量数据中寻找其规律的技术。

数据挖掘和数据分析都是从数据中提取一些有价值的信息;都需要懂统计学知识,懂数 据处理一些常用的方法,对数据的敏感度比较好。两者有很多相似之处,联系越来越紧密, 很多数据分析人员开始使用编程工具进行数据分析,如 Python、R语言等,而数据挖掘人员 在结果表达及分析方面也会借助数据分析的手段。但是两者的侧重点和实现手法有所区 别,不同之处表现在:

(1)在应用工具方面,数据挖掘一般要通过算法编程来实现,需要掌握算法设计和编程 语言,重在算法;而数据分析更多的是借助分析工具进行,也可通过编程实现,如 Python 数 据分析。

(2)在行业知识方面,数据分析要求对所从事的行业有比较深的了解和理解,并且能够将数据与自身的业务紧密结合起来;而数据挖掘不需要有太多的行业专业知识。

(3)在交叉学科方面,数据分析需要结合统计学、营销学、心理学以及金融、政治等方面 进行综合分析;而数据挖掘更多的是注重技术层面的结合以及数学和计算机的结合。

1.3 互联网大数据及其特点

目前各行业应用领域讨论的数据,典型的是来自于联机事务处理(OLTP) 的数据,此类 数据通常具有较好的规范化,数据时时刻刻都在不断增加,具有典型的数据流特征。数据存 在于企事业单位的联机系统中,是用户查询、业务处理的数据源。

互联网大数据是基于互联网的应用系统所产生的各种相关数据的集合。互联网大数据 源于基于 Web 服务框架的各种应用、各种基于客户端的互联网应用、基于内容网的互联网 应用延伸。 一般把数据的大容量、数据蕴含的价值、数据来源多样化以及数据处理的快速化 等特点作为大数据的基本特征。对于互联网大数据而言,除了具备这些基本特征外,还具有 以下特点:

(1)大数据类型更加丰富。互联网大数据的数据类型除了基本数据类型外,还有文本 型、音频视频型、用户标签、地理位置信息、社交连接数据等,这些数据广泛存在于互联网的 五大应用中,它们本质上属于字符串、整型等基本数据类型,但它们经过重新整合已经形成 具有一定语义的数据单元,是互联网大数据的基本组成部分。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 [email protected] 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:《零基础Linux 从入门到精通》_从零开始_轻松掌握Linux操作系统_23.1 Linux 常见命令
下一篇:《给所有人的Python》_第四版_也是给你的一本知识宝典_2.7.5 定义函数
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×