加入收藏 | 设为首页 | 会员中心 | 我要投稿 广安站长网 (https://www.0826zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

收藏!一文了解数据分析知识体系

发布时间:2021-06-04 19:23:51 所属栏目:大数据 来源:互联网
导读:一 数据分析定义 数据分析是指有针对性的收集、加工、整理数据,并采用统计、挖掘技术分析和解释数据。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 1 数据定义 数据是客观事实,对于客观事物发生,发展的数字化记录。随着科
一 数据分析定义
数据分析是指有针对性的收集、加工、整理数据,并采用统计、挖掘技术分析和解释数据。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
1 数据定义
数据是客观事实,对于客观事物发生,发展的数字化记录。随着科学技术的发展,数据的概念内涵越来越广泛包括数值,文本,声音,图像,视频。
 
数据可以分为定性数据和定量数据。
定性数据是用来描述事物的属性,名称等,它一种标志,没有序次关系。例如,“性别”,“男”编码为1,“女”编码为2。
定量数据描述量化属性,或用于编码。如交易金额、额度、商品数量、积分数、客户评分等都属于量化属性。
定量数据可以继续划分:定序数据、定距数据与定比数据。
定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。
定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。例如,温度。
定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点,例如职工人数,身高。
 
2 数据分析大事记
计算机时代崛起
计算机的发展和计算技术的发展极大地增强了数据分析的过程。1880年,在使用计算机之前,美国人口普查局花了7年的时间来处理收集到的信息并完成最终报告。使用此设备,在18个月内完成了1890年的人口普查。
关系数据库诞生
关系数据库由埃德加·科德(Edgar F. Codd)在1970年代发明,并在1980年代非常流行。关系数据库(RDBM)允许用户编写Sequel(SQL)并从其数据库中检索数据。关系数据库和SQL提供了能够按需分析数据的优势,并且仍在广泛使用。它们易于使用,对于维护准确的记录非常有用。
数据仓库诞生
在1980年代后期,收集数据的数量继续显着增长,部分原因是硬盘驱动器的成本较低。在此期间,开发了数据仓库的体系结构,以帮助将来自操作系统的数据转换为决策支持系统。数据仓库通常是云的一部分,或者是组织的大型机服务器的一部分。与关系数据库不同,数据仓库通常经过优化,可快速响应查询。
商业智能(BI)崛起
20世纪80年代-90年代,数十家BI厂商进入市场。数据仓库技术的发展大大推动了商业智能的发展,传统存储在各个地方的业务数据开始集中在一起。应运而生的技术还包括ETL(数据抽取、转换、加载)和OLAP(联机分析处理)。

(编辑:广安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读