# 数据管理技术的发展
# 数据库技术发展概述
# 数据库技术的发展阶段(识记)
数据模型是数据库系统的核心与基础
- 第一代数据系统
- 层次模型数据库管理系统(类似树结构)
- 网状模型数据库管理系统
- 第二代数据库系统
- 关系模型数据库管理系统
- 模型简单清晰
- 理论基础好
- 数据独立性强
- 数据库语言非过程化
- 标准化(SQL语言,在mysql,sqlserver等里面通用)
- 关系模型数据库管理系统
- 第三代数据库系统
- 面向对象数据库系统
# 第三代数据库系统的特征(识记)
- 应支持数据管理、对象管理和知识管理
- 必须保持或继承第二代数据库系统的技术
- 必须对其他系统开放
# 练习题
1.( )是第二代数据库系统。单选题:B
- A 层次数据库系统
- B 关系数据库系统
- C 网状数据库系统
- D 面向对象数据库系统
2.简述第三代数据库系统具有的基本特征。简单题
(1) 第三代数据库系统应支持数据管理、对象管理和知识管理 (2) 第三代数据库系统必须保持或继承第二代数据库系统的技术 (3) 第三代数据库系统必须对其他系统开放
# 数据仓库与数据挖掘
# 数据仓库及其特征
- 传统数据库技术:操作型处理(联机事务处理)
- 数据仓库:分析型处理(联机分析处理)
数据仓库(Data Warehouse, DW)是面向对象的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。
数据仓库不是可以买到的产品,而是一种面向分析的数据存储方案
数据仓库的四个特征:
- 面向主题,数据存储方案就是一个主题
- 集成性
- 数据的非易失性
- 数据的时变性
# 数据仓库的三个概念
- 粒度,单位名词,对数据单元的细化。比如 2个数据单元为一个粒度,5个数据单元为一个粒度
- 分割,数据分割
- 维,观察数据的角度
# 什么是数据挖掘
如何从大量的知识和信息中提取对自己有用的部分?
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现并提取隐藏在其中的、人们事先不知道的、但又是潜在有用的信息和知识的一种技术。又被称为知识发现
# 数据挖掘的功能
- 概念描述
- 关联分析
- 分类与预测
- 聚类,将相似的信息聚集到一起,形成一个分类
- 孤立点检测,非相似信息
- 趋势和演变分析
# 大数据及其特征
大数据是指无法在可容忍的时间内用现有信息技术和软、硬件工具对其进行感知、获取、管理、处理和服务的数据集合。
特征:
- 大量化
- 多样化
- 快速化
- 价值密度低
# 练习题
1.数据仓库的建立将操作型处理和分析型处理区分开来。数据仓库为( )服务,传统的数据库技术为( )服务。填空题:分析型处理、操作型处理
2.数据仓库中,粒度是什么意思?简单题
粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别,细化程度越高,粒度级就越小,相反的,细化程度越低,粒度级就越大。
3.数据挖掘的功能有哪些? 简答题
- 概念描述
- 关联分析
- 分类与预测
- 聚类
- 孤立点检测
- 趋势何演变分析
4.下面哪个不是大数据的特征? ( )选择题,答案:D
- A 大量化
- B 多样化
- C 快速化
- D 价值密度高
# 其他练习题
1.下列选项中不属于数据库系统的是( )。单选题:A
- A 操作系统
- B 数据管理系统
- C 用户
- D 应用程序
2.使用二维表格结构表达实体及实体间联系的数据模型是( )。单选题:C
- A 层次模型
- B 网状模型
- C 关系模型
- D 联系模型
3.假设某商业集团数据库中关系模式R如下:
R(商店编号、商品编号、库存数量、部门编号、负责人)
如果规定:
- 每个商店的每种商品只在一个部门销售
- 每个商店的每个部门只有一个负责人
- 每个商店的每种商品只有一个库存数量
(1) 根据上述规定,写出模式R的关键码
商店编号、商品编号
(2) R最高属于第几范式,为什么?
第二范式。非主属性为库存数量。部门编号,负责人他们对候选键都不是部分函数依赖,但是负责人对(商店编号、商品编号)是传递函数依赖,所以不满足3NF。
(3) 将R规范到3NF
R1(商店编号、商品编号、部门编号、库存数量)
R2(商店编号、部门编号,负责人)