# 数据管理技术的发展

# 数据库技术发展概述

# 数据库技术的发展阶段(识记)

数据模型是数据库系统的核心与基础

  • 第一代数据系统
    • 层次模型数据库管理系统(类似树结构)
    • 网状模型数据库管理系统
  • 第二代数据库系统
    • 关系模型数据库管理系统
      • 模型简单清晰
      • 理论基础好
      • 数据独立性强
      • 数据库语言非过程化
      • 标准化(SQL语言,在mysql,sqlserver等里面通用)
  • 第三代数据库系统
    • 面向对象数据库系统

# 第三代数据库系统的特征(识记)

  • 应支持数据管理、对象管理和知识管理
  • 必须保持或继承第二代数据库系统的技术
  • 必须对其他系统开放

# 练习题

1.( )是第二代数据库系统。单选题:B

  • A 层次数据库系统
  • B 关系数据库系统
  • C 网状数据库系统
  • D 面向对象数据库系统

2.简述第三代数据库系统具有的基本特征。简单题

(1) 第三代数据库系统应支持数据管理、对象管理和知识管理 (2) 第三代数据库系统必须保持或继承第二代数据库系统的技术 (3) 第三代数据库系统必须对其他系统开放

# 数据仓库与数据挖掘

# 数据仓库及其特征

  • 传统数据库技术:操作型处理(联机事务处理)
  • 数据仓库:分析型处理(联机分析处理)

数据仓库(Data Warehouse, DW)是面向对象的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。

数据仓库不是可以买到的产品,而是一种面向分析的数据存储方案

数据仓库的四个特征:

  • 面向主题,数据存储方案就是一个主题
  • 集成性
  • 数据的非易失性
  • 数据的时变性

# 数据仓库的三个概念

  • 粒度,单位名词,对数据单元的细化。比如 2个数据单元为一个粒度,5个数据单元为一个粒度
  • 分割,数据分割
  • 维,观察数据的角度

# 什么是数据挖掘

如何从大量的知识和信息中提取对自己有用的部分?

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现并提取隐藏在其中的、人们事先不知道的、但又是潜在有用的信息和知识的一种技术。又被称为知识发现

# 数据挖掘的功能

  • 概念描述
  • 关联分析
  • 分类与预测
  • 聚类,将相似的信息聚集到一起,形成一个分类
  • 孤立点检测,非相似信息
  • 趋势和演变分析

# 大数据及其特征

大数据是指无法在可容忍的时间内用现有信息技术和软、硬件工具对其进行感知、获取、管理、处理和服务的数据集合

特征:

  • 大量化
  • 多样化
  • 快速化
  • 价值密度低

# 练习题

1.数据仓库的建立将操作型处理和分析型处理区分开来。数据仓库为( )服务,传统的数据库技术为( )服务。填空题:分析型处理、操作型处理

2.数据仓库中,粒度是什么意思?简单题

粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别,细化程度越高,粒度级就越小,相反的,细化程度越低,粒度级就越大。

3.数据挖掘的功能有哪些? 简答题

  • 概念描述
  • 关联分析
  • 分类与预测
  • 聚类
  • 孤立点检测
  • 趋势何演变分析

4.下面哪个不是大数据的特征? ( )选择题,答案:D

  • A 大量化
  • B 多样化
  • C 快速化
  • D 价值密度高

# 其他练习题

1.下列选项中不属于数据库系统的是( )。单选题:A

  • A 操作系统
  • B 数据管理系统
  • C 用户
  • D 应用程序

2.使用二维表格结构表达实体及实体间联系的数据模型是( )。单选题:C

  • A 层次模型
  • B 网状模型
  • C 关系模型
  • D 联系模型

3.假设某商业集团数据库中关系模式R如下:

R(商店编号、商品编号、库存数量、部门编号、负责人)

如果规定:

  1. 每个商店的每种商品只在一个部门销售
  2. 每个商店的每个部门只有一个负责人
  3. 每个商店的每种商品只有一个库存数量

(1) 根据上述规定,写出模式R的关键码

商店编号、商品编号

(2) R最高属于第几范式,为什么?

第二范式。非主属性为库存数量。部门编号,负责人他们对候选键都不是部分函数依赖,但是负责人对(商店编号、商品编号)是传递函数依赖,所以不满足3NF。

(3) 将R规范到3NF

R1(商店编号、商品编号、部门编号、库存数量)

R2(商店编号、部门编号,负责人)

上次更新: 2020/10/29 22:59:19