Download - 第1章 数据库系统概论
数据库技术与应用 - SQL Server
22
关于教材:
《数据库技术与应用—— SQLServer 》
刘卫国 严晖主编 清华大学出版社
参考书:
《数据库系统概论》(第三版)
萨师煊 王珊 编著 高等教育出版社
《数据库技术基础及应用》
刘国燊 电子工业出版社
3 3
计算机系统
数据库
4 4
第 1 章 数据库系统概论
5 5
本章内容1.1 数据管理技术的发
展1.2 数据库和数据库系
统1.3 数据模型1.4 数据库新技术
6 6
1.1 数据管理技术的发展数据与数据处理 1 .数据和信息 数据是人们用于记录事物情况的物理符号。信息是数据中所包含的意义。通俗地讲,信息是经过加
工处理并对人类社会实践和生产活动产生决策影响的数据。数据与信息既有区别,又有联系。数据是表示信息的,
但并非任何数据都能表示信息,信息是加工处理后的数据,是数据所表达的内容。
2. 数据处理 数据处理是指将数据转换成信息的过程。它包括对数据
的收集、存储、分类、计算、加工、检索和传输等一系列活动。
7 7
1.1 数据管理技术的发展数据管理技术 1. 人工管理阶段 程序与数据是一个整体,一个程序中的数据无法被其他
程序使用,因此程序与程序之间存在大量的重复数据。特点 :
程序之间不能共享数据;程序复杂;数据量小且无法长期保存;人工重复输入数据,数据不保存。
8 8
人事管理应用程序 教师信息数据组
学生管理应用程序 学生信息数据组
教务管理应用程序 课程信息数据组
学生部门
教务部门
人事部门
图 1-1 应用程序和数据的依赖关系
9 9
1.1 数据管理技术的发展2. 文件管理阶段20 世纪 50 年代后期至 60 年代后期 , 计算机外存储器有
了磁鼓和磁盘等直接存取设备;软件有了操作系统和文件系统;程序通过文件系统访问数据。
外存储器
数据输入程序 01090101林小辉12111980120122长春市东朝阳路10委6号 1300210431-7899101
01090102李晓娜24101984022923黑龙江省哈尔滨市建设街5号1500860431-565465401090103王强 14011984060322长春市民康路10号 1300240431-987451901090104张丽丽23101984071122吉林珲春市第二高级中学 1333000440-751886401090105赵海燕23011984021523黑龙江大庆市萨尔图区 1633110459-6379363
数据文件
01090101林小辉12111980120122长春市东朝阳路10委6号 1300210431-789910101090102李晓娜24101984022923黑龙江省哈尔滨市建设街5号1500860431-565465401090103王强 14011984060322长沙市五一路10号 1300240731-487451901090104张丽丽23101984071122吉林珲春市第二高级中学 1333000440-751886401090105赵海燕23011984021523黑龙江大庆市萨尔图区 1633110459-6379363
10 10
外存储器
01090101林小辉12111980120122长春市东朝阳路10委6号 1300210431-789910101090102李晓娜24101984022923黑龙江省哈尔滨市建设街5号1500860431-565465401090103王强 14011984060322长春市民康路10号 1300240431-987451901090104张丽丽23101984071122吉林珲春市第二高级中学 1333000440-751886401090105赵海燕23011984021523黑龙江大庆市萨尔图区 1633110459-6379363
特点 : 多个程序共享数据;易于长期保存数据;数据共享差、冗余(重复)度较大;程序对数据依赖性较强;
查询程序王强长沙市五一路 10 号1300240731-4874519
01090103
查询程序
11 11
学生部门
教务部门
人事部门
文件系统
教师数据文件
学生数据文件
课程数据文件
人事管理应用程序
学生管理应用程序
教务管理应用程序
图 1-2 应用程序和数据文件的关系
12 12
1.1 数据管理技术的发展3 .数据库管理阶段数据库是在数据库管理系统的集中控制之下,按一定的
组织方式存储起来的、相互关联的数据集合。特点:
数据真正实现了结构化 数据的共享性高,冗余度低,易扩充数据独立性高 数据由 DBMS 统一管理和控制
13 13
外存储器
此阶段将数据集中存储在一台计算机上,进行统一组织和管理。
数据库 字段名 类型 宽度 小数位 说 明
F_BM 字符型 2 省市编码F_MC 字符型 12 省市名称
字段名 类型 宽度 小数位 说 明F_BM 字符型 2 省市编码F_MC 字符型 12 省市名称
14 14
特点:数据结构化并与程序分离;数据集中式管理,高度共享;数据冗余度小,具有数据一致性和完整性控制规则。
外存储器
字段名 类型 宽度 小数位 说 明F_BM 字符型 2 省市编码F_MC 字符型 12 省市名称
字段名 类型 宽度 小数位 说 明F_BM 字符型 2 省市编码F_MC 字符型 12 省市名称
字段名称 数据类型 字段宽度 说 明JSBH 文本 6 教师编号XM 文本 8 教师姓名:最多4个汉字CSRQ 日期 8 出生日期XB 文本 1 性别:1表示男,2表示女ZC 文本 1 1 2 3 4 5职称: 助教, 讲师, 副教授, 教授, 博士导师ZZF 逻辑 1 TRUE FALSE 在职否: 表示在职, 表示退休BGDH 文本 10 办公电话ZZDH 文本 10 住宅电话YDDH 文本 15 移动电话
JSBH XM CSRQ XB ZC ZZF BGDH ZZDH YDDH103601 李晓光 1960-5-1 1 3 TRUE 8922331 5166123 13019298657103621 李敏 1970-1-12 2 2 TRUE 8456721 5660304 13809228127106723 赵丹茹 1945-12-3 2 5 FALSE 8499213 13019876502105721 张大伟 1957-3-11 1 4 TRUE 8426115 8499212 13902125631
15 15
学生部门
教务部门
人事部门
学校数据库
数据库管理系统 DBMS
人事管理应用程序
学生管理应用程序
教务管理应用程序
图 1-3 应用程序和数据库的关系
16 16
1.2 数据库和数据库系统数据库( DB-Data Base )
数据库是存储在计算机系统中,有组织、结构化的关联数据集合;以文件方式存储。
硬件 存放数据库的介质
常见数据库文件扩展名: MDF-SQL Server; MDB-Access; DBC-VFP( Visual FoxPro)
17 17
数据描述事物的符号记录例
(李明,男, 22 , 1986 ,浙江,计算机, 2006 )
语义李明是个大学生, 1986 年生,浙江人, 2006 年
考入计算机系数据的含义称为语义,数据与其语义不可分。数据的形
式不能完全表达其内容,需要经过解释,数据的解释是对数据含义的说明。
18 18
1.2 数据库和数据库系统数据库系统的组成数据库系统 (Database System , DBS) 是一个计算机应用
系统。它是把有关计算机硬件、软件、数据和人员组合起来为用户提供信息服务的系统。
数据库系统是由计算机系统、数据库及其描述机构、数据库管理系统和有关人员组成的具有高度组织性的总体。
应用程序
数据库管理员
开发工具 数据库管理系统 操作系统 数据库
19 19
数据库系统的简单结构
应用程序 1
应用程序 2
……
应用程序 n
数 据 库 管 理系统( DBMS )
数 据 库 管 理员( DBA )
数据库
基础
20 20
1.2 数据库和数据库系统数据库:是数据的汇集,它以一定的组织形式存于存储介质
上。DBMS :是管理数据库的系统软件,它实现数据库系统的各
种功能。是数据库系统的核心。DBA:负责数据库的规划、设计、协调、维护和管理等工作。应用程序:指以数据库为基础的应用程序。
相关人员
数据库
用应
系 统
DBMS
OS 硬件
21 21
数据库系统机构
数据库系统结构数据库系统结构可以根据考察的角度分为不同的形式:
模式结构体系结构
25 25
体系结构
单用户结构 最简单的数据库系统采用的方式
应用、 DBMS 、数据在同一个机器上,只能由一个用户访问
主从式结构 一个主机带多个终端的多用户结构
应用、 DBMS 、数据在同一主机上,多个用户通过终端或网络访问
26 26
体系结构
分布式结构 数据库中的数据在逻辑上是一个整体,物理上分布在计算机网络的不同节点上
应用、 DBMS 、数据分布在网络上的多个主机上,多个用户网络访问
C/S 结构 将 DBMS 的功能与应用分开专门执行 DBMS功能的计算机称为数据库服务器,其他安装 DBMS 外围应用开发工具、支持用户应用的称为客户机
应用、开发工具位于客户机上,数据和 DBMS位于服务器上,客户机与服务器通过专门的接口进行通讯
27 27
1.2 数据库和数据库系统数据库系统的优点
数据共享减少数据冗余 具有较高的数据独立性增强了数据安全性和完整性保护
28 28
1.3 数据模型定义 : 是数据库中用于抽象、表示和处理现实世界中数
据和信息的工具 。能较真实地模拟现实世界容易为人所理解便于在计算机上实现
29 29
数据模型的组成要素数据结构
所研究的对象类型的集合,属于系统静态特性。数据操作
对数据库中各种对象(型)的实例(值)允许执行的操作的集合,属于系统动态特性。
数据约束条件是一种完整性规则的集合,保证数据的正确、有
效、相容。
30 30
1.3 数据模型
1. 数据处理的 3 个阶段
现实世界
信息世界
机器世界
图 1-5 数据处理的三个阶段
抽象
转换
31 31
1.3 数据模型2. 实体是客观事物的真实反映,并可相互区别的事物。可以是
实际存在的对象、抽象概念或事件。
( 1 )属性将事物特性称为实体属性。例如,为描述一个职工,可能涉及如下属性:编号、姓
名、性别、出生日期和职称。
例如:
32 32
1.3 数据模型( 2 )实体型和实体值实体型就是实体的结构描述,通常是实体名和属性名的集
合;具有相同属性的实体,有相同的实体型。实体值是一个具体的实体,是属性值的集合。例如,教师实体型是:教师 (编号、姓名、性别、出生日期、职称、基本工资、
研究方向 )
教师“李亦光”的实体值是:(15031 ,李亦光,男, 09/21/65 ,教授, 678 ,数据库技
术 )
33 33
1.3 数据模型( 3)属性型和属性值 属性型就是属性名及其取值类型,属性值就是属性在其
值域中所取的具体值。例如:“ 103601” 是编号值;“李晓光”是姓名值;
“ 1” 是性别值 。( 4)实体集性质相同的同类实体的集合称为实体集。如一个系的教师。
34 34
1.3 数据模型( 5)码 唯一标识实体的属性集合。( 6)域属性的取值范围。
35 35
1.3 数据模型3 .实体间的联系实体之间的对应关系称为联系,它反映了现实世界事物
之间的相互关联。 联系的类型:
一对一联系 记为 1 : 1 。 (如学校与校长间的联系 )
一对多联系 记为1: n 。 (如宿舍房间与学生的联系 )
多对多联系 记为m : n 。 (如一个教师可以教授多个学生,而一个学生又可以受
教于多个教师)
36 36
4. 概念模型概念模型是反映实体之间联系的模型。E-R模型 : 描述现实世界的概念模型。
实体:用矩形框表示,框内写入
实体名。
属性:用椭圆形表示,属性的名
称记入椭圆形内。
联系:用菱形框表示实体间的相
互关系,框内注明联系的名称。
学生
学号
学生与课程间的联系
1.3 数据模型
37 37
1.3 数据模型厂长
工厂
任职
1
1
(a)
公司
职员
就职
1
n
(b)
读者
图书
借阅
m
n
(c)
图 1-6 实体间的联系
38 38
yi
(a) 1 :1
(b) 1 :n
(c) m :n
39 39
1.3 数据模型
m n借阅
姓名借书证号
职称 出版社
书号
定价
书名
作者借书日期
读者图书
所在学院
图 1-7 图书借阅系统中的 E-R 模型
40 40
图 1-8医生开的处方与药品之间的 E-R 图
41 41
E-R 图设计步骤
( 1 )针对特定用户的应用,确定实体、属性和实体间的联系,画出用户视图的局部 E-R 图。
( 2 )综合各个用户的局部 E-R 图,产生反映数据库整体概念的总体 E-R 图。
42 42图 1-9 学生管理系统中的 E-R 模型
n
小组长
1
m
选修
成绩
课程 班级
讲授
教师 参考书
l
学生 组成 n
1m
n
43 43
1.3 数据模型 数据模型 概念模型只是将现实世界的客观对象抽象为某种信息结构,这种信息结构并不依赖于具体的计算机系统,而对应于数据世界的模型则由数据模型描述,数据模型是数据库中实体之间联系的抽象描述即数据结构。
数据模型
数据世界记录 ,数据项
信息世界实体 , 属性
常见的数据模型:层次数据模型、网状数据模型、关系数据模型。
44 44
树叶
树 枝根
通过树形结构表示实体及联系。如描述学校管理机构。每个结点表示一个实体(型),箭头表示实体(型)间的联系(由父到子)。
( 1 ) 层次数据模型
45 45
非根
根
层次数据模型主要特点:有且仅有一个根结点;每个非根结点有且仅有一个父 (直接上层 )结点。它最适合表示实体的一对多联系。
46 46
图 1-10 医院层次数据模型
47 47
根多个父
结点
通过网状结构表示实体及联系。“网”中每个结点表示一个实体 ( 型 ) ,结点之间箭头表示实体 ( 型 ) 间的联系。
网状数据模型主要特点:网状数据模型可能有多个根结点,某些非根结点可能有多个父结点,适合表示实体的多对多联系。
( 2 ) 网状数据模型
48 48
图 1-11 医生处方与药品网状数据模型
49 49
层次与网状模型优缺点 :
优点 :能直观、形象地描述实体及其联系,易于被人们所理解和掌握 。
缺点 :数据结构较复杂,存储数据需要更多的链接指针;在检索数据时,需要考虑数据的存储路径;在插入或删除数据时,涉及到调整链接指针。
50 50
关系模型与层次模型和网状模型相比有着本质的差别,它是用二维表格来表示实体及其相互之间的联系。
( 3)关系数据模型
编号 姓名 性别 婚否 出生日期 职称 基本工资 简历
23101 张伶俐 女 已婚 09/24/56 教授 1380
23102 罗稼宛 男 已婚 11/27/73 讲师 560
23103 黎达仁 男 未婚 12/23/81 助教 450
23104 顾高粲 男 已婚 01/27/63 副教授 970
23105 黄丹秋 女 未婚 07/15/79 助教 480
表 1-1 教师关系
51 51
一个关系就是没有重复行和重复列的二维表,二维表的每一行在关系中称为元组,每一列在关系中称为属性。学生关系的每一行代表一个学生的记录,每一列代表学生记录的一个字段。属性个数( n)称为关系的元。
属性信息 JSBH XM CSRQ XB ZC ZZF BGDH ZZDH YDDH103601 李晓光 1960-5-1 1 3 TRUE 8922331 5166123 13019298657103621 李敏 1970-1-12 2 2 TRUE 8456721 5660304 13809228127106723 赵丹茹 1945-12-3 2 5 FALSE 8499213 13019876502105721 张大伟 1957-3-11 1 4 TRUE 8426115 8499212 13902125631
值的集合
9 元关系
52 52
1.4 数据库新技术分布式数据库 分布式数据库系统是地理上分布在计算机网络的不同结
点,逻辑上属于同一系统的数据库系统。分布式数据库的主要特点是:
数据是分布的
数据是逻辑相关的
结点的自治性
53 53图 1-10 一个分布式数据库应用系统实例
全国票务中心
54 54
1.4 数据库新技术多媒体数据库 能存储和管理多种媒体的数据库称为多媒体数据库。多媒体数据库对数据库管理系统的功能要求:
要求数据库管理系统能方便地描述和处理具有内部层次结构的数据。
要求数据库管理系统提供由用户定义的新的数据类型和相应操作的功能。
要求数据库管理系统能够提供更灵活的定义和修改模式的能力。
要求数据库管理系统提供对多媒体信息管理中特殊的事务管理与版本控制能力。
55 55
1.4 数据库新技术工程数据库 所谓工程数据库是
指在工程设计中,主要是 CAD/CAM 中所用到的数据库。由于在工程中的环境和要求不同,工程数据库与传统的信息管理中用到的数据库有着很大的区别。
应用程序
方法库 图形系统
DBMS
数据库
图 1-11 工程数据库的应用环境
56 56
1.4 数据库新技术面向对象数据库 面向对象数据库系统 (Object-Oriented Database System ,
OODBS) 是将面向对象的模型、方法和机制,与先进的数据库技术有机地结合而形成的新型数据库系统。
它从关系模型中脱离出来,强调在数据库框架中发展类型、数据抽象、继承和持久性。
57 57
1.4 数据库新技术数据仓库技术 数据仓库、联机分析处理( OLAP :online analytical processing )
和数据挖掘是作为三种独立的信息处理技术出现的。数据仓库用于数据的存储和组织, OLAP 集中于数据的分析,数据挖掘则致力于知识的自动发现。它们都可以分别应用到信息系统的设计和实现中,以提高相应部分的处理能力。
人们对数据的处理需求可以分为两种类型,操作型处理( OP )和分析型处理( AP ),传统的数据库主要是面向 OP ,注重数据的计算、记录的插入、删除、与修改,以及简单的查询和统计。
联机事务处理( OLTP )Moore 定理 : 计算处理能力每十八个月翻一倍。 Gilder 定理 : 全球通讯系统的带宽每 12 个月翻 3倍。 Shugart 定理 : 磁存储器件的价格每 18 个月下降一半。
58 58
本章小结(1) 关于数据库的几个概念:数据库是存储在计算机内的有结构的数
据集合;数据库管理系统是一个软件,用以维护数据库、接受并完成用户对数据库的一切操作;数据库系统指由硬件设备、软件系统、数据库和管理人员构成的一个运行系统。
(2)E-R 模型:在 E-R 模型中,现实世界被划分成一个个实体,由属性来描述实体的性质。除了实体和属性外,构成 E-R 模型的第三个要素是联系。实体之间通过联系相互作用和关联。实体间的联系有三种:一对一 (1:1) 、一对多 (1:n) 和多对多 (m:n) 。
(3) 数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。
(4) 数据库系统在不断发展之中,目前涌现出了许多不同类型的新型数据库系统 。例如分布式数据库、多媒体数据库、工程数据库、面向对象数据库和数据仓库技术等。