管 理 信 息 系 统
DESCRIPTION
管 理 信 息 系 统. 北京师范大学 经济与工商管理学院 2006 年 9 月. 第四章 计算机技术基础. 计算机系统 计算机硬件 计算机软件 通信与网络 数据资源管理技术. 掌上电脑 (2000). ENIAC (1946). 计算机的发展. 计算机的产生(现代史) 1945 年 , 美国数学家冯 . 诺依曼博士发表 《 电子计算工具逻辑设计 》 论文,提出二进制表达方式和存储程序控制计算机构想。 - PowerPoint PPT PresentationTRANSCRIPT
管 理 信 息 系 统管 理 信 息 系 统
北京师范大学经济与工商管理学院
2006 年 9 月
第四章 第四章 计算机技术基础计算机技术基础
计算机系统计算机系统 计算机硬件 计算机软件 通信与网络 数据资源管理技术
计算机的发展计算机的发展 计算机的产生(现代史)
– 1945 年 , 美国数学家冯 . 诺依曼博士发表《电子计算工具逻辑设计》论文,提出二进制表达方式和存储程序控制计算机构想。– 1946 年 , 美国宾西法尼亚大学研制成功电子数字计算机 ENIAC 。重 28 吨,耗电 150kW ,占地 170 平米,用电子管 18000 个,每秒 5000 次加法。
ENIAC (1946) 掌上电脑 (2000)
计算机的发展(计算机的发展( cont.cont. )) 按照计算机规模,并参考其运算速度、输入输出能力和存储能力
– 巨型机 一般用在国防和尖端科学领域,比如如核武器和反导弹武器的设计、空间技术、石油勘探、长期天气预报以及社会模似等领域。 世界几家公司生产,最快万亿次 / 秒, Cray-1,Cray-2,Cray-3, 国产银河 I, 银河 II, 银河 III……
– 大型主机 大中型企事业单位作为计算中心的主机使用,统一调度主机资源 代表产品有 IBM360 , 370 , z9 等。
– 小型机 可以满足部门性的需求,供小型企事业单位使用 典型产品有 IBM-AS/400 , DEC-VAX 系列,国产太级
– 微型机 个人或家庭使用, PC 机 / 个人计算机,价格低廉
按照工作模式– 服务器
可供网络用户共享的、高性能的计算机– 工作站
高档微机,配有大容量主存、大屏幕显示器,适合 CAD/CAM.
计算机的运算基础(计算机的运算基础( cont.cont. )) 数字化信息编码的概念:
– 信息:数值、文字、语音、图形和图像。– 在计算机内一切信息必须进行数字化编码(即用二进制代码形式),才能在机内传送、存储和处理。
计算机中– 位( bit )是最小的数据单位,只能存放一个二进制的“ 0” 或“ 1”– 字节( byte )是一组长度固定为 8 的二进制位的集合,一般一个字节可以存放一个字符
数值的构成– 一个数值各位数字(数码)表示的值不仅与该数字有关,且与所在位置有关。
数位是指数码在一个数中所处的位置; 基数是指在某种进位计数制中,每个数位上所能使用的数码的个数; 位权是指一个固定值,是指在某种进位计数制中,每个数位上的数码所代表的数值的大小,等于在这个数位上的数码乘上一个固定的数值,这个固定的数值就是这种进位计数制中该数位上的位权。
【例】数 32343.43 可以分解为: 3×104+ 2×103+ 3×102+ 4×101+ 3×100+ 4×10 -1+ 3×10 -2
位权 位权 位权 位权 位权 位权 位权
计算机的运算基础(计算机的运算基础( cont.cont. )) K 进制数转换为十进制数
– 位权展开法【例一】将下列数值转换为十进制数 (101.01)2 (205.4)8 (AF.8)16 解: (101.01)2= 1×22 + 0×21 + 1×20 + 0×2 -1 + 1×2-2 =(5.25)10 (205.4)8= 2×82 + 0×81 + 5×8 0 + 4×8 –1 =(133. 5)10 (AF.8)16= 10×16 1 + 15×160 + 8×16 -1 =(175. 5)10【思考】以下数值中最大的和最小的分别是哪个? ① (1234)8 (1234)16 (1234)5 (1234)10 ② (11011011)2 (219)16 (210)8 (219)10
计算机的运算基础(计算机的运算基础( cont.cont. )) 十进制数转换为 K 进制数
计算机的运算基础(计算机的运算基础( cont.cont. )) 字符(数码、符号、汉字)编码ASCII 码(美国标准信息交换码) 常用西文字符( 128 个)的二进制编码 (注: ASCII 编码的基本和扩展字符集中共有 256 个字符。) 每个字符用标准规定的 7 位二进制数表示,在机内则占一个字节(最高位为0 )。 如字符“ A” 的 ASCII 码为: (01000001)2 或 6510、 1018、 4116
字符“ 0” 的 ASCII 码为: (00110000)2 或 4810、 608、 3016
空格< 0~ 9< A ~ Z < a~ z
计算机的运算基础(计算机的运算基础( cont.cont. ))
计算机的运算基础(计算机的运算基础( cont.cont. )) 字符(数码、符号、汉字)编码
•汉字编码(由 GB2312-80规定,即国标码) 共对 6763 个常用汉字的二进制编码作了规定。 其中:一级汉字 3755 个,按拼音排序(最常用字) 二级汉字 3008 个,按偏旁部首排序(次常用字)国标码规定,每个汉字用两个七位二进制代码表示,在机内则用两个字节表示。
计算机系统 计算机硬件计算机硬件 计算机软件 通信与网络 数据资源管理技术
输输入入设设备备 控制器控制器
输输出出设设备备
CPU
存储器存储器
运算器运算器 ALUALU
计算机的硬件系统计算机的硬件系统 计算机的硬件系统是由运算器、控制器、存储器、输入设备和输出设备五个部分组成。
中央处理器中央处理器 微处理器一般功能
– 进行算术逻辑运算– 可接收和发送数据– 可暂存少量数据– 提供控制信号– 对指令解码
中央处理器(中央处理器( cont.cont. )) CPU 的发展(自学)
– 辅助处理器– 对偶处理器– 并行处理器– RISC 处理器– MMX 处理器– Pentium 系列
存储系统存储系统 存储器分类
半导体存储器
随机存储器RAM
双极型RAM
MOS型RAM
动态RAM
静态RAM
只读存储器ROM 可擦式EPROM可编程PROM掩膜式ROM
电可擦式EPROM闪速Flash ROM
半导体存储器分类
存储系统(存储系统( cont.cont. )) 主存储器
– 只读存储器( ROM )
– 随机存储器( RAM )
存储系统(存储系统( cont.cont. )) 二级存储器
– 磁盘、磁带、光盘
输入输入 // 输出设备输出设备 输入设备
– 键盘、扫描仪、鼠标 输出设备
– 打印机、显示器 视频 声音识别 光和磁识别
计算机系统 计算机硬件 计算机软件计算机软件 通信与网络 数据资源管理技术
软件的概念软件的概念 软件分为两类:
– 系统软件:管理与支持计算机系统资源及操作的程序,是计算机硬件和应用程序之间重要的软件接口。– 应用软件:综合用户信息处理需求的、直接处理特定应用的程序。– 系统层次结构图
硬件系统软件应用软件
计算机用户
系统软件(系统软件( cont.cont. )) 操作系统
– 是一台计算机最基本、最重要的软件包,它控制 CPU 的操作,控制计算机系统的输入 /输出,资源的分配,为应用程序提供各种服务与接口。– 五大功能:
用户界面 资源管理 任务管理 文件管理 实用程序与支持服务
系统软件(系统软件( cont.cont. )) DOS
– 曾经是 PC 机上最常用的操作系统,以简单、可靠赢得了广大用户的青睐。但由于未能紧跟计算机硬件技术的发展,最终退出了历史舞台。– 与我们现在使用的操作系统最大的区别在于,它是命令行形式的,靠输入命令来进行人机对话,并通过命令的形式把指令传给计算机,让计算机实现操作的。
Windows95, -98, -2000, XP– 是一个全新的 32 位 PC 机操作系统,它充分利用了 PC硬件技术发展的新成果,在支持原有 16 位应用的基础上,把 PC操作系统技术向前推进了一大步。
系统软件(系统软件( cont.cont. )) UNIX 系统
– 经过 20多年的锤炼,以高可靠性、高效率和强大的 TCP/IP支持、支持并行处理和多处理器和独有的 64 位计算使其成为企业级应用的首选。
LINUX– 秉承了 UNIX 系统的优秀特性,以可靠、高效和近乎为零的使用成本而成为一种重要的操作系统。
系统软件(系统软件( cont.cont. )) Windows NT
– 继承了微软公司 Windows 系列操作系统的优良特性,是一种可移植性好,支持多种硬件平台,功能强大,可靠性好、灵活性高的企业级操作系统。它采用了先进的操作系统技术,如虚存管理、优先权多任务、结构化异常处理和操作系统对象等,支持对称式多处理器,提供了Windows 图形用户界面,兼容 WIN32 程序、 16 Windows 程序、 MS-DOS 程序、 POSIX 程序和 OS/2 程序等。Windows NT 以其灵活、强大的功能和稳定可靠的性能成为了目前最为重要的操作系统之一
程序设计语言程序设计语言 机器语言。特点:
– 采用二进制代码– 指令随机器而异– 效率高,执行速度快– 编程繁琐,工作量大,不直观
汇编语言 高级语言
– 更接近自然语言,一般采用英语表达,便于理解、记忆、掌握。– 高级语言编写的程序短小,易于编写、调试。– 可移植性强。– 高级语言不能被计算机直接识别和执行,必须先翻译成用机器指令表示的目标程序。翻译的方式有两种:
解释执行 编译执行
FORTRAN
Processing numeric data; scientific, engineering programs
BASIC Used for teaching
Pascal Used primarily for teaching programming
COBOL Business administration; alphanumeric processing
C Operating systems; application software
C++ Object-oriented; application software
Visual Basic
Visual tool; Windows applications
程序设计语言(程序设计语言( cont.cont. )) 第四代语言( 4GL )
– 是一种十分接近英语和其他人类语言的自然语言 面向对象的语言
PC software tools
General-purpose packages WordPerfect, Microsoft Access
Query language
Retrieve data stored in databases or files; SQL
Report generator
Retrieve data, more formatting control; Crystal Reports
Graphics language
Retrieve data, graphics format; SAS Graph; SystatApplication
generatorPreprogrammed modules; FOCUS, MS FrontPage
Application software package
Commercial software replacing need for custom, in-house software; PeopleSoft HCM, SAP R/3
Very high-level programming language
Generate code with fewer instructions; productivity tool for programmers; APL, Nomad2
程序设计语言(程序设计语言( cont.cont. )) 程序设计工具
– 集成开发环境(简称 IDE )软件是用于程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面工具。– 该程序可以独立运行,也可以和其它程序并用。
Microsoft visual studio .net/6.0 Build c++5.0 Dephi 6.0 JBuild6.0 PowerBuilder Eclips
计算机系统 计算机硬件 计算机软件 通信与网络通信与网络 数据资源管理技术
通信系统通信系统 通信的定义
– 利用通信设备和线路将地理位置不同的,功能独立的多个计算机系统互联起来,以功能完善的网络软件(即网络通信协议、信息交换方式及网络操作系统)实现网络中资源共享和信息传递的系统。 计算机网络:由两个或者两个以上 IT 部件(通常指计算机)组成的连接。 远程通信:信息从一个地点向另一个地点的电子化传输。
..微机(甲地)..远程通信处理器 远程通信信道和介质 计算机(远程通信软件)
通信系统(通信系统( cont.cont. )) 计算机通信网络的演变和发展
– 第一代——远程联机系统 终端+终端控制器+前端处理机+主机
主计算机
前端处理机
TC
TC
…...
…...
…...
…... TC
多路器终端控制器
通信系统(通信系统( cont.cont. )) 计算机通信网络的演变和发展
– 第二代——多计算机互联(典型: ARPANET ) 采用存储转发方式。 通信子网:
– IMP 和它们之间互联的通信线路一起负责完成主机之间的通信任务,构成通信子网。 资源子网:
– 通过通信子网互联的主机负责运行用户应用程序,向网络用户提供可供共享的软硬件资源,组成资源子网。
IMP
IMP
IMP
IMP
IMP
IMP
H
H
H
H
H
H
H
H— 主机 IMP— 接口报文处理机
通信系统(通信系统( cont.cont. )) 计算机通信网络的演变和发展
– 第三代—— 国际标准化的网络,具有统一的网络体系结构、遵循国际标准化的协议。其互联的国际标准为 ISO7498 。该模型也称 OSI七层模型。 新兴的计算机通信网络模式
– 客户端 / 服务器模式
通信部件及其功能通信部件及其功能 通信信道的特征
– 传输速率:以带宽衡量,决定了通道最大的数据传输率,单位是bps (位 / 秒)。
– 传输模式:同步传输与异步传输。– 传输方向:单工、半双工、全双工。– 交换选择:
线路交换 报文交换 分组交换
– 介质访问控制方式 竞争方式( CSMA/CD ) 令牌通行
通信部件及其功能(通信部件及其功能( cont.cont. )) 通信介质
– 通信介质是通信网络中发送方和接收方之间的物理通路。分为有线和无线两大类。– 双绞线:
10M 、 100M ,距离 100m之内。– 同轴电缆:
细缆( 50欧)、粗缆( 75欧) ;10M ,细缆传输距离几公里,宽带传输距离几十公里。– 光纤:
几千Mbps ,传输距离几十、上百公里。– 无线传输媒体:
微波、红外线、激光、卫星。
通信部件及其功能(通信部件及其功能( cont.cont. )) 通信处理机及其功能
– 调制解调器( MODEM ): 将数字信号和模拟信号互相转换的设备。
– 多路复用器: 为了有效的利用传输系统,采用多路复用技术能把多个信号组合起来在一条物理电缆上进行传输,实现这种功能的设备叫做多路复用器。
– 频分多路复用频分多路复用 FDMFDM– 时分多路复用时分多路复用 TDMTDM
– 交换机– 网络互联设备
中继器 桥接器 路由器 网关
通信部件及其功能(通信部件及其功能( cont.cont. )) 通信软件
– 功能: 存取功能 传送控制 网络管理 出错控制 安全管理
网络协议:– 协议是两台计算机之间进行通信必须遵循的一组规则。
通信部件及其功能(通信部件及其功能( cont.cont. )) OSI 参考模型网络结构
应用层应用层表示层表示层对话层对话层传输层传输层网络层网络层数据链路层数据链路层物理层物理层
交换单元名称交换单元名称信息信息信息信息信息信息信息信息信息分组信息分组帧帧位位
主机主机 AA 主机主机 BB
应用层应用层表示层表示层对话层对话层传输层传输层网络层网络层
数据链路层数据链路层物理层物理层
路由选择路由选择 TCP/IPTCP/IP
通信部件及其功能(通信部件及其功能( cont.cont. ))物理层的主要功能: 利用传输介质为通信的网络结点之间建立、管理和释放物理连接; 数据的单位称为比特( bit )。数据链路层的主要功能: 在通信的实体间建立数据链路连接 传输以“帧”为单位的数据包;网络层的主要功能: 通过路由选择算法为分组通过通信子网选择最适当的路径; 为数据在结点之间传输创建逻辑链路; 实现拥塞控制、网络互连等功能。 数据的单位称为数据包( packet)。
通信部件及其功能(通信部件及其功能( cont.cont. ))传输层的主要功能: 传输层是第一个端到端,即主机到主机的层次。负责将上层数据分段并提供可靠端到端服务;
– 为不同主机上的应用程序进程提供逻辑通信– 与网络层的区别
会话层的主要功能: 管理主机之间的会话进程,即负责建立、管理、终止进程之间的会话表示层的主要功能: 对上层数据或信息进行变换以保证一个主机应用层信息可以被另一个主机的应用程序理解。应用层的主要功能 : 为操作系统或网络应用程序提供访问网络服务的接口
通信部件及其功能(通信部件及其功能( cont.cont. ))
7
6
5
3
4
2
1
7
6
5
3
4
2
1
PA PB数据P
数据PPDU7
SDU6
PDU6
SDU5
PDU5
SDU4
SDU3
SDU2
帧1101001010011……比特流……1011010111001
PCI7
PCI22
PCI6
PCI5
PCI4
PCI3
PCI21
报文
帧
分组
PDUi 第i层协议数据单元 SDUi 第i层服务数据单元 PCI 第i层协议控制信息
通信部件及其功能(通信部件及其功能( cont.cont. )) TCP/IP
– Internet 上共同的规则,也可以称为因特网模型– 协议组– 为实现美国本土广域互联网 APARNet而开发的通信传输协议
应用层
表示层
会话层
传输层
网络层
数据链路层
物理层
应用层 (Application Layer)
传输层 (Transport Layer)
网络层 (Internet Layer)
网络接入层 (Host-to-network Layer)
OSI模型 TCP/IP模型
E-mail, HTTPTELNETRPC with XDR
TCPUDP
IP
[PPP, SLIP]LLCMAC
通信网络的分类与应用通信网络的分类与应用 网络拓扑结构分为两大类
– 点到点 星形结构 环形结构 树形结构 网状结构
– 广播式 总线结构 卫星和无线电
通信网络的分类与应用(通信网络的分类与应用( cont.cont. )) 局域网
– 以太网( Ethernet ): 802.3协议( CSMA/CD );采用星形或者总线拓扑结构。
– 客户机 / 服务器结构: 客户机运行本地应用软件,向服务器发出关于数据处理的请求;服务器收到请求后,进行相应的数据处理,然后将结果发送给客户机,由客户机将结果显示给用户。 优点:
– 支持多种关系数据库支持多种关系数据库– 支持多种机型和操作系统支持多种机型和操作系统– 合理利用资源合理利用资源– 容易做到数据共享容易做到数据共享– 易于维护和升级易于维护和升级
通信网络的分类与应用(通信网络的分类与应用( cont.cont. )) 广域网
– 分布队列双总线 DQDB 网: 高性能、双总线光纤城域网,数据传输速率高于 40Mbps ,传输距离达 50km 。其结构由网络节点和两条方向相反的单向光纤构成。【参见 133页图 9.14 】
– X.25 公用网: 采用分组交换线路,在公共数据网上以分组形式工作。实现了 OSI七层协议中的物理层、数据链路层、网络层。
– Internet/Intranet : 运行公共的通信协议 TCP/IP ,把各个国家、区域网连成一个覆盖全球的网络系统,在网上提供丰富的共享资源和广泛的应用服务。
– 综合服务数字网( ISDN ): ISDN 的中心思想是全数字化:电话、传真、电视等全是数字设备,传输的信息不再有模拟信号,而是数字脉冲。这样所有的设备可以共享同一个网络,实现互联互通。
通信管理通信管理 通信管理在管理中的应用
– 影响效果: 1 )压缩时间; 2 )降低地理位置限制; 3 )重组关系声音通信 数据通信 消息通信 信息抽取 影像传送 监控和控制
电话 联机事务 电子邮件 目录检索 影像处理 处理控制声音邮件 查询 /应答 计算机会议 数据库服务 传真 设备监控声音识别 硬 /软件共享 BBS 电视 安全监视
数据传送 可视通信协同处理
POS
EDI
通信管理(通信管理( cont.cont. )) 通信网络的发展趋势
– 通信网络是 竞争武器 组织的一种联络手段 重要的技术投资
– 通信网络是企业一个重要的复杂决策领域 一个企业的通信已不再局限于办公室电话和长途电话范围,而是属于公司主架结构中的一部分。 同样也是计算机信息系统集成中的一部分,用于降低成本,改进生产过程,共享资源,锁定顾客和供应商,发展新产品和服务。
– 通信网络产生的附加值
通信管理(通信管理( cont.cont. )) 开发通信网络决策
– 企业目标有多少依赖通信技术
计算机系统 计算机硬件 计算机软件 通信与网络 数据资源管理技术数据资源管理技术
文件组织(文件组织( cont.cont. )) 文件的管理观
– 大量的企业数据不可能存放在主存中
– 某一时刻,企业只使用其中的一部分数据
– 企业的数据一般以文件形式组织起来
分类– 按存储介质
光盘文件 磁盘文件 打印文件
– 按文件在信息系统中所执行的功能 主文件 事务文件 报告文件 工作文件 程序文件
人们总是以文件为单位,操纵数据库中的数据。
文件组织文件组织 数据组织的层次
– 人们需要用数据来进行决策和采取行动 如果这些数据能够在限定的时间内被检索处理,这些数据就产生了价值,成为信息。因此需要将数据有序的组织起来,才能对数据进行有效的处理。
– 数据的逻辑组织有四个基本的逻辑元素: 数据项 记录 文件 数据库
文件组织(文件组织( cont.cont. )) 数据组织的相关概念
– 数据项 是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。
– 记录 与数据处理的某一对象有关的一切数据项构成了该对象的一条记录。标识记录的数据项称为关键项。
– 文件 相关(同类)记录的集合称为文件。
– 数据库 按一定方式组织起来的逻辑相关的文件集合形成数据库。
文件组织(文件组织( cont.cont. )) 数据组织的层次
数据库
文件 1 文件 2 文件 n文件 n-1
记录 1 记录 2 记录 n-1 记录 n
数据项 1 数据项 2 数据项 n-1 数据项 n
…...
…...
…... 姓名、性别等
若干学生
学生文件学生数据库
文件组织(文件组织( cont.cont. ))
文件组织(文件组织( cont.cont. )) 文件组织形式
– 建立并确定数据记录的物理顺序和逻辑顺序之间的对立关系。
逻辑逻辑数据记录数据记录 物理物理存储方式存储方式顺序文件顺序文件索引文件索引文件链表文件链表文件倒排文件倒排文件
顺序映射关系顺序映射关系
文件组织(文件组织( cont.cont. )) 顺序文件
– 文件中数据记录的物理顺序与逻辑顺序一致,文件记录按关键字值的递增(或递减)次序排序,形成其逻辑顺序。
870001 张三 456870002 李四 645870003 王五 587870004 孙六 676870005 钱七 565…… …… ……
12345
……
文件记录文件记录 物理设备物理设备
关键字值关键字值 相对磁道相对磁道
文件组织(文件组织( cont.cont. )) 索引文件
– 具有索引表的文件称为索引文件。索引文件索引文件
主文件主文件 索引表索引表
数据记录区数据记录区 索引区索引区
记录原始信息记录原始信息 记录关键字记录关键字 ++ 记录地址记录地址
组成组成
映射映射
加工加工
文件组织(文件组织( cont.cont. )) 举例
记录地址 学号 姓名 成绩A 870005 张三 456B 870002 李四 645C 870001 王五 587D 870004 孙六 676
E 870003 钱七 565
主关键字(学号) 记录地址870001 C870002 B870003 E870004 D870005 A
主文件 索引表
关键字学号与学生记关键字学号与学生记录地址的对应表录地址的对应表
文件组织(文件组织( cont.cont. )) 链表文件
倒排文件– 带有辅索引或倒排索引的文件称为倒排文件
记录记录 记录记录 记录记录 记录记录 ^̂入口
数据库技术数据库技术 传统文件处理系统
存在问题– 数据冗余与数据不一致性– 数据结构的不一致,数据联系弱– 缺少数据字典,缺少灵活性
应用程序应用程序 11 数据文件数据文件 11
应用程序应用程序 22
应用程序应用程序 33
数据文件数据文件 22
数据文件数据文件 33
用户用户用户用户用户用户
数据库技术(数据库技术( cont.cont. )) 银行文件处理系统
客户财务客户财务报表报表
分期贷款程序
帐户核对处理
存款处理
分期贷款处理 贷款分析贷款分析报告报告
客户票据客户票据
存款文件修改
文件修改核对帐户核对程序
分期贷款文件修改
存款程序
客户交易客户交易客户交易客户交易
数据库技术(数据库技术( cont.cont. )) 数据库处理系统
优点– 完善的数据字典和数据模型– 数据独立性– 方便的接口– 完整的数据控制功能– 提高了系统的灵活性
应用程序应用程序 11
应用程序应用程序 22
应用程序应用程序 33
DBMSDBMS
数据库中央数据库
用户用户用户用户用户用户
数据库技术(数据库技术( cont.cont. )) 银行数据库处理系统
客 户 交 易 处 理客 户 交 易 处 理
数 据 库 管 理 系 统数 据 库 管 理 系 统
核对帐户程序 存款帐目程序 分期贷款程序
客户数据库
..查询
数据库技术(数据库技术( cont.cont. )) 数据库管理系统( DBMS )功能
– DBMS 是一组计算机程序,控制组织和用户的数据库的生成、维护和使用。具有以下功能:
– 数据库开发– 数据库查询– 数据库维护– 应用与开发
..
操作系统数据库管理系统应用程序
数据库 数据字典用户
数据库技术(数据库技术( cont.cont. )) 数据库管理系统( DBMS )
– 数据库开发: 利用数据定义语言( DDL )开发与说明数据内容、相互关系及每个数据库的结构。并把这些信息存储在一个专用的数据定义和说明的数据库中,称为数据字典。数据字典由数据库管理员控制、管理和维护。
– 数据库查询: 用户使用 DBMS 的查询语言询问数据库中的数据。最常用的查询语言是结构化查询语言( SQL )。
– 数据库维护– 应用开发
数据库技术(数据库技术( cont.cont. )) 数据库有哪些类型?
– 企业数据库的种类 操作数据库 管理数据库 信息仓库 分布式数据库 外部数据库
– 文本数据库– 多媒体数据库
数据库技术(数据库技术( cont.cont. )) 数据库模型
– 模型功能 使数据以记录的形式组织在一起,综合反映各种业务信息,既综合又没有冗余。 模型能反映用户各业务信息所存在的内在联系,而且与 DBMS 数据模型一致。
– 模型的类型 网状型 层次型 关系型(目前最流行的是关系型数据库)
数据库技术(数据库技术( cont.cont. )) 数据库系统的三级模式
– 模式 即逻辑模式。是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
– 外模式 用户模式或者子模式。是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。
– 内模式 物理模式或者存储模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示方法。
数据库技术(数据库技术( cont.cont. )) 数据库系统的三级模式(图)
物理模型内模式
用户 A 用户 B 用户 D 用户 E
外模式 1 (子模式 1 ) 外模式 2 (子模式 2 )
概念模型(模式)DBMS
OS
子模式 /概念模式映射 A子模式 /概念模式映射 B
模式 / 内模式映射
数据库技术(数据库技术( cont.cont. )) 数据库的二级映射
– 外模式 / 模式映射: 当模式改变时,使外模式保持不变,从而应用程序不变,保证了数据与程序的逻辑独立性。
– 模式 / 内模式映射: 当数据库存储结构改变,使模式保持不变,从而应用程序不变,保证了数据与程序的物理独立性
数据库技术(数据库技术( cont.cont. )) 数据库数据的存取过程
应用程序应用程序 AA
用户工作区用户工作区 状态码状态码
系统缓冲区系统缓冲区
数据库数据库 OSOS
DBMSDBMS
物理数据库描述物理数据库描述
概念模式概念模式
应用程序应用程序 AA 的子模式的子模式
数据库技术(数据库技术( cont.cont. )) 信息的转换
客观 事物类:事物 相关性质集合 人 实体 实体集合及 实体联系 相关属性集合
加工、转换
数 文件据 记录库 相关数据项集合加工转换
存储 二进制数据集合结构计算机世界 DBMS 数据世界
DBMS的数据模型
信息世界认识选择描述现实世界
E-R 模型
数据库技术(数据库技术( cont.cont. )) 三个不同世界术语
– 客观世界 信息世界 数据世界组织(事物及其联系) 实体及其联系 数据库(概念模型)事物类(总体) 实体集 文件事物(对象、个体) 实体 记录特征(性质) 属性 数据项
实体及其联系实体及其联系 概念模型概念模型E—RE—R 图图
E-RE-R 信息模型的设计与应用信息模型的设计与应用 E-R 图描述现实世界的概念模型
– 实体:
– 属性:
– 联系: 一对一联系 一对多联系 多对多联系
实体集实体集
属性属性
联系集联系集 线段
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) E—R 图设计原则
– 真实性原则– 避免冗余原则– 简单性原则– 合适性原则(用实体或属性或联系集)– 注意对客观对象的约束
映射约束、键码约束、参照完整性约束
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) 实体( Entity):
– 是一个有着一系列显著的、易辨认的属性的对象。– 实体可以是具体的(物体、人物等。)– 实体也可以抽象的(事、概念、事物之间的联系)
确定实体的指导– 找出问题中的大模块– 问题陈述中的名词
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) 属性( Attribute)
– 实体的特性 ,它描述了实体的一个部分。– 一个实体可由若干个属性来刻画。
如学生(学号,姓名,性别,……) 码( Key):
– 唯一标识实体的属性集。 如:学号为学生的码。
确定属性的指导– 可能将名词当作属性 ,但不应将其和实体混淆 .
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) E—R 图绘制
图书图书 作者作者写作写作
出版社出版社
类别类别页数页数ISBNISBN
书名书名
姓名姓名出生地出生地身份证号身份证号
定稿时间定稿时间
价格价格 包含实体集“图书”和“作者”的包含实体集“图书”和“作者”的 E—RE—R 图图
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) E—R 图向关系数据模型的转换
– 1 、 E—R 图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。– 2 、对于“联系集”,根据联系方式不同,采取不同手段以使被它联系的实体所对应的关系彼此实现某种联系。
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) E—R 图向关系数据模型的转换转换过程示意图
E-RE-R 图图 关系模型关系模型DBMSDBMS
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) E-R 图的转换
– 将 E-R 图转换成相应的表 表是行和列的集合,实体被表示成表的形式。 用列标题表示实体的属性 用行表示关于实体的实际数据
关于表和属性的命名规则– 属性名和表名中不能包含空格– 表名对实体的描述应该是有意义的。
如 student(cStuID,cStuName,nStuAge,……)– 表名只能描述一个主题
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) 转换举例一
厂长号厂长号 姓名姓名 年龄年龄
厂长厂长厂号厂号 厂名厂名 地点地点
工厂工厂管理管理11 11
厂长(厂长号,厂号,姓名,年龄)工厂(厂号,厂名,地点)
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) 转换举例二
仓库号仓库号 地点地点 面积面积
仓库仓库货号货号 品名品名 价格价格
产品产品存放存放11 nn
仓库(仓库号,地点,面积)产品(货号,品名,价格,仓库号,数量)
数量数量
E-RE-R 信息模型的设计与应用(信息模型的设计与应用( cont.cont. )) 转换举例三
学号 姓名 年龄
学生
课程号 课程名 学时数
课程学习n n
学生(学号,姓名,年龄)课程(课程号,课程名,学时数)
成绩
学习(学号,课程号,成绩)
数据库设计规范化数据库设计规范化 数据库设计规范化——范式理论篇
– 必要性:解决在关系模式设计时,存在的数据存储异常现象:数据冗余、修改异常、插入异常、删除异常等。ISBN 书名 页数 价格 出版社 作者
7-04-001968-O.719 概率论 403 5.8 高教出版社 盛聚7-04-001968-O.719 概率论 403 5.8 高教出版社 谢式千7-111-06887-4 可靠性模型与应用 270 19.0 机械工业出版社 蒋仁言7-111-06887-4 可靠性模型与应用 270 19.0 机械工业出版社 左明健7-5327-1224.9/1.717 基督山伯爵 1428 18.0 止海译文出版社 大仲马7-5237-1224-9/1.321 三个火枪手 982 16.7 上海译文出版社 大仲马
数据库设计规范化(数据库设计规范化( cont.cont. )) 第一规范型:
– 如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该 模式是属于第一规范型( First Normal Form , 即 1NF )。
姓名 地址省 市 街道 邮编
甲 江苏 南京 卫岗 210095
数据库设计规范化(数据库设计规范化( cont.cont. )) 第二规范型:
– 如果一个关系模式属于 1NF ,并且所有的非关键字都完全地依赖于关键字(即不存在部分依赖),则称该关系模式属于第二规范型 , 即 2NF 。
A零 件 号
B仓 库 号
C零 件 数 量
D仓 库 地 址
1234
1112
1 0 01 5 02 0 01 5 0
北 区 1 号北 区 1 号北 区 1 号南 区 1 号
数据库设计规范化(数据库设计规范化( cont.cont. )) 第三规范型:
– 如果一个关系模式属于 2NF ,并且不存在非关键字传递地依赖于关键字,则称该关系模式属于第三规范型( 3NF )。职工号 职工 职务 工资1001 张三 工程师 200
1002 李四 技术员 120
1005 王五 高工 350
数据库设计规范化(数据库设计规范化( cont.cont. )) 适当的规范化
规范化程度越高规范化程度越高 数据冗余数据冗余更新异常更新异常连接运算时间连接运算时间查询时间查询时间效率效率