1、第二章第二章 管理信息系统的技术基础管理信息系统的技术基础 信息技术概述 数据处理 数据库技术 计算机网络 MIS标志和MIS的基本使能技术 MIS的出现,强调信息系统功能的集成和一个集成的数据库,而且有一个中心数据库和计算机网络系统是MIS的重要标志。数据库技术和网络技术是MIS的基本使能技术。这一章重点介绍这两种技术。计算机硬件技术 计算机的产生(现代史)1945年,美国数学家冯.诺依曼博士发表电子计算工具逻辑设计论文,提出二进制表达方式和存储程序控制计算机构想。1946年,美国宾西法尼亚大学研制成功电子数字计算机 ENIAC。重28吨,耗电150kW,占地170平米,用电子管18800个
2、,每秒5000次加法。ENIAC(1946)掌上电脑掌上电脑(2000)计算机硬件技术 电子计算机的发展简史第一代 电子管时代(1946-1958)耗电高,体积大,定点计算,机器语言,汇编语言第二代 晶体管时代(1958-1965)变集中处理为分级处理,浮点运算、高级语言第三代 中小规模集成电路时代(1965-1970)存储容量大,运算速度快,几十至几百万次/秒第四代 大规模集成电路时代(1971至今)向大型机和微型机两个方向发展现代计算机发展方向 巨型化,微型化,网络化,智能化,多媒体化计算机硬件技术 计算机的六大分类(1)巨型机世界几家公司生产,最快1.4万亿次,9千个CPU组成。Cray
3、-1,Cray-2,Cray-3,国产银河I,银河II,银河III。小巨型机功能同巨型机相近,价格相对便宜,发展十分迅速。美国Convex公司的C系列机为其代表产品。大型机大中型企事业单位作为计算中心的主机使用,统一调度主机资源。代表产品有IBM360,370,4300等。计算机硬件技术 计算机的六大分类(2)小型机可以满足部门性的需求,供小型企事业单位使用,典型产品有IBM-AS/400,DEC-VAX系列,国产太级 工作站用于特殊的专业领域,例如图象处理和辅助设计等。典型产品有HP-APOLLO,SUN工作站等。微型机个人或家庭使用,PC机/个人计算机,价格低廉计算机硬件技术 计算机的应用
4、领域 科学研究计算密码破译,天气预报,地质勘探,卫星轨道计算 过程控制机器人以及各种自动化装备,温度调节,阀门控制 辅助设计/分析/制造/教学机械CAD,建筑CAD,CAE,CAM,CAI 数据处理数据库管理,企业信息管理,统计汇总、办公自动化 智能模拟人工智能、专家系统、自学习计算机的运算基础 冯.诺依曼机具有如下基本特点 计算机由运算器、控制器、存储器、输入设备和输出设备五部分组成。采用存储程序的方式,程序和数据放在同一存储器中,由指令组成的程序可以修改。数据以二进制码表示。指令由操作码和地址码组成。指令在存储器中按执行顺序存放,由指令计数器指明要执行的指令所在的单元地址,一般按顺序替增。
5、机器以运算器为中心,数据传送都经过运算器计算机的运算基础 诺依曼计算机的工作原理可概述为:“存储程序”+“程序控制”要点:1以二进制表示数据和指令(程序)2.先将程序存入存储器中,再由控制器自动读取并执行 CPU【例】数32343.43可以分解为:31042103310241013100410-1310-2计算机的运算基础 数字化信息编码的概念:信息:数值、文字、语音、图形和图像。在计算机内一切信息必须进行数字化编码(即用二进制代码形式),才能在机内传送、存储和处理。数值的构成 一个数值各位数字(数码)表示的值不仅与该数字有关,且与所在位置有关。位权位权位权位权位权位权位权位权位权位权位权位权
6、位权位权计算机的运算基础 K进制数转换为十进制数 位权展开法【例一】将下列数值转换为十进制数 (101.01)2 (205.4)8 (AF.8)16 解:(101.01)2=12202112002-112-2=(5.25)10 (205.4)8=28208158 048 1=(133.5)10 (AF.8)16=1016 1 15160816-1=(175.5)10【思考】以下数值中最大的和最小的分别是哪个?(1234)8 (1234)16 (1234)5 (1234)10 (11011011)2 (219)16 (210)8 (219)10 Windows 98自带计算器(科学型)适合于整数
7、部份,其他进制向十进制转换时,小数部分亦可用计算机求出。计算机的运算基础 十进制数转换为K进制数计算机的运算基础 十六进制与二进制相互转换 法则:以小数点为界,每个八进制数对应三位二进制数,每个十六进制数对应四位二进制数。【注意】小数部分不足之处应补零【例】【例】(2C1.D)16=(0010 1100 0001.1101)2 2 C 1 D【例】【例】(71.23)8=(111 001.010 011)2 7 1 2 3 【例】【例】(11 0110 1110.1101 01)2=(36E.D4)16 3 6 E D 4计算机的运算基础 二进制数的简单运算(1)算术运算(加减乘除)加法:逢2
8、进1 0+0=0 0+1=1 1+0=1 1+1=10(进位)减法:借1当2 0-0=0 1-0=1 1-1=0 0-1=1(借位)乘法:加法+移位 0*0=0 0*1=0 1*0=0 1*1=1除法:减法+移位 01=0 11=1 例一 1101 +101 10010 例二 1011 101 110例三 1110 101 1110 1110 1000110例四 110 10 1100 10 100 10 0计算机的运算基础 二进制数的简单运算(2)逻辑运算与运算:都是1时才为1,运算符:AB、AB 或 AB或运算:都是0时才为0,运算符:AB、AB非运算:0变1,1变0,运算符:A异或运算:
9、相异为1,运算符:AB 例:设A=1101,B=1001,求:AB、AB、AB、A例一 AB AB 1101 1001 1001 例二 ABAB 1101 1001 1101 例三 ABAB 1101 1011 0110 例四 A A A=0010计算机的运算基础 字符(数码、符号、汉字)编码BCD码(二-十进制编码)每位十进制数码用4位二进制编码表示 如 25=(0010 0101)BCD 比较:(00100101)2=(37)10 十进制数用BCD码表示时,不能直接用于运算或位权展开。ASCII码(美国标准信息交换码)常用西文字符(128个)的二进制编码(P17表1-2)(注:ASCII编
10、码的基本和扩展字符集中共有256个字符。)每个字符用标准规定的7位二进制数表示,在机内则占一个字节(最高位为0)。如字符“A”的ASCII码为:(01000001)2 或 6510、1018、4116 字符“0”的ASCII码为:(00110000)2 或 4810、608、3016要求:会比较ASCII字符的大小(按其ASCII码值)空格09A Z az 会推算同组字符ASCII码值,如A的ASCII值(十进制)为65计算机的运算基础 字符(数码、符号、汉字)编码汉字编码(由GB2312-80规定,即国标码)共对6763个常用汉字的二进制编码作了规定。其中:一级汉字3755个,按拼音排序(最
11、常用字)二级汉字3008个,按偏旁部首排序(次常用字)国标码规定每个汉字用两个七位二进制代码表示,在机内则用两个字节表示(每个字节的最高位置为1)。内码(机内码)与国标码的换算关系:如汉字“啊”,国标码为:0110000 0100001(即3021H)内码则为:10110000 10100001(即B0A1H)外码(输入码):区位码、拼音码、五笔字型码等 汉字点阵(汉字库,用于汉字的打印或显示)占用字节数的计算:一个AB点阵的汉字所占的字节数=AB8 点阵越大,显示精度越好。计算机的运算基础 存储估算【例】GB2312-80中一级汉字为3755个,如果每个汉字字模采用1616点阵,并存放在主存
12、储器中,那么将占用存储器容量多少个字节?假设将汉字显示在屏幕上,一屏24行,每行40字,为保持一屏信息,需存储容量多少字节?解:(16168)3755=120160字节 (16168)24 40=30720字节【例】设一软盘有300kB可用空间,若使用ASCII码存盘,则可存储英文多少个?若存放汉字,则可存储汉字多少个?解:3001024=307200(个)30010242=153600(个)计算机的运算基础 计算机程序的运行 一个CPU能执行什么操作,是工程人员设计和制造时安排好的,是固定的,用户不能改变。程序是用户在使用计算机时,为要解决的问题,用一条条指令编写的指令序列。构成程序的指令在
13、存储器中一般都是顺序存放,要破坏这种顺序性,必须由转移指令操作。计算机的运算基础 计算机程序的运行 指令是CPU能执行的一个基本操作。如:取数、加、减、乘、除、存数 等 计算机能够执行的各种不同类型指令的总和称为该机的指令系统。指令系统决定了计算机的功能。指令越多,计算机功能越强,线路也就越复杂。以下是几类基本指令:数据传送指令 算术运算指令 逻辑运算指令 程序控制指令 输入/输出指令 其他指令 中央处理器 微处理器一般功能 进行算术逻辑运算 可接收和发送数据 可暂存少量数据 提供控制信号 对指令解码中央处理器 CPU的发展(自学)辅助处理器 对偶处理器 并行处理器 RISC处理器 MMX处理
14、器 Pentium系列存储系统 存储器分类半导体存储器半导体存储器随机存储器随机存储器RAM双极型双极型RAMMOS型型RAM动态动态RAM静态静态RAM只读存储器只读存储器RAM可擦式可擦式EPROM可编程可编程PROM掩膜式掩膜式ROM电可擦式电可擦式EPROM闪速闪速Flash ROM图(5.2)半导体存储器分类图(5.2)半导体存储器分类存储系统 主存储器 只读存储器(ROM)随机存储器(RAM)存储系统 二级存储器 磁盘、磁带、光盘输入/输出设备 输入设备 键盘、扫描仪、鼠标 输出设备 打印机、显示器 视频 声音识别 光和磁识别计算机软件 主要内容 软件 操作系统 程序设计语言软件的
15、概念 软件分为两类 系统软件:为管理、控制和维护计算机及外设,以及提供计算机与用户界面的软件。如:OS,DBMS,各种语言编译系统等。应用软件:面向用户的、为用户服务的软件。如科学计算类软件、数据处理类软件、辅助设计类软件等。软件发展趋势:程序设计语言向对话式、自然语言方向发展 向更容易使用的多目标应用软件包发展系统软件 分类:系统管理程序:用于管理计算机系统的硬件、软件和数据资源。包括操作系统、数据库管理程序、通信管理程序。系统支持程序:通过提供各种支持服务,以支持计算机系统的操作和管理。包括系统实用程序、安全管理器等。系统开发程序:帮助用户开发信息系统的应用程序。包括各种语言编译器、开发工
16、具、辅助软件工程包等。系统软件 操作系统 是一台计算机最基本、最重要的软件包,它控制CPU的操作,控制计算机系统的输入/输出,资源的分配,为应用程序提供各种服务与接口。五大功能:用户界面资源管理任务管理文件管理实用程序与支持服务 操作系统分类:批处理OS、分时OS、实时OS。系统软件 DOS 曾经是PC机上最常用的操作系统,以简单、可靠赢得了广大用户的青睐。但由于未能紧跟计算机硬件技术的发展,最终退出了历史舞台。Windows3X 是PC机上最为成功的DOS扩展器,它在DOS的基础上改进了用户接口、内存管理和设备管理,增加了对多媒体的支持,实现了图形用户界面,为PC机操作系统的进一步发展打下了
17、基础。系统软件 Windows95 是一个全新的32位PC机操作系统,它充分利用了PC硬件技术发展的新成果,在支持原有16位应用的基础上,把PC操作系统技术向前推进了一大步。UNIX系统 经过20多年的锤炼,以高可靠性、高效率和强大的TCP/IP支持、支持并行处理和多处理器和独有的64位计算使其成为企业级应用的首选。作为UNIX风格的操作系统。系统软件 LINUX 秉承了UNIX系统的优秀特性,以可靠、高效和近乎为零的使用成本而成为一种重要的操作系统。NetWare 以其独特的结构、良好的运行效率和强大的目录管理服务,成为PC局域网络的最主要的网络操作系统。系统软件 Windows NT 继承
18、了微软公司Windows系列操作系统的优良特性,是一种可移植性好,支持多种硬件平台,功能强大,可靠性好、灵活性高的企业级操作系统。它采用了先进的操作系统技术,如虚存管理、优先权多任务、结构化异常处理和操作系统对象等,支持对称式多处理器,提供了Windows图形用户界面,兼容WIN32程序、16 Windows程序、MS-DOS程序、POSIX程序和OS/2程序等。Windows NT以其灵活、强大的功能和稳定可靠的性能成为了目前最为重要的操作系统之一系统软件 其他系统管理软件 数据库管理系统(DBMS)OracleSybaseMS SQL server 通信管理器 系统支持程序程序设计语言 机
19、器语言。特点:采用二进制代码 指令随机器而异 效率高,执行速度快 编程繁琐,工作量大,不直观 汇编语言 高级语言。优点:更接近自然语言,一般采用英语表达,便于理解、记忆、掌握。高级语言编写的程序短小,易于编写、调试。可移植性强。程序设计语言 高级语言不能被计算机直接识别和执行,必须先翻译成用机器指令表示的目标程序。翻译的方式有两种:解释执行 编译执行 第四代语言(4GL)是一种十分接近英语和其他人类语言的自然语言 面向对象的语言程序设计语言 程序设计工具 IDEMicrosoft visual c+5.0Dephi 6.0JBuild6.0PowerBuilder管理信息系统的技术基础 信息技
20、术概述 数据处理 数据库技术 计算机网络数据处理 概念:把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另外一种数据。数据处理是管理活动的最基本内容,也是MIS的基本功能。数据处理一般不涉及复杂计算,但要求处理的数据量很大。数据处理考虑基本问题:存储方式、数据结构、数据检索。目的:转换形式提供决策方便人们利用 数据处理 内容数据收集数据转换数据的筛选、分组和排序数据的组织数据运算:算术运算和逻辑运算数据存储数据检索数据输出 数据处理 发展过程 人工管理阶段-文件管理阶段-数据库系统管理阶段简单应用(1950年前)特征:无数据管理及完全分散的
21、手工方式 表现:(1)磁带外存,输入输出设备简单(2)No OS or FMS(3)数据不独立,数据是程序组成部分,修改数据必须修改程序。数据大量重复,不能共享(4)文件系统还没有出现 文件系统(50年代后期到60年代中期)数据库系统(60年代后期开始)数据处理 发展过程 人工管理阶段-文件管理阶段-数据库系统管理阶段简单应用(1950年前)文件系统(50年代后期到60年代中期)特征:有了面向应用的数据管理功能,工作方式是分散的、非手工的。表现:(1)磁带、硬盘、软磁盘等外存。输入输出能力增强(2)出现OS,FMS,多用户分时系统,高级语言COBOL(3)数据程序分离(4)文件类型多样化:索引
22、文件、链接文件、直接存取文件。(5)文件存取以记录为单位(6)但,数据冗余量大,数据与程序独立性仍不高。数据库系统(60年代后期开始)数据处理 发展过程 人工管理阶段-文件管理阶段-数据库系统管理阶段简单应用(1950年前)文件系统(50年代后期到60年代中期)数据库系统(60年代后期开始)背景:数据量剧增;数据共享要求;联机实时业务要求;大容量磁盘,硬件价格巨降,软件比重上升。DB出现解决了多用户、多应用共享数据要求,使数据为尽可能多的应用程序服务。特征:(1)面向全组织的复杂数据结构(2)数据冗余度小,易于扩充。(3)数据与程序独立(4)统一的数据控制功能Security&Integrit
23、y 数据处理 传统的文件处理系统 数据库处理系统数据库中央数据库数据处理 银行文件处理系统分期贷款程序帐户核对处理存款处理分期贷款处理存款文件修改文件修改核对帐户核对程序分期贷款文件修改存款程序数据处理 银行数据库处理系统核对帐户程序存款帐目程序分期贷款程序客户数据库.查询数据处理 传统的文件处理系统 数据冗余与数据不一致性 数据结构的不一致,数据联系弱 缺少数据字典,缺少灵活性 数据库管理系统 完善的数据字典和数据模型 数据独立性 方便的接口 完整的数据控制功能 提高了系统的灵活性数据处理-数据组织 数据的逻辑组织有四个基本的逻辑元素:数据项、记录、文件、数据库数据库文件1文件2文件n文件n
24、-1记录1记录2记录n-1记录n数据项1数据项2数据项n-1数据项n.姓名、性别等若干学生学生文件学生数据库数据处理-数据组织 数据组织的相关概念 数据项是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。记录与数据处理的某一对象有关的一切数据项构成了该对象的一条记录。标识记录的数据项称为关键项。主键:能惟一地标志某记录的数据项。功能是用来鉴别和搜索记录。文件相关(同类)记录的集合称为文件。全体-个体-属性=文件-记录-数据项 数据库按一定方式组织起来的逻辑相关的文件集合形成数据库。数据处理-数据组织 数据组织 数据结构逻辑结构:线性结构;非线性结构物理结构:顺序存
25、储;链接存储;索引存储;散列存储 数据文件顺序文件索引文件直接存取文件 数据库基于层次结构的数据库IMS:Information Management System基于网状结构的数据库关系数据库数据处理数据组织 数据结构:是数据的存储结构以及在此结构上的运算和操作。逻辑结构:指数据之间的逻辑关系 线性结构(线性表、栈、队列、串)非线性结构(树、图)物理结构:指数据元素在计算机存储器中的存储方式 顺序存储链接存储索引存储散列存储 同一种的逻辑结构按照不同的存储方式可以得到不同的数据结构。如:顺序表结构、链接表结构。逻辑结构和存储方式的对应关系称为:映象。数据处理数据组织 几种重要的数据结构指针与
26、链:结点(node),直接前趋,直接后继。单向链、双向链 线性表:仅适应于经常进行检索、数据不经常变动的情形。链表。树:结点之间有分支的、层次关系的结构。数据处理数据文件 数据文件的组织方式数据文件的组织方式 顺序文件 索引文件 直接存取文件(散列文件)数据文件的操作 建立、修改、删除记录、排序、更新、检索、计算、显示和打印 数据处理数据文件 顺序文件 文件中数据记录的物理顺序与逻辑顺序一致,文件记录按关键字值的递增(或递减)次序排序,形成其逻辑顺序。870001张三456870002李四645870003王五587870004孙六676870005钱七56512345数据处理数据文件 顺序文
27、件 特点:存取第I个记录,必须先存取前面的第I-1个记录插入记录只能加在末尾 优点:连续批量存取速度快 缺点:插入、删除记录时需要耗费大量的时间数据处理数据文件 索引文件 具有索引表的文件称为索引文件数据处理数据文件 索引文件 在记录数目非常庞大时,索引表也很大,一个物理块可能容纳不下,查索引表可能要多次访问外存。解决办法如下:索引文件索引表查找表第二查找表第三查找表 优点:可以保证记录地址的唯一性,不产生重号,存取机制简单 缺点:索引表要占用存储空间。如采用静态索引技术,每次修改都要重新索引,效率十分低下。数据处理数据文件 直接存取文件(散列文件)三种方式直接地址法 把存放某一记录的地址作为
28、该记录的鉴别键的值(简称键号)优点:存取机制简单,使用方便,不会产生重号 缺点:把记录的存储地址作为鉴别键,不易记忆相对键法杂凑法数据处理数据文件 直接存取文件(散列法)直接地址法 相对键法提供一个算法,对记录的键号进行计算,求出相应的记录地址 DRK=f(K)K:键号,RK:记录,DRK:地址 学生证号:000999,每个人的记录长度:100bytes,DRK=K*100+Memory_Start_Position优点:搜索一条记录只经过一次简单计算,搜索时间短,处理速度快缺点:若存在空号,则造成外存浪费;必须占用连续物理地址,不能充分利用存储碎块 杂凑法数据处理数据文件 直接存取文件(散列
29、法)杂凑法利用杂凑函数,把键号转换为相应的地址,达到节省物理空间的目的一种典型的杂凑函数算法:质数除余法 M:所需存储单元数,如M=5000 确定一个接近M的质数P,如P=4999 杂凑函数:H(K)=K-int(K/P)*P。K:键号,H(K)对应地址,0 H(K)M-1 H(10000)=2,H(50000)=10,H(11349)=1351 H(16384)=1351碰撞解决办法:溢流法。利用两个表来储存记录的键号:主表和溢流表,当一个记录要加入文件时,先将其键号按杂凑函数算法计算得主表的储存地址,如果主表的该地址已存有信息,则表示发生碰撞现象。这时,可将此记录的键号存入溢流表中,以链地
30、址指明溢流表存储单元的地址。如果这个单元也已占满可指向溢流表的其他单元。优点:存取速度快,节约存储空间缺点:不易找到好的算法,存在碰撞时会延长存取时间数据处理数据文件 直接存取文件(散列文件)优点:文件随机存取,记录不需排序,存取速度快,修改方便。缺点:不能进行顺序存取,只能按关键词随机存取。另外,经多次插入、删除后,可能会造成文件结构不合理,这时需对文件进行重组数据处理数据文件 几种文件组织方式的比较文件组文件组织方式织方式 使用效果使用效果文件文件大小大小查找查找速度速度文件文件活动活动率率文件文件易变易变性性响应响应时间时间复复杂杂度度对软对软件要件要求求对顺序对顺序处理效处理效率率对直
31、接对直接存取效存取效率率顺序存顺序存取文件取文件很好很好不能处不能处理理无限无限制制慢慢大大高高长长中中低低索引顺索引顺序文件序文件好好好好中等中等较快较快中中中中中中高高中中直接存直接存取文件取文件不能处不能处理理很好很好有限有限制制快快一般一般不高不高短短低低高高数据处理数据文件 举例记录地址学号姓名成绩A870005张三456B870002李四645C870001王五587D870004孙六676E870003钱七565主关键字(学号)记录地址870001C870002B870003E870004D870005A数据处理数据文件 链表文件 链表组织是信息系统中一种常用的逻辑组织形式。用指
32、针建立许多不同的逻辑联系,以适合多变情况下文件记录的检索。记录的指针在文件组织中是用一个指针项来表示的,这个指针项的内容就是指向下一个相关记录的地址。信息链的链头指向第一个逻辑记录的入口地址,从链头开始,顺序扫描,就可获取文件中具有该特征的全部数据记录。入口账务数据文件记录地址职工号姓名部门编号工作年限透支额度/%A A1111ANAMS-JOHNDT40B B1121SMITH-IVANNW11100C C1981MORALES-JOSEDT23200D D2014SMITH-ELOSEDT20E E2084JONES-JANENW30F F2918MORGAN-BILLNW40G G300
33、1ADAMS-ELMEREA16100H H3101BONES-IGORDT70I I3241KINKO-BOBEA15100J J3358GRANCE-TEDDT12100K K3861GREEN-EDNE90L L3871BROWN-JOENE18100 若要将部门号相同的所有记录链接起来,需要在部门编号数据项后面加一个部门指针项。记录地址职工号姓名部门编号 部门指针 工作年限 透支额度/%DT入口A1111ANAMS-JOHNDTC40NW入口B1121SMITH-IVANNWE11100C1981MORALES-JOSEDTD23200D2014SMITH-ELOSEDTH20E208
34、4JONES-JANENWF30F2918MORGAN-BILLNW40EA入口G3001ADAMS-ELMEREAI16100H3101BONES-IGORDTJ70I3241KINKO-BOBEA15100J3358GRANCE-TEDDT12100NE入口K3861GREEN-EDNEL90L3871BROWN-JOENE181004个部门的雇员信息链是DA(A,C,D,H,J)、NW(B,E,F)、EA(G,I)、NE(K,L)管理信息系统的技术基础 信息技术概述 数据处理 数据库技术 计算机网络数据库技术 数据库系统的产生数据库是以一定组织方式存储在一起的相关数据的集合,它能以最佳的
35、方式,最少的数据冗余为多种应用服务,程序与数据具有较高的独立性。1969年 IBM 基于层次结构Information Management System 1970年左右 美国数据系统语言委员会 基于网状结构DBTG数据库任务组 1970年 IBM San Jose研究实验室的 E.F.Godd 关系数据库 数据库技术 层次模型和网状模型示意图 关系模型:用二维表表示实体与实体之间联系的模型(后面详述)ABCDEF数据库技术 关系模型用二维表表示实体与实体之间联系的模型。仓库号城市面积WH1北京370WH2上海500WH3广州200仓库器件号器件名称P1显示卡P2声卡P3解压卡P4散热风扇仓库
36、号器件号数量WH1P2675WH1P3250WH1P4340WH2P1280WH2P2200WH2P4270WH3P2330WH3P1330器件库存器件仓库库存数据库技术 关系模型以关系代数和关系演算的理论为基础,把客观世界的事物及其联系抽象为元组的集合,成为数据库系统中的基础数据模型 几个重要概念关系:一个关系对应于一张二维表元组:表中一行称为一个元组属性:表中一列称为一个属性。给每列起一个名即为属性名。主码(Primary Key,也称主关键字)域。属性的取值范围分量。元组中的一个属性值关系模式。对关系的描述,用关系名(属性1,属性2,属性n)来表示。例如,库存(仓库号,器件号,数量)仓库
37、(仓库号,城市,面积)库存(仓库号,器件号,数量)仓库(仓库号,城市,面积)数据库技术 数据库系统的构成 硬件(计算机系统)软件(DBMS)数据集合(数据库)人员(三类)数据库管理员:integrity、security系统程序员:设计DBMS的人员用户应用程序员:负责编制和维护应用程序。专门用户:通过交互方式进行信息检索和补充信息的用户参数用户:与数据库的交互作用是固定的、有规则的人。售货员、订票员。数据库技术 四个世界假设假设理论现实世界:人们头脑之外的客观世界观念世界:信息世界。现实世界在人们头脑中的反映。客观世界在观念世界中被称为实体。数据世界:信息世界中信息的数据化。计算机世界:数据
38、经过编码、加工后的世界 数据库设计的步骤用户需求分析概念结构设计:E-R模型,3NF关系群模型逻辑结构设计:将概念模型转变为某DBMS支持的数据模型物理结构设计:设计存储结构和存取方法数据库技术 四个世界与DB设计步骤现实世界信息世界数据世界用户需求分析概念结构设计逻辑结构设计物理结构设计E-R图数据模型概念结构设计逻辑结构设计计算机世界数据库技术 实体联系模型(E-R模型)客观 事物类:事物 相关性质集合人实体 实体集合及 实体联系 相关属性集合 加工、转换数 文件据 记录库 相关数据项集合加工转换存储 二进制数据集合结构计算机世界DBMS数据世界DBMS的数据模型信息世界认识选择描述现实世
39、界E-R模型数据库技术 E-R图描述现实世界的概念模型 实体(entity):人、物;事物本身、事物联系 属性(attribute,property)联系(relation):实体内部联系;实体之间的联系 一对一联系:系-系主任一对多联系:教研室-教师多对多联系:教师-学生线段数据库技术 ER图设计原则 真实性原则 避免冗余原则 简单性原则 合适性原则(用实体或属性或联系集)注意对客观对象的约束映射约束、键码约束、参照完整性约束数据库技术 E-R模型设计步骤搜集资料分析资料,抽取本质信息,忽略次要信息,利用分类、聚集、概括等方法抽象出实体,并一一命名根据实体的属性来描述它们之间的关系。数据库技
40、术 E-R图绘制数据库技术 ER图向关系数据模型的转换 ER图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。对于“联系集”,根据联系方式不同,采取不同手段以使被它联系的实体所对应的关系彼此实现某种联系。数据库技术 ER图向关系数据模型的转换转换过程示意图数据库技术 ER图的转换 将E-R图转换成相应的表表是行和列的集合,实体被表示成表的形式。用列标题表示实体的属性用行表示关于实体的实际数据 关于表和属性的命名规则 属性名和表名中不能包含空格 表名对实体的描述应该是有意义的。如 student(cStuID,cStuName,nStuAge,)表名只能描述
41、一个主题数据库技术 转换举例一厂长(厂长号,厂号,姓名,年龄)工厂(厂号,厂名,地点)数据库技术 转换举例二仓库(仓库号,地点,面积)产品(货号,品名,价格,仓库号,数量)将1方的主关键字加入到多方中,作为多方的一个属性。数据库技术 转换举例三学号姓名年龄学生课程号课程名学时数课程学习nn学生(学生(学号学号,姓名,年龄),姓名,年龄)课程(课程(课程号课程号,课程名,学时数),课程名,学时数)成绩学习(学习(学号学号,课程号课程号,成绩),成绩)对于m:n的联系,将联系转化为一个关系,该关系的关键字由两个实体的关键字组合在一起构成,并附上联系的属性数据库技术 数据库设计规范化范式理论篇 必要
42、性:解决在关系模式设计时,存在的数据存储异常现象:数据冗余、修改异常、插入异常、删除异常等。现在建立一个描述学校教务的数据库,该数据库涉及的对象包括学生的学号(Sno),所在系(Sdept),学生住处(Sloc),课程号(Cno)和成绩(Grade)。现实世界的已知事实(语义)告诉我们:一个系有若干学生,但一个学生只属于一个系一个系有若干学生,但一个学生只属于一个系一个系的学生在同一个宿舍楼居住一个系的学生在同一个宿舍楼居住一个学生可以选修多门课程,每门课程有若干学生选修一个学生可以选修多门课程,每门课程有若干学生选修每个学生学习每一门课程有一个成绩。每个学生学习每一门课程有一个成绩。关系模式
43、的一个实例SnoSdeptSlocCnogradeS1计算机系S5C195S2计算机系S5C190S3计算机系S5C188S4计算机系S5C170S5计算机系S5C178S6计算机系S5C185An Introduction to Database System 范式是符合某一种级别的关系模式的集合范式是符合某一种级别的关系模式的集合 关系数据库中的关系必须满足一定的要求。满足不同程度关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式要求的为不同范式 范式的种类:范式的种类:第一范式第一范式(1NF)第二范式第二范式(2NF)第三范式第三范式(3NF)BC范式范式(BCNF)第
44、四范式第四范式(4NF)第五范式第五范式(5NF)数据库技术An Introduction to Database System 各种范式之间存在联系:各种范式之间存在联系:某一关系模式某一关系模式R为第为第n范式,可简记为范式,可简记为RnNF。一个低一级范式的关系模式,通过一个低一级范式的关系模式,通过模式分解模式分解可以转换为若可以转换为若干个高一级范式的关系模式的集合,这种过程就叫干个高一级范式的关系模式的集合,这种过程就叫规范化规范化 NF5NF4BCNFNF3NF2NF1数据库技术An Introduction to Database System 1NF的定义的定义如果一个关系模
45、式如果一个关系模式R的所有属性都是的所有属性都是不可分的基本数据项不可分的基本数据项,则,则R1NF 第一范式是对关系模式的最起码的要求。不满足第一范式第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库的数据库模式不能称为关系数据库 但是满足第一范式的关系模式并不一定是一个好的关系模但是满足第一范式的关系模式并不一定是一个好的关系模式式数据库技术数据库技术 第一范式1NF:如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该 模式是属于第一规范型(First Normal Form,即 1NF)。姓名地址省市街道邮编甲江苏南京卫岗210095 关系
46、模式的一个实例SnoSdeptSlocCnogradeS1计算机系S5C195S2计算机系S5C190S3计算机系S5C188S4计算机系S5C170S5计算机系S5C178S6计算机系S5C185An Introduction to Database System例例 关系模式关系模式 S-L-C(Sno,Sdept,Sloc,Cno,Grade)Sloc为学生住处,假设每个系的学生住在同一个地方为学生住处,假设每个系的学生住在同一个地方 函数依赖包括:函数依赖包括:(Sno,Cno)F Grade Sno Sdept (Sno,Cno)P Sdept Sno Sloc (Sno,Cno)P
47、 Sloc Sdept Sloc数据库技术An Introduction to Database SystemS-L-C的码为(Sno,Cno)S-L-C满足第一范式。非主属性Sdept和Sloc部分函数依赖于码(Sno,Cno)SnoCnoGradeSdeptSlocS-L-C数据库技术An Introduction to Database SystemS-L-C不是一个好的关系模式(1)插入异常插入异常(2)删除异常删除异常(3)数据冗余度大数据冗余度大(4)修改复杂修改复杂An Introduction to Database SystemS-L-C不是一个好的关系模式 原因原因 两种非
48、主属性:两种非主属性:Grade,完全函数依赖于码,完全函数依赖于码 Sdept、Sloc部分函数依赖于码。部分函数依赖于码。解决方法解决方法 S-L-C分解为两个关系模式,以消除这些部分函数依赖分解为两个关系模式,以消除这些部分函数依赖 SC(Sno,Cno,Grade)S-L(Sno,Sdept,Sloc)An Introduction to Database System函数依赖图:函数依赖图:SnoCnoGradeSCS-LSnoSdeptSlocv关系模式SC的码为(Sno,Cno)v关系模式S-L的码为Snov这样非主属性对码都是完全函数依赖 An Introduction to
49、Database System 2NF的定义的定义定义定义 若若R1NF,且每一个,且每一个非主属性非主属性完全完全函数依赖于码,函数依赖于码,则则R2NF。例:S-L-C(Sno,Sdept,Sloc,Cno,Grade)1NF S-L-C(Sno,Sdept,Sloc,Cno,Grade)2NF SC(Sno,Cno,Grade)2NF S-L(Sno,Sdept,Sloc)2NFAn Introduction to Database System 采用投影分解法将一个采用投影分解法将一个1NF1NF的关系分解为多的关系分解为多个个2NF2NF的关系,可以在一定程度上减轻原的关系,可以在一
50、定程度上减轻原1NF1NF关系中存在的插入异常、删除异常、数据冗关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。余度大、修改复杂等问题。将一个将一个1NF1NF关系分解为多个关系分解为多个2NF2NF的关系,并不的关系,并不能完全消除关系模式中的各种异常情况和数能完全消除关系模式中的各种异常情况和数据冗余。据冗余。An Introduction to Database System 3NF的定义的定义定义定义 关系模式关系模式R 中若不存在这样的码中若不存在这样的码X、属性组、属性组Y及非主属性及非主属性Z(Z Y),使得使得XY,YZ成立,成立,Y X,则称,则称R 3NF。n
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。