第2章-计算机系统的结构组成与工作原理要点课件.ppt_163文库

资源描述

1、第二章第二章计算机系统的结构组成与工作计算机系统的结构组成与工作原理原理2.1 计算机系统的基本结构与组成计算机系统的基本结构与组成1.层次模型 Hierarchy2.结构Architecture、组成Organization与实现Realization2.2 计算机系统的工作原理计算机系统的工作原理1.冯诺依曼计算机架构2.模型机：系统结构、指令集、工作流程2.3 计算机计算机体系结构的改体系结构的改革革1.改进：指令集(RISC/CISC)、分层存储器、高速总线/接口2.改变：多种并行技术：流水线、超标量、多机/核、多线程2.4 计算机体系结构分类计算机体系结构分类2.5 计算机性能评测

2、计算机性能评测字长、存储容量、运算速度2.6 习题2022-12-161/50Flynn计算机执行计算机执行C语言程序实现语言程序实现1+2求和功能求和功能1.生成可执行程序过程生成可执行程序过程a)分析问题并得到解决方法分析问题并得到解决方法b)编写源代码（编写源代码（sum.c，保存在硬盘上，保存在硬盘上)c)编译、链接得到可执行程序编译、链接得到可执行程序(sum.exe，保存在硬盘上，保存在硬盘上)2.可执行文件可执行文件(sum.exe)格式解析格式解析a)数据段（程序中定义的变量）数据段（程序中定义的变量）b)代码段（程序中的可执行语句）代码段（程序中的可执行语句）3.计算机执行

3、程序过程计算机执行程序过程a)可执行程序从硬盘加载到内存（加载方式：操作系统或硬件加载）：变可执行程序从硬盘加载到内存（加载方式：操作系统或硬件加载）：变量加载到数据段，可执行语句加载到代码段，并把程序计数器（量加载到数据段，可执行语句加载到代码段，并把程序计数器（PC）初）初始化为代码段的首地址始化为代码段的首地址b)CPU根据当前根据当前PC值从内存读取一条指令到值从内存读取一条指令到CPU内部，并更新内部，并更新PC=PC+N(N为一条指令的长度）为一条指令的长度）c)分析该指令功能分析该指令功能d)执行该指令功能，然后跳转到步骤执行该指令功能，然后跳转到步骤b)，直到程序最后一条指令，

4、直到程序最后一条指令（a）软硬件实现）软硬件实现（b）语言功能）语言功能计算机系统的计算机系统的3 3种种层次结构层次结构 2.1.12.1.1节节(1)(1)图自下而上反映了系统逐级图自下而上反映了系统逐级生成生成的过程，自上而下反映了系统的过程，自上而下反映了系统求解求解问题的问题的过程；过程；(2)(2)图中的图中的虚拟机虚拟机：与某种特殊编程语言对应的假想硬件机器。：与某种特殊编程语言对应的假想硬件机器。微体系结构层微体系结构层（微程序）（微程序）操作系统层操作系统层语言处理层（解释、编译）语言处理层（解释、编译）用户程序层（语言编程）用户程序层（语言编程）系统分析层（数学模型、算法

5、）系统分析层（数学模型、算法）硬核硬核级级数字逻辑层（硬件）数字逻辑层（硬件）指令系统层（机器语言指令）指令系统层（机器语言指令）应用语言虚拟机应用语言虚拟机高级语言虚拟机高级语言虚拟机汇编语言虚拟机汇编语言虚拟机操作系统虚拟机操作系统虚拟机机器语言级机器语言级微程序级微程序级寄存器级（硬件）寄存器级（硬件）硬件系统：异常处理机构、指令系统、硬件系统：异常处理机构、指令系统、CPU、存储器、存储器、I/O及通信子系统及通信子系统系统软件：操作系统、编译器、数据库管理系统软件：操作系统、编译器、数据库管理系统、系统、Web浏览器、设备驱动、中断服务程浏览器、设备驱动、中断服务程序序应用软件应用软

6、件计算机系统层次结构计算机系统层次结构（P31、P39）1.现代计算机是软件、硬件和网络组件的复杂综合体现代计算机是软件、硬件和网络组件的复杂综合体，其基本功能包括信息的存储、处理和交换其基本功能包括信息的存储、处理和交换2.计算机功能通过软件实现还是硬件实现，取决于所需计算机功能通过软件实现还是硬件实现，取决于所需的的速度、灵活性、成本速度、灵活性、成本、可靠性、更新频率等因素、可靠性、更新频率等因素3.软件实现：灵活，硬件简单，成本低，但是速度慢软件实现：灵活，硬件简单，成本低，但是速度慢硬件实现：速度快，灵活性差，硬件复杂，成本高硬件实现：速度快，灵活性差，硬件复杂，成本高4.软硬件

7、的逻辑等价性可以表现为：软硬件的逻辑等价性可以表现为：硬件软化硬件软化（如（如RISC思想）、思想）、软件硬化软件硬化（如（如CISC思想）、思想）、固件化固件化（如微程序）技术如微程序）技术（同三种（同三种IP核对照理解）核对照理解）；5.计算机划分层次的好处（计算机划分层次的好处（P31）1.计算机体系结构：是程序员所看到的计算机(机器语言级)的属性，即概念性结构与功能特性2.计算机组成：从硬件角度关注物理机器的各部件的功能以及各部件的联系。对程序员是透明的。3.计算机实现：指的是计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度；系列机系列机2022-12-162

8、022-12-165/36计算机体系结构、组成与实现计算机体系结构、组成与实现1.计算机体系结构是人眼看不见的东西，而计算机组成是人眼可见的2.计算机组成是计算机的外部，是使用人员所关心的系统硬件指标参数；而计算机实现是计算机的内部，是制造人员关心的内容3.相同体系结构(同系列)的计算机具有相同的结构和不同的组成。计算机体系结构计算机体系结构 1946年年，美国宾夕法尼亚大学莫尔学院的物理学博士，美国宾夕法尼亚大学莫尔学院的物理学博士Mauchley和电气工程师和电气工程师Eckert领导的小组研制成功领导的小组研制成功世界上第一台世界上第一台数字式电子数字式电子计算机计算机ENIAC。著名的

9、美籍匈牙利数学家著名的美籍匈牙利数学家冯冯诺依曼诺依曼参加了为改进参加了为改进ENIAC而举行的一系列专家会议，研究了新型计算机的体系结构。而举行的一系列专家会议，研究了新型计算机的体系结构。1949年年，英国剑桥大学的威尔克斯等人在，英国剑桥大学的威尔克斯等人在EDSAC 机上实现了机上实现了冯冯诺依曼模式。直至今天冯诺依曼模式。直至今天冯诺依曼体系结构依然是绝大多数数字诺依曼体系结构依然是绝大多数数字计算机的基础。计算机的基础。2022-12-166/50注意：同一体系结构的计算机，不管其组成和实现如何变化，在代码级是完全兼容的。（例如更换相同平台下的CPU型号不需要修改源代码）2022-

10、12-162022-12-167/267/30计算机组成计算机组成【例例1 1】确定是否有乘法指令属于。确定是否有乘法指令属于。乘法指令是用专门的乘法器实现，还是经加法器用重乘法指令是用专门的乘法器实现，还是经加法器用重复的相加和右移操作来实现，属于。复的相加和右移操作来实现，属于。乘法器、加法器的物理实现，如器件的选定乘法器、加法器的物理实现，如器件的选定(器件集成器件集成度、类型、数量、价格度、类型、数量、价格)及所用微组装技术等，属于及所用微组装技术等，属于计算机体系结构计算机体系结构计算机组成计算机组成计算机实现计算机实现计算机体系结构、组成及实现区分计算机体系结构、组成及实现区分【例

11、例2 2】主存容量与编址方式主存容量与编址方式(按位、按字节、按字访问等按位、按字节、按字访问等)的的确定属于确定属于。为达到所定性能价格比，主存速度应多快，在逻辑结为达到所定性能价格比，主存速度应多快，在逻辑结构上需采用什么措施构上需采用什么措施(如多体交叉存储等如多体交叉存储等)属于属于。主存系统的物理实现，如存储器器件的选定、逻辑电主存系统的物理实现，如存储器器件的选定、逻辑电路的设计、微组装技术的选定属于路的设计、微组装技术的选定属于。计算机体系结构计算机体系结构计算机组成计算机组成计算机实现计算机实现一功能部件n五大部分运算器、控制器、存储器、输入设备、输出设备n以存储器为中心二信

12、息表示：二进制计算机内部的控制信息和数据信息均采用二进制表示，并存放在同一类存储器中，采用相同的访问电路。三工作原理：存储程序/指令(控制)驱动编译链接生成的可执行程序(包括指令和数据)保存在辅助存储器中；程序开始运行时，计算机在不需要人工干预的情况下由控制器自动、高速地依次从存储器中取出指令并加以执行。2022-12-169/81冯冯诺依曼体系结构诺依曼体系结构 P32在在冯在冯诺依曼体系结构中，诺依曼体系结构中，内存属于存储器，内存属于存储器，硬盘属于输入硬盘属于输入/输出设备输出设备C语言程序涉及的计算机部件语言程序涉及的计算机部件1.输入设备输入设备（scanf）2.输出设备输出

13、设备（printf）3.运算器运算器（c =a+b)4.存储器存储器 (存放存放a,b,c的值和执行代码的值和执行代码)5.控制器控制器 (协调和控制前述四个部件的工作协调和控制前述四个部件的工作)ENIAC和EDSAC的异同ENIACEDSAC计数进制计数进制十进制十进制二进制二进制程序存储程序存储接插线进行，程接插线进行，程序不存储序不存储存储程序，指令驱动存储程序，指令驱动程序执行程序执行手工执行手工执行程序控制的自动执行程序控制的自动执行体系结构体系结构无无冯冯诺依曼体系结构，是所有诺依曼体系结构，是所有现代计算机的原型和范本现代计算机的原型和范本特点特点第一台数字式电第一台数字式

14、电子计算机子计算机第一台存储程序计算机第一台存储程序计算机早期的计算机结构（无总线）早期的计算机结构（无总线）早期计算机各组成部分之间通过芯片引脚直接连接模型机体系结构模型机体系结构基于基于总线总线的的冯冯诺依曼架构诺依曼架构模型机模型机n总线子系统总线子系统：作为作为公共通道连接各公共通道连接各子子部件，用于实现各部件之间的数据、部件，用于实现各部件之间的数据、信息等的传输和交换信息等的传输和交换nCPU子系统子系统：集成了集成了运算器、控制器和运算器、控制器和寄存器寄存器的超大规模集成电路芯片的超大规模集成电路芯片n存储器子系统存储器子系统：用来存放当前的运行程序和数据用来存放当前的运行程

15、序和数据n输入输出子系统输入输出子系统：用于完成计算机与外部的信息交换用于完成计算机与外部的信息交换2022-12-1613/50ARM寄存器：R0，R1，R15x86寄存器:AX(AH,AL),BX(BH,BL),CX(CH,CL),DX(DH,DL)模型机总线结构模型机总线结构按传输信息的不同，可将总线分为三类按传输信息的不同，可将总线分为三类：地址总线地址总线（AB）、控制总线、控制总线（CB）和数据总线和数据总线（DB）地址总线通常是地址总线通常是单向单向的，由的，由主设备主设备(如如CPU)发出，用于选择读写对象发出，用于选择读写对象(如如某个特定的存储单元或外部设备某个特定的存储单

16、元或外部设备)；数据总线用于数据交换，通常是数据总线用于数据交换，通常是双向双向的；的；控制总线包括真正的控制总线包括真正的控制控制信号线信号线(如读如读/写信号写信号)和一些和一些状态状态信号线信号线(如是否如是否已将数据送上总线已将数据送上总线)，用于实现对设备的监视和控制。，用于实现对设备的监视和控制。C CP PU U存储器存储器I/OI/O接口接口输入输入/输出设备输出设备ABABDBDBCBCB总线表示方式3-8译码器译码器74LS1383-8译码器2 1 8HA Y0B Y1C Y2 G1 Y3 Y4 G2A Y5 Y6G2B Y7 C B A输出有效引脚输出有效引脚0 0 0Y

17、00 0 1Y10 1 0Y20 1 1Y31 0 0Y41 0 1Y51 1 0Y61 1 1Y7N个输入端的译码器可以输出个输入端的译码器可以输出2N个引脚个引脚存储器存储器用来存放用来存放当前的运行程序和数据当前的运行程序和数据存储器存储器组织组织由许多由许多字节单元字节单元组成，每个单元都有一个唯一的编号组成，每个单元都有一个唯一的编号（存储单存储单元元地址地址），其中其中保存的信息称为存储单元保存的信息称为存储单元内容内容访问访问(读或写读或写)存储单元存储单元：存储单元地址经地址译码后产生相应的选通信号，存储单元地址经地址译码后产生相应的选通信号，同时同时在控制信号的作用下读出存储

18、单元内容到数据缓冲器，或将数据缓冲在控制信号的作用下读出存储单元内容到数据缓冲器，或将数据缓冲器中的内容写入选定的单元器中的内容写入选定的单元DBABCB模型机内存储器模型机内存储器控制器控制器微微操操作作控控制制电电路路指令译码器指令译码器ID指令寄存器指令寄存器IR 操作码操作码,地址码地址码脉冲分配器脉冲分配器时钟脉冲源时钟脉冲源控制总线控制总线CB地址总线地址总线AB数据总线数据总线DB内部总线内部总线地址缓冲器地址缓冲器数据缓冲器数据缓冲器通用寄存器组通用寄存器组堆栈指针堆栈指针SP程序计数器程序计数器PC寄存器组寄存器组模型机模型机CPUCPU子系统子系统运算器运算器算

19、术逻辑单元算术逻辑单元ALU结果寄存器结果寄存器输入输入1输入输入2标志寄存器标志寄存器CPU读写存储器步骤读写存储器步骤1.存储器的读写是相对于存储器的读写是相对于CPU来说的，来说的，CPU从存储器从存储器取数据为读，取数据为读，CPU把数据放入存储器为写把数据放入存储器为写2.CPU读存储读存储器步骤器步骤 CPU把需要读数据的把需要读数据的存储单元地址存储单元地址放到地址锁存器（地址总线）放到地址锁存器（地址总线）存储器对存储器对地址译码后产生相应的地址译码后产生相应的存储单元存储单元选通信号选通信号CPU发出存储器读发出存储器读控制信号控制信号，存储器在读信号，存储器在读信号的作用下

20、读出存储单元的作用下读出存储单元内容到数据缓冲器内容到数据缓冲器CPU在规定的存储器读时间内从在规定的存储器读时间内从数据缓冲器数据缓冲器(数据总线数据总线)上取数据上取数据3.CPU写写存储存储器步骤器步骤 CPU把需要写数据的把需要写数据的存储单元地址存储单元地址放到地址锁存器（地址总线）放到地址锁存器（地址总线）存储器对存储器对地址译码后产生相应的地址译码后产生相应的存储单元存储单元选通信号选通信号CPU数据放到数据放到数据缓冲器数据缓冲器(数据总线数据总线)CPU发出存储器写发出存储器写控制信号控制信号，存储器在写信号，存储器在写信号的作用下将数据缓冲器的作用下将数据缓冲器中的内容写入

21、选定的单元中的内容写入选定的单元模型机指令系统模型机指令系统指令是发送到指令是发送到CPU的命令，指示的命令，指示CPU执行一个特定的处理。执行一个特定的处理。CPU可以处理的全部指令集合称为可以处理的全部指令集合称为指令集指令集。指令集结构（指令集结构（ISA）是体系结构的主要内容之一。）是体系结构的主要内容之一。ISA功能设计实际就是功能设计实际就是确定软硬件的功能分配确定软硬件的功能分配。指令通常包含指令通常包含操作码和操作数操作码和操作数两部分。操作码指明要完成操两部分。操作码指明要完成操作的性质，如加、减、乘、除、数据传送、移位等；操作数作的性质，如加、减、乘、除、数据传送、移位等

22、；操作数指明参加上述规定操作的数据或数据所存放的地址。指明参加上述规定操作的数据或数据所存放的地址。汇编语言源程序汇编语言源程序机器语言程序机器语言程序（目标代码）（目标代码）汇编（汇编程序）汇编（汇编程序）高级语言源程序高级语言源程序编译或解释（编译程序）编译或解释（编译程序）例：例：MOV R0，#2二进制操作码助记二进制操作码助记符：与动作一一对符：与动作一一对应应目目/源操作数：源操作数：l操作码：操作码：由由CPU设计人员定义，具有固定的写法和意义。设计人员定义，具有固定的写法和意义。l操作数：操作数：可由编程人员采用不同方式给出。可由编程人员采用不同方式给出。;注释注释 ADD R

23、0,R1,R2 ；R0 R1+R2 模型机工作原理模型机工作原理计算机的工作本质上就是计算机的工作本质上就是执行程序执行程序的过程。的过程。指令执行的基本过程可以分为指令执行的基本过程可以分为取指令取指令(fetch)、分析指令、分析指令(decode)和执行指令和执行指令(execute)三个阶段。三个阶段。取指令，PC值加1停机?译码并执行结束YN 取指令取指令当程序已在存储器中时，首当程序已在存储器中时，首先根据程序入口地址取出一先根据程序入口地址取出一条程序，为此要发出指令地条程序，为此要发出指令地址及控制信号址及控制信号分析指令分析指令即指令译码，是指对当前取即指令译码，是指对当前

24、取得的指令进行分析，指出它得的指令进行分析，指出它要求什么操作，并产生相应要求什么操作，并产生相应的操作控制命令。的操作控制命令。执行指令执行指令根据分析指令时产生的根据分析指令时产生的“操操作命令作命令”形成相应的操作控形成相应的操作控制信号序列，通过运算器、制信号序列，通过运算器、存储器及输入存储器及输入/输出设备的执输出设备的执行，实现每条指令的功能，行，实现每条指令的功能，其中包括对运算结果的处理其中包括对运算结果的处理以及下条指令地址的形成。以及下条指令地址的形成。PC值由操作系统初值由操作系统初始化为程序的入口始化为程序的入口地址地址(c语言中是语言中是main函数第一行函数第一行

25、)计算机完成计算的过程分析计算机完成计算的过程分析1.目的：计算目的：计算0 x5C和和0 x2E之和之和2.编写汇编程序代码编写汇编程序代码,关键代码如下：关键代码如下：MOV ACC，5CH ;ACC =5CH,ACC 为为CPU内部的寄存器内部的寄存器 ADD ACC，ACC,2EH ;ACC =ACC +2EH3.编译、链接后得到的可执行代码编译、链接后得到的可执行代码(二进制位串二进制位串)4.运行运行(把保存在硬盘上的可执行文件调入内存，并把把保存在硬盘上的可执行文件调入内存，并把程序指令在内存的开始位置赋值给程序指令在内存的开始位置赋值给CPU中的中的PC寄存寄存器器)5.以后的

26、计算工作就交给以后的计算工作就交给CPU（指令驱动）（指令驱动）B0H5CH04H2EH程序的执行过程程序的执行过程取指令、分析指令、执行指令取指令、分析指令、执行指令CBABDBALU累加器累加器ACC暂存器暂存器标志寄存器标志寄存器FR寄存器组寄存器组操作控制器操作控制器OC指令译码器指令译码器ID指令寄存器指令寄存器IR 操作码操作码,地址码地址码内部总线内部总线地址缓冲器地址缓冲器数据缓冲器数据缓冲器程序计数程序计数器器PC地地址址译译码码读控制读控制B0H5CH04H2EH地址地址1001H1002H1003H内容内容1000H内存储器内存储器NCPU外外CPU内内汇编链接汇编链接

27、后的可执后的可执行文件调行文件调入内存储入内存储器器,PC赋赋值值1000HMOV ACCMOV ACC，5CH5CHADD ACC,ACC,2EHADD ACC,ACC,2EH汇编源代码N表示指令长度（以字节为单位），此处N=12.改进指令集 (指令功能、指令格式、寻址方式)存储器子系统（4层结构)及并行的哈佛结构高速总线成为计算机系统的核心输入/输出体系结构3.改变1.改变串行执行模式，发展并行技术；2.改变控制驱动方式，发展数据驱动、需求驱动、模式驱动等其它驱动方式；2022-12-1624/811.早期计算机的缺点指令功能越来越复杂，硬件设计太复杂，成本太高存储器读取速度远远低于C

28、PU的处理速度低速和高速输入、输出设备之间的矛盾单一的输入输出体系结构严重影响CPU的效率串行性是冯诺依曼计算机的本质特点（指令执行和存储器读取的串行性）2.3 微处理器体系结构的改进和改变 (P38)不同的指令集设计策略：不同的指令集设计策略：CISC与与RISCCISC（Complex Instruction Set Computer，复杂，复杂指令集计算机）指令集计算机）-软件硬化思想软件硬化思想不断增强指令的功能以及设置更复杂的新指令取代原先由程序段完成的功能，从而实现软件功能的硬化。计算机的指令逐渐增多，逐渐复杂。伯克利提出的2-8原则，将常用的20%称为热代码。反之为冷代码。

29、RISC（Reduced Instruction Set Computer，精简，精简指令集计算机指令集计算机）-硬件软化思想硬件软化思想通过减少指令种类和简化指令功能来降低硬件设计复杂度，从而提高指令的执行速度。yyyy-M-d25/862022-12-1625/50参考浪潮之巅第五章第三节指令集之争CISCCISC系统的缺点系统的缺点美国加州大学美国加州大学Berkeley分校的研究结果表明：分校的研究结果表明：许多复杂指令很少被使用，许多复杂指令很少被使用，“2-8原则原则”控制器硬件复杂（指令多，且具有不定长格式和复杂控制器硬件复杂（指令多，且具有不定长格式和复杂的数据类型），占用

30、了大量芯片面积，且容易出错；的数据类型），占用了大量芯片面积，且容易出错；指令操作繁杂，速度慢；指令操作繁杂，速度慢；指令规整性不好，不利用采用流水线技术提高性能。指令规整性不好，不利用采用流水线技术提高性能。yyyy-M-d2022-12-1627/50RISC的特点及设计思想的特点及设计思想 RISC机的设计应当遵循以下五个原则：机的设计应当遵循以下五个原则：指令条数少，格式简单，易于译码，不提供复杂指令；指令条数少，格式简单，易于译码，不提供复杂指令；提供足够的寄存器，只允许提供足够的寄存器，只允许load 和和store指令访问内存；指令访问内存；指令由硬件直接执行，指令由硬件直接执行

31、，在单个周期内完成；在单个周期内完成；充分利用流水线；充分利用流水线；依赖优化编译器的作用；依赖优化编译器的作用；yyyy-M-d27/68由于CISC指令计日趋复杂，无法适应优化编译，同时存储器的成本不断降低，为RISC系统提供了基础条件。CISC：优点：优点：指令越多功能越强，强调代码效率，容易和高级语言指令越多功能越强，强调代码效率，容易和高级语言接轨。可直接实现处理器和存储器之间的数据转移。接轨。可直接实现处理器和存储器之间的数据转移。缺点：缺点：指令集以及芯片的设计比上一代产品更复杂，不同的指令集以及芯片的设计比上一代产品更复杂，不同的指令，需要不同的时钟周期来完成，执行较慢的指令，

32、将影响整指令，需要不同的时钟周期来完成，执行较慢的指令，将影响整台机器的执行效率。台机器的执行效率。RISC：优点：优点：指令少容易记忆，尽量将操作码和操作数用指令少容易记忆，尽量将操作码和操作数用1个个16位数位数或或32位数表示，指令整齐。位数表示，指令整齐。CPU时钟频率可以做得很高，指令执时钟频率可以做得很高，指令执行速度快。行速度快。缺点：缺点：同样功能的程序，产生的代码量比较大，必须合理地同样功能的程序，产生的代码量比较大，必须合理地选择编译器。选择编译器。CISCCISC与与RISCRISC系统的比较系统的比较CISC：如：如Intel CPU,RISC如如ARM处理器处理器分层

33、的存储子系统（改进分层的存储子系统（改进2 2）P40-P41,P156如何以合理的价格搭建出容量和速度都满足要求的存储系统，如何以合理的价格搭建出容量和速度都满足要求的存储系统，始终是计算机体系结构设计中的关键问题之一。始终是计算机体系结构设计中的关键问题之一。现代计算机系统通常把不同的存储设备按一定的体系结构组织现代计算机系统通常把不同的存储设备按一定的体系结构组织起来，以解决起来，以解决存储容量、存取速度和价格存储容量、存取速度和价格之间的矛盾。之间的矛盾。2022-12-1629/50并行访问的哈佛体系结构改善存储器带宽并行访问的哈佛体系结构改善存储器带宽(例如：例如：ARM9系列）系

34、列）DSP程序程序数据数据I/O接口接口外设外设程序地址程序地址数据读地址数据读地址数据写地址数据写地址程序读总线程序读总线数据读总线数据读总线程序程序/数据写数据写数据数据程序程序2022-12-1630/50CPU存储器总线非哈佛体系结构非哈佛体系结构哈佛体系结构哈佛体系结构2022-12-1631/50现代高速总线（改进现代高速总线（改进3）P41早期总线是CPU引脚的延伸，缺点：总线结构与处理器紧密相连，通用性差 CPU是总线唯一的主设备标准总线特点：总线结构与力求与处理器无关支持多主设备由总线仲裁器协调主设备对总线的请求有串行化趋势输入输出管理方式输入输出管理方式2022-12

35、-1632/50从上至下看，输入/输出方式的改进逐渐把CPU从输入/输出的管理工作中解放出来，提高了系统响应时间2.3.2 2.3.2 计算机体系结构的演进：并行计算机体系结构的演进：并行处理技术处理技术并行处理技术实现多个处理器或处理器模块的并行性，其基并行处理技术实现多个处理器或处理器模块的并行性，其基本思想包括本思想包括时间重叠、资源重复和资源共享时间重叠、资源重复和资源共享并行性是指计算机在同一时刻或同一时间间隔内进行多种运算或操作，它包括同时性和并发性。指令级并行技术指令级并行技术ISP流水线流水线、超标量、超长指令字、超标量、超长指令字系统级并行技术系统级并行技术SLP多处理器多

36、处理器（多机多机/多核多核）、多磁盘、多磁盘线程级并行技术线程级并行技术TLP同时同时多线程多线程SMT电路级并行技术电路级并行技术CLP组相联组相联cache、先行进位加法器、先行进位加法器四级流水线CPU的操作(1)(1)取指令级取指令级将待执行指令的地址发送到指将待执行指令的地址发送到指令存储器，并等待此指令返回。令存储器，并等待此指令返回。(2)(2)指令译码级指令译码级指令译码并从寄存器中取出所指令译码并从寄存器中取出所需的源操作数。需的源操作数。(3)(3)指令执行级指令执行级执行运算，并将其结果送至下执行运算，并将其结果送至下一阶段一阶段(4)(4)数据回写级数据回写级将

37、数据写回到寄存器或者数据将数据写回到寄存器或者数据存储器，或在决定分支跳转时写存储器，或在决定分支跳转时写入地址寄存器给出下一个指令的入地址寄存器给出下一个指令的地址。地址。指令时空图（一个周期执行一个步骤）指令时空图（一个周期执行一个步骤）串行串行顺序顺序执行执行4级流级流水线水线执行执行流水线满载流水线满载串行顺序执行：大部分硬件都处于空闲状态串行顺序执行：大部分硬件都处于空闲状态指令流水线：所有硬件都处于工作状态指令流水线：所有硬件都处于工作状态计算机流水线技术计算机流水线技术从硬件上看从硬件上看,通过分割通过分割逻辑逻辑,插入插入缓冲寄存缓冲寄存器器(流水线流水线Reg)来构来构建流

38、水线建流水线2022-12-1636/50超标量超标量CPU的体系结构的体系结构超标量技术：超标量技术：可在一个时钟周期内对多条指令进行并可在一个时钟周期内对多条指令进行并行处理，使行处理，使CPI小于小于1；特点：特点：处理器中有两个或两个以上的相同的功能部件；处理器中有两个或两个以上的相同的功能部件；要求操作数之间必须没有相关性；要求操作数之间必须没有相关性；整数指令整数指令浮点指令浮点指令yyyy-M-d2022-12-1637/50 超标量结构机器的例子超标量结构机器的例子两条输入流水线三条执行流水线每个时钟周期可每个时钟周期可从存储器中获取从存储器中获取两条指令两条指令用于执行不需

39、要访用于执行不需要访问存储器的指令问存储器的指令可处理所有需要或不需可处理所有需要或不需要访问存储器的指令要访问存储器的指令可用于进行乘、除类可用于进行乘、除类较复杂的算术运算较复杂的算术运算决定应使用哪一决定应使用哪一条执行流水线条执行流水线2022-12-1638/502022-12-1639/50多机并行系统多机并行系统大规模并行处理机（大规模并行处理机（MPP）是是一种价格昂贵的超级计算机，它由许一种价格昂贵的超级计算机，它由许多多CPU通过高速专用互联网络连接。通过高速专用互联网络连接。机群（机群（cluster）由多台同构或异构的独立计算机通过高性能网络或局由多台同构或异构的独立计

40、算机通过高性能网络或局域网连在一起协同完成特定的并行计算任务。域网连在一起协同完成特定的并行计算任务。刀片（刀片（blade）通常指包含一个或多个通常指包含一个或多个CPU、内存以及网络接口的服务、内存以及网络接口的服务器主板。通常一个刀片柜共享其它外部器主板。通常一个刀片柜共享其它外部I/O和电源，而辅助存储器则有距离和电源，而辅助存储器则有距离刀片柜较近的存储服务器提供。刀片柜较近的存储服务器提供。网格（网格（Network）是一组由高速网络连接的不同的计算机系统，可以是一组由高速网络连接的不同的计算机系统，可以相互合作也可独立工作。网格计算机将接受中央服务器分配的任务，然后在相互合作也可

41、独立工作。网格计算机将接受中央服务器分配的任务，然后在不忙的时候（如晚上或周末）执行这些任务。不忙的时候（如晚上或周末）执行这些任务。多线程技术多线程技术单片多处理器单片多处理器(Chip MulitProcessor，CMP)问题问题：晶体管数量、芯片面积及芯片发热量晶体管数量、芯片面积及芯片发热量多线程处理器多线程处理器(Multithreaded Processor)细粒度多线程细粒度多线程(Fine-Grail Multithreading)在每个指令中切换线程在每个指令中切换线程，处理器必须能在每个时钟周期切换线程。处理器必须能在每个时钟周期切换线程。其其优点是可以隐藏停顿优点是可以

42、隐藏停顿引起的吞吐量损失引起的吞吐量损失；缺点是单个线程处理速度变慢了。缺点是单个线程处理速度变慢了。粗粒度多线程粗粒度多线程(Coarse-Grail Multithreading)仅当遇到开销大的阻仅当遇到开销大的阻塞时才切换线程塞时才切换线程其其缺陷在于流水线启动开销引起吞吐量损失，特缺陷在于流水线启动开销引起吞吐量损失，特别是对于短的阻塞别是对于短的阻塞2022-12-1640/50 19661966年年M.J.FlynnM.J.Flynn按照指令流和数据流的不同按照指令流和数据流的不同组织方式，把计算机系统的结构分为以下组织方式，把计算机系统的结构分为以下4 4类：类：(1)(1)单

43、指令流单数据流单指令流单数据流 SISDSISD 早期的计算机都是SISD机器，如冯诺.依曼架构、IBM PC机、早期的巨型机(2)(2)单指令流多数据流单指令流多数据流 SIMDSIMD 用于数字信号处理、图像处理、以及多媒体信息处理(3)(3)多指令流单数据流多指令流单数据流 MISDMISD 只是作为理论模型出现，没有投入到实际应用之中(4)(4)多指令流多数据流多指令流多数据流 MIMDMIMD 最新的多核计算平台就属于MIMD的范畴，例如Intel和AMD的双核处理器等都属于MIMD 2.4 计算机体系结构的分类计算机体系结构的分类（P52）CUPUISCSDSSISDSISD计

44、算机计算机MMSISD计算机计算机典型是单处理器系统，典型是单处理器系统，特点：每次对一条指令进行译码，并仅特点：每次对一条指令进行译码，并仅对一个操作部件分配数据。对一个操作部件分配数据。CU:控制单元，控制单元，PU：处理单元，：处理单元，MM：存储体：存储体CS：控制流，：控制流，IS：指令流，：指令流，DS：数据流：数据流PU1PU2PUNCUSMDS1DS2DSNISCSSIMDSIMD计算机计算机MM1MM2MMN特点：多个特点：多个PUPU按一定方式互连，在同一个按一定方式互连，在同一个CUCU控制下，各自的数据完成同一条指令规定的控制下，各自的数据完成同一条指令规定的操作；从操

45、作；从CUCU看，指令顺序（串行）执行，从看，指令顺序（串行）执行，从PUPU看，数据并行执行。看，数据并行执行。MISDMISD计算机计算机CU1CU2CUNPU1PU2PUNSMIS1IS2ISNDSDSCS1CS2CSNIS2ISNMM1MM2MMN特点特点:MISD 几条指令对同一个数据进行几条指令对同一个数据进行不同的处理，不同的处理，实际上不存在实际上不存在.SMMM1MM2MMNCU1CU2CUNPU1PU2PUNISNDSNDS1CS1CS2CSNIS1IS2ISNDS2MIMD计算机计算机MIMD 多处理机系统，包括：多处理机系统，包括：特点：能实现作业、任务、指令、数组各级

46、全特点：能实现作业、任务、指令、数组各级全面并行的多机系统。面并行的多机系统。1.字长字长是指计算机一次能够处理（算术运算、逻辑运算、存储、复制等操作）的最大数据宽度（位数）。字长通常与通用寄存器、ALU以及系统数据总线的宽度匹配。2.访存空间访存空间是指CPU能够直接访问的存储单元（主存单元）数量，一般由CPU的地址总线宽度决定。32位地址总线能直接访问232=4GB。2.5 计算机性能评测计算机性能评测（P54）计算机系统的性能主要由硬件性能和程序特性决定，通常可利用标准测试程序来测定性能。用MIPS(Million Instructions Per Second,每秒百万条指令)或M

47、FLOPS(每秒百万次浮点操作)的数值来衡量计算机系统的硬件速度。用 CPU执行时间T来量化软硬件结合系统的有效速度。MIPS=f(MHz)/CPI T(s)=(IC CPI)/f(Hz)f（时钟频率）：CPU的基本工作频率IC（指令数目）：运行程序的指令总数CPI（Cycles Per Instruction）：指令执行的平均周期数，可从运行大量程序的数据中统计(理想的单流水线计算机理想的单流水线计算机CPI=1)CPI=1)3.运算速度4.系统响应时间(P42)系统响应时间包括CPU的处理时间和I/O系统的响应时间。假设一台计算机的时钟频率是100 MHz(每秒百万周期)，具有4种类型的指令，它们的使用率和CPI分别如下表所示。求该计算机的MIPS值以及运行一个具有107条指令的程序所需的CPU时间。76CPI0.420.340.082.50.2230.81.20.20.062.86MIPS100/2.8635102.86/(10010)0.286(s)T计算机系统性能量度值计算计算机系统性能量度值计算注意：理想的单流水线计算机注意：理想的单流水线计算机CPI=1CPI=1第二章第二章习题习题作业：作业：2626、1414、1515思考：思考：1 1、7137132022-12-162022-12-1649/322022-12-1649/50

展开阅读全文