第五章-标量流水线技术-《计算机系统结构》课件.ppt

上传人(卖家):晟晟文业 文档编号:5170711 上传时间:2023-02-15 格式:PPT 页数:70 大小:997KB
下载 相关 举报
第五章-标量流水线技术-《计算机系统结构》课件.ppt_第1页
第1页 / 共70页
第五章-标量流水线技术-《计算机系统结构》课件.ppt_第2页
第2页 / 共70页
第五章-标量流水线技术-《计算机系统结构》课件.ppt_第3页
第3页 / 共70页
第五章-标量流水线技术-《计算机系统结构》课件.ppt_第4页
第4页 / 共70页
第五章-标量流水线技术-《计算机系统结构》课件.ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

1、1第五章第五章 标量流水线技术标量流水线技术(P253)P253)5.1 基本名词术语(P253)标量处理机:标量处理机指只能直接进行标量运算的处理机。提高处理机指令执行速度的主要途径有:提高主频;设计更好的算法和功能部件;指令级并行主要方法,又可分为:a流水线技术和超流水线技术;b超标量技术;cVLIW;指令级并行技术:指能使多条指令并行执行的技术,包括流水技术、多操作部件技术和超长指令字技术;流水线处理机:指用流水作业方式并行解释多条指令的处理机。本章学习标量计算机上使用的流水加速技术。主要内容有流水技流水技术的分类术的分类、流水线性能指标计算流水线性能指标计算、非线性流水线的调度算法非线

2、性流水线的调度算法。2基本名词术语(P253)标量处理机,超标量处理机:标量处理机指只能进行标量运算的处理机,超标量处理机指能在一个时钟周期内同时发射多条指令的处理机;流水线处理机,超流水线处理机:流水线处理机指用流水作业方式并行解释多条指令的处理机,超流水线处理机指能在一个时钟周期内分时发射多条指令的处理机;超长指令字技术VLIW:指让一条指令包含多个独立的操作字段,并且分别控制多个功能部件并行工作的技术。35.1 流水处理的基本思想456流水技术 n流水技术:将一个重复的时序过程分解成为若干个子过程,而每个子过程都可有效地在其专用功能段上与其他子过程同时执行。n时空图从时间和空间两个方面描

3、述了流水线的工作过程。时空图中,横坐标代表时间,纵坐标代表流水线的各个段。n CPU中的各个部件按流水处理顺序连接起来,就称为一条流水线。7 流水线结构图(P278)t1t2t3t4 入口出口图 5.1 流水线结构图 流水线工作时空图(P278P279)85.2 流水处理流水处理顺序方式顺序方式是解释完一条指令再开始解释下一条(P254);重叠方式重叠方式是一种简单的流水方式,它把指令分成2个子过程,每条指令只与下一条指令相重叠(P255)。流水方式流水方式是把一个重复的过程分解为若干个子过程,每个子过程可以与其它子过程同时进行,以此提高单位时间内解释指令的数目(P277);流水线是一种通过改

4、进结构来提高程序解释速度的方法。5.2.1 流水线工作原理 处理机解释程序的方式有顺序方式顺序方式、重叠方式重叠方式、流水方式流水方式等。9 重叠方式流水线当分析部件完成上一条指令的“分析”后,就立即将之送入执行部件,同时分析部件可以开始处理下一条指令。虽然从执行一条指令的全过程来看,仍需要2t的时间,但从机器的输出端来看,却是每隔一个t就能给出一条指令的执行结果。10空间(段号)123412341234 1234 16 时间(拍)(a)顺序方式空间(段号)1234 1234 10时间(拍)(b)重叠方式空间(段号)123412341234 1234 7时间(拍)t(c)流水方式图3.2 CP

5、U 工作时空图111.流水过程由多个相联系的子过程组成,每个子过程称为流水线的级或段,段的数目称为流水线的深度。2.把一个任务分解为几个有联系的子任务,每个子任务由一个专门的功能部件来实现。3.在流水线的每一个功能部件的后面都要有一个缓冲器,用于保存本段的执行结果。5.在流水线中处理的必须是连续任务,只有不断的提供任务才能充分发挥流水线的效率。6.流水线需要有“装入时间”和“排空时间”。流水线的特点125.2 流水技术的分类(P280)线性/非线性(P280):部件级/处理机级/处理机间级(宏流水线)(P281):单功能/多功能(P282):静态/动态(P283):标量/向量(P285):同步

6、/异步(P285):顺序/乱序(P285、P304):13 2.部件级/处理机级/处理机间级(宏流水线)(P281)功能部件级:运算操作流水线处理机级:指令流水线处理机间级:宏流水线14 1.线性/非线性(P280)功能段间是否有反馈信号15 3.单功能/多功能(P282)单功能流水线:只能完成一种固定功能。多功能流水线:流水线各段可以进行不同连接,实现不同功能。P283 图5.32164.静态/动态(P283)(对多功能流水)静态:一段时间内一种固定方式连接,实现一种固定功能;动态:一段时间内,各段按不同方式连接,同时执行多种功能。175.标量/向量(P285)-数据表示不同6.同步/异步(

7、P285)对线性流水线的控制方式不同7.顺序/乱序(P285、P304)输出与输入任务的顺序是否相同 18 5.3 逻辑相关逻辑相关(P263-276)全局性相关/局部性相关(P312、P269/P263、P303);控制相关:控制相关是指由条件分支指令、转子程序指令、中断等引起的相关数据相关:在执行本条指令过程中,若用到的指令、操作数、变址偏移量等正好是前面指令的执行结果,则须等待前面指令执行完成,并把结果写到内存或通用寄存器之后,本条指令才能开始执行,这种相关称为数据相关。1)“先写后读”相关 (p306)(1)延迟执行 2)“先读后写”相关(2)专用路径 3)“写-写”相关(3)sw/h

8、w避免相关指令相关/数相关(P264/P263);主存数相关/寄存器数相关(P265/P266);数值相关/变址值相关(P266/P268)。相关的定义:(P263倒数第4段)所谓相关(correlation)流水线中的相关是指相邻或相近的指令因存在某种关联,后面的指令不能在原指定的时钟周期开始执行。相关的分类及其对策:相关的分类及其对策:19 5.4.1 吞吐率TP(P285)吞吐率(TP ThroughPut rate)指流水线在单位时间内执行的任务数,可以用输入任务数或输出任务数表示。,其中n为任务数,k表示流水线划分的段数,Tk是处理完n个任务所用时间。实际吞吐率实际吞吐率/最大吞吐率

9、最大吞吐率5.4 5.4 线性流水线性能分析线性流水线性能分析(P285)-(P285)-吞吐率TPkTnTP 20当满足 且无相关条件时,有ttitknTk)1(5.4 5.4 线性流水线性能分析线性流水线性能分析实际吞吐率:最大吞吐率:21n流水线各段的执行时间不等 22n流水线各段的执行时间不等 n实际吞吐率:n最大吞吐率:),.,max()1(111kkiitttntTPn),.,max(max111ktttTP23tTP1max5.4 5.4 线性流水线性能分析线性流水线性能分析-细分“瓶颈”n流水线各段的执行时间不等,则执行时间最长的段就是流水线的瓶颈。解决瓶颈的方法是:n再细分“

10、瓶颈”段 将瓶颈设备再细分为下一级流水线245.4 5.4 线性流水线性能分析线性流水线性能分析-并行设置 n并行设置 将瓶颈设备重复设置多套,轮番接受任务注意两种方法的时空图不同。tTP1max25一般表示:实际加速比:最大加速比:=流水深度流水深度 其中koTTS kiiotnT1knknkLimSn)1(*max1*)1(*nknktnktnkS5.4.2 5.4.2 加速比加速比(P288)(P288)不使用流水线所用的时间与使用流水线所用的时间之比5.4 5.4 线性流水线性能分析线性流水线性能分析-加速比加速比26Pipeline Illustrated:GateDelayComb

11、.Logicn Gate DelayGateDelayLGateDelayLLGateDelayLGateDelayLLBW=(1/n)n-2n-2n-3n-3n-3BW=(2/n)BW=(3/n)5.4 5.4 线性流水线性能分析线性流水线性能分析流水深度流水深度k k27Performance ModelnStarting from an unpipelined version with propagation delay T and BW=1/TPpipelined=BWpipelined=1/(T/k+S)whereS=delay through latchTSST/kT/kk-sta

12、ge pipelinedunpipelined5.4 5.4 线性流水线性能分析线性流水线性能分析流水深度流水深度28Hardware Cost ModelnStarting from an unpipelined version with hardware cost GCostpipelined=kL+G where L=cost of adding each latch,and k=number of stagesGLLG/kG/kk-stage pipelinedunpipelined5.4 5.4 线性流水线性能分析线性流水线性能分析流水深度流水深度29Cost/Performance

13、:C/P=Lk+G/1/(T/k+S)=(Lk+G)(T/k+S)=LT+GS+LSk+GT/kOptimal Cost/Performance:find min.C/P k Cost/Performance Trade-off kdd LkG+1Tk-S+-00LSGTk2-+=koptGTLS-=L SG Tk2-0=kC/PG=an unpipelined version with hardware costT=an unpipelined version with propagation delay S=delay through latchL=cost of adding each

14、latch5.4 5.4 线性流水线性能分析线性流水线性能分析流水深度流水深度30段效率:,各段平均效率:其中 表示第i段设备量占整条流水线全部设备量的百分比。当满足 条件(即等长、等权)时,有:kiiTtnEkiiiEE1)(kttii1和ikSTkTtTknEkEkikikoiki11)(1上式指出,S=Ek,就是说当效率达到100%时,流水方式(一个任务/t)吞吐率为顺序方式(一个任务/(kt))的k倍。5.4.3 5.4.3 效率(设备利用率,效率(设备利用率,P289P289)5.4 5.4 线性流水线性能分析线性流水线性能分析-效率效率3132 例例5.1(P292)5.1(P29

15、2)分析:已知下列表达式,有相关,单功能,k=4,n=7。要求最少相关,用“二叉树算法”以减少相关。Z=A+B+C+D+E+F+G+H 5.4.4 5.4.4 性能分析实例性能分析实例 (P292)(P292)33 例例5.2(P293)5.2(P293)分析:已知下列表达式,二功能,有切换,有相关,k=8,n=7。要求用最少切换、最少相关算法。Z=A B+C D+E F+G H乘法:加法:加法:345.5 5.5 非线性流水线调度技术非线性流水线调度技术(P294)(P294)调度问题的提出调度问题的提出:一个任务在通过非线性流水线时对有些功能段要一个任务在通过非线性流水线时对有些功能段要通

16、过多次通过多次(非线性定义),所以容易与紧跟而来的后继任务发生(非线性定义),所以容易与紧跟而来的后继任务发生设备争设备争用用。调度机构的作用就是合理安排前后任务进入流水线的调度机构的作用就是合理安排前后任务进入流水线的相差相差时间时间,既要,既要避免争用避免争用,又要使,又要使相差时间尽可能少相差时间尽可能少,以提高吞吐,以提高吞吐率。率。351.非线性流水线的表示S1 S2 S3S4 一条非线性流水线一般需要一个各功能段间的连接图和一张预约表共同表示。下图是一条4个功能段组成的非线性流水线,它有从S1到S4 的单方向传输线。但它有两条反馈线和一条前馈线;输出端不一定在最后一个功能段,而可能

17、从任意一个功能段输出。输出 输入362.非线性流水线的预约表 S4 S3 S2 S1 7 6 5 4 3 2 1 时间功能段373.对于非线性流水线的表示 预约表的横坐标表示流水线的时钟周期,纵坐标表示流水线的功能段,中间有“”的表示该功能段在这一个时钟周期处于工作状态,即在这个时钟周期有任务通过这个功能段;空白的表示该功能段在这一个时钟周期不处于工作状态。预约表行数是非线性流水线的段数;而列数是一个任务从进入流水线到从流水线中输出所经历的时钟周期数。一张非线性流水线的预约表可能与多个非线性流水线连接图相对应;同样,一个非线性流水线的连接图也可能对应有多张预约表。384.非线性流水线的冲突 非

18、线性流水线的启动距离:向一条非线性流水线的输入端连续输入 两个任务之间的时间间隔。非线性流水线的冲突:当以某一个启动距离向一条非线性流水线连 续输入任务时,可能在某一个功能段或某几个 功能段中发生有几个任务同时争用同一个功能 段的情况。5.无冲突调度方法目标:找出具有最小平均启动时间的启动循环,按照这样的启动循 环向非线性流水线的输入端输入任务,流水线的工作速度最 快,而且所有功能段在任何时间都没有冲突。39 算法算法:共:共5个步骤个步骤第第1步步.分析分析预约表预约表R(P295图图5.44)描述非线性流水线有描述非线性流水线有2种图形:种图形:(a)(a)连接图连接图,仅给出各段之间的静

19、态,仅给出各段之间的静态空间连接关系;空间连接关系;(b)(b)预约表预约表,就是一个任务通过流水,就是一个任务通过流水线的时空图,能全面反映该流水线线的时空图,能全面反映该流水线的动态特性的动态特性。要检验要检验2 2个任务相距个任务相距k k拍是否冲突,可将它们的预约表错位拍是否冲突,可将它们的预约表错位k k列重叠(上图)。列重叠(上图)。第第2步步.作作禁止表禁止表F(P297倒数第倒数第2段)段)F是是1-N之间可冲突拍数的集合,之间可冲突拍数的集合,N是预是预约表的列数减约表的列数减1。具体操作是将同一行中任意具体操作是将同一行中任意2 2个标记之间的拍数差记下来,再将个标记之间的

20、拍数差记下来,再将各行的这类数字汇成一个集合,即为禁止表。本例中各行的这类数字汇成一个集合,即为禁止表。本例中 F=3F=3,4 4,6 6 5.5.1 5.5.1 不改变流水线结构的调度方法不改变流水线结构的调度方法(P295)(P295)时间段1234567S1111S211S311S41 时间段1234567S1222S222S322S4240第3步.作原始冲突向量C(P298倒数第3段)为了设计调度机构,需将禁止表转化为原始冲突向量C。C是含N个分量的布尔向量,一般形式为C=(cN.c1),其中N是预约表的列数减1,也可以是禁止表中的最大元素。第i个分量取值原则为:本例中 C=(101

21、100)FiFici,当,当1041 动态冲突向量 (初值000000)右移寄存器:0 010110右移出0“或”运算器:按位“或”0接通1断开常量发生器:101100 原始冲突向量 时钟输入 流水线任务排队1.每个时钟脉冲使流水线中现有任务前进一步,也使右移寄存器移出一位;2.如果新任务进入,则用它的原始冲突向量与右移寄存器内容相“或”。使用使用冲突向量冲突向量C实现调度的原理图实现调度的原理图42第4步.作状态转移图(P299图5.51)这是为了研究无穷多个任务时任务之间可能存在的合法间隔情况。从表达方便考虑,用动态冲突向量作为状态变量。具体作图方法是:(1)先画“根结点”,它就是第一个任

22、务进入后的右移寄存器状态,数值等于原始冲突向量;(2)分析当前结点的各位,如果ci=0则发出一个旁标i值的箭头,ci=1则不能发出箭头,因为1表示“禁止”。此外还发出一个旁标“N+1”的箭头,“N+1”意为“N+1”;(3)每个箭头末端产生一个新的结点,其状态等于原结点状态右移i位后与原始冲突向量相“或”;(4)如果新结点状态与已有的结点重复,则取消它,箭头指向已有的那个结点。000000 初态 1 7*101100 7*7*1 5 2 7*7*111110 101111 1 5 2111111 101101 543第5步.作平均延迟拍数表(P300表5.1)(1)在状态转移图中寻找全部简单循

23、环填入右表第1栏。所谓简单循环是指其中各结点仅通过一次的闭合路径。注意它不一定要通过根结点;(2)计算各简单循环的平均间隔拍数填入右表第2栏。平均间隔拍数等于该简单循环中所有数字之和除以数字个数;(3)取平均延迟拍数最少的方案作为最优方案。本例为(1,1,7);(4)调度机构实现:计数器加译码电路。本例可用模9计数器,译码条件是计数值等于0、1、2时允许进入流水线。简单循环简单循环平均启动距离平均启动距离(1,71,7)4 4(1,1,71,1,7)3 3(2,72,7)4.54.5(2,52,5)3.53.5(2,5,72,5,7)7 7(5,75,7)6 6(5 5)5 5(7 7)7 7

24、(5,2,75,2,7)4.74.744时间功能段1S1S2S3S42345678910 1111111,21,211,2,322222,333,33,4,4 4455.5.2 5.5.2 改变流水线结构的优化调度方法改变流水线结构的优化调度方法 预留算法预留算法(P301)(P301)目的:等间隔的最小延迟调度方案 方法:插入延迟器件第1步,确定相邻任务间隔拍数:因为最小间隔拍数是一行内“”的最大数目(第11行),取最小间隔拍数。第2步,确定插入延迟器件位置的原则(P302第2行):从第一个“”开始,凡是相距最小间隔拍数整倍数位置的“”都要向后推迟。实例(P301倒数第7行):1.确定间隔拍

25、数(最多3个“”,所以是3拍);2.插入延迟器件(使各行“”的间距不为3的倍数);3.修改预约表(P302图5.53(a));4.写调度方案(3)。(示意图见下页)4647a.未插入延迟段(每隔3拍启动一个任务)时间功能段123415263741852963107411851296S111,21,2,32,3,4S211,22,33,4S31213243S41234b.仅插入1个延迟段D1(每隔3拍启动一个任务)时间功能段123415263741852963107411851296S112131,242,3S21213243S3121324S41234D1123c.插入2个延迟段D1、D2(每

26、隔3拍启动一个任务)时间功能段123415263741852963107411851296S1121321432S21213243S3121324S41234D1123D212485.6 超标量/超流水/超长指令字技术(P320)本节学习其它指令级并行技术。主要内容有超标量技术超标量技术、超流水技术超流水技术、多操作部件技术多操作部件技术、超长指令字技术超长指令字技术。下面是一些相关的名词术语(P253)标量处理机,超标量处理机:标量处理机指只能进行标量运算的处理机,超标量处理机指能在一个时钟周期内同时发射多条指令的处理机;指令级并行技术:指能使多条指令并行执行的技术,包括流水技术、多操作部件

27、技术和超长指令字技术;流水线处理机,超流水线处理机:流水线处理机指用流水作业方式并行解释多条指令的处理机,超流水线处理机指能在一个时钟周期内分时发射多条指令的处理机;超长指令字技术VLIW:指让一条指令包含多个独立的操作字段,并且分别控制多个功能部件并行工作的技术。49一、超标量处理机一、超标量处理机1普通标量处理机普通标量处理机-只有一条流水线,每个时钟周期只有一只有一条流水线,每个时钟周期只有一条指令流入流水线。条指令流入流水线。分为两种类型。分为两种类型。(1)单操作部件流水线处理机单操作部件流水线处理机ILP150n(2)多操作部件流水线处理机nILP151n2单发射与多发射处理机单发

28、射与多发射处理机n(1)单发射处理机)单发射处理机只有一套指令部件(取指部只有一套指令部件(取指部件和译码部件),并且每个时钟周期只取一条指令,件和译码部件),并且每个时钟周期只取一条指令,只对一条指令进行译码。只对一条指令进行译码。52n 单发射处理机,ILPILP155二。超标量处理机:二。超标量处理机:n通常,把通常,把一个时钟周期内能够一个时钟周期内能够同时同时发射多条指令发射多条指令的处理机称为的处理机称为超标量处理机超标量处理机。(P324倒倒2行)行)n超标量处理机最基本的要求是必须有超标量处理机最基本的要求是必须有两套或两条两套或两条以上完整的指令执行部件以上完整的指令执行部件

29、。为了能够在一个时钟。为了能够在一个时钟周期内同时发射多条指令,超标量处理机必须有周期内同时发射多条指令,超标量处理机必须有两条或两条以上能够同时工作的指令流水线。两条或两条以上能够同时工作的指令流水线。n超标量处理机指令调度要解决的问题超标量处理机指令调度要解决的问题 数据相关数据相关 控制相关控制相关 功能部件冲突功能部件冲突(指令序列要求)指令序列要求)n56 超标量技术:时空图见P323图5.71(b)。指令999988887777666655554444333322221111123456节拍57 超流水技术:(超流水技术:(P333第第1行)行)在一个基本时钟周期内能够在一个基本时

30、钟周期内能够分时分时发发射多条指令的处理机称为超流水线处理机射多条指令的处理机称为超流水线处理机。在有些资料上把指令流水线的级数为在有些资料上把指令流水线的级数为8级或超过级或超过8级的流水线处理级的流水线处理机称为超流水线处理机。机称为超流水线处理机。时空图见P333图5.79。指令999988887777666655554444333322221111123456节拍58n超流水线处理机工作方式与超标量处理机不同超流水线处理机工作方式与超标量处理机不同,n超标量处理机是通过重复设置多个超标量处理机是通过重复设置多个“取指令取指令”部件,部件,设置多个设置多个“译码译码”、“执行执行”和和“

31、写回结果写回结果”部件,部件,并且让这些功能部件同时工作来提高指令的执行速度,并且让这些功能部件同时工作来提高指令的执行速度,实际上是以增加硬件资源为代价来换取处理机性能的;实际上是以增加硬件资源为代价来换取处理机性能的;n超流水线处理机则只需要超流水线处理机则只需要增加少量硬件增加少量硬件,是,是通过各部通过各部分硬件的充分重叠工作来提高处理机性能分硬件的充分重叠工作来提高处理机性能的。的。n从流水线时空图上看,超标量处理机采用的是空间并从流水线时空图上看,超标量处理机采用的是空间并行性,而超流水线处理机采用的是时间并行性。行性,而超流水线处理机采用的是时间并行性。59n3典型结构典型结构n

32、在早期生产计算机,巨型计算机在早期生产计算机,巨型计算机CRAY-1和大型计算机和大型计算机CDC7600属于超流水线处理机,属于超流水线处理机,ILP=3。n在目前大量使用的微处理器中,只有在目前大量使用的微处理器中,只有SGI公司公司MIPS(microprocessor without Interlocked piped stages)系列)系列属超流水线处理机。属超流水线处理机。(MIPS是除是除Intel公司公司X86系列微处理器外,生产量系列微处理器外,生产量最大的一种微处理器)最大的一种微处理器)MIPS系列微处理器主要有系列微处理器主要有R2000、R3000、R4000、R5

33、000和最近刚投放市场的和最近刚投放市场的R10000几种。几种。nR4000的指令流水线有的指令流水线有8级,如下图。采用超流水线结构,取指级,如下图。采用超流水线结构,取指令和访问数据都要跨越两个流水级;每个时钟周期包含两个流令和访问数据都要跨越两个流水级;每个时钟周期包含两个流水级,处理器取第一条指令(水级,处理器取第一条指令(IF)和取第二条指令()和取第二条指令(IS)60n两个流水级都要访问指令Cache,这两个流水级为一个时钟周期。61四超标量与超流水处理机超标量超流水线处理机超标量超流水线处理机在一个时钟周期内要发射指在一个时钟周期内要发射指令令n次,每次发射指令次,每次发射指

34、令m条条,因此,超标量超流水,因此,超标量超流水线处理机线处理机每个时钟周期总共要发射指令每个时钟周期总共要发射指令mn条条。62mn图中每一时钟周期分为图中每一时钟周期分为3个流水线周期,每一流水线周期发射个流水线周期,每一流水线周期发射3条指令。条指令。每个时钟周期能够发射并执行完成每个时钟周期能够发射并执行完成9条指令。因此,理想情况下,超标条指令。因此,理想情况下,超标量超流水线处理机执行程序速度应该是超标量处理机和超流水线处理机量超流水线处理机执行程序速度应该是超标量处理机和超流水线处理机执行程序速度的乘积。执行程序速度的乘积。63超标量/超流水线/超标量超流水线处理机 机器类型K段

35、流水线基准标量处理机M度超标量处理机N度超流水线处理机(M,N)超标量超流水线处理机机器流水线周期1个时钟周期 1 1/N 1/N同时发射指令条数 1条 M 1 M指令发射等待时间1个时钟周期 1 1/N 1/N指令级并行度 1 M N M*N64主要特点:(1)单一的控制流。只有一个控制器,每个周期启动一条指令。(2)超长指令字被分成多个控制字段,每个字段直接独立地控制每个功能部件。(3)含有大量的数据通路和功能部件,由于编译器在编译时间已考虑可能出现的数据相关和资源相关,故控制硬件较简单。(4)在编译阶段完成超长指令中多个可并行执行操作的调度。超长指令字技术VLIW指让一条指令包含多个独立

36、的操作字段,并且分别控制多个功能部件并行工作的技术。65nVLIW hardware is simple and straightforward,like SIMD machines.nWhile SIMD broadcasts one instruction,VLIW separately directs each functional unitadd r1,r2,r3FUFUFUFUadd r1,r2,r3FUFUFUFUload r4,r5+4mov r6,r2mul r7,r8,r9SIMDInstructionExecutionVLIWInstructionExecution6601

37、23456T3个操作个操作每拍启动一条长指令,执行每拍启动一条长指令,执行3个操个操作,相当于作,相当于3条指令,要求并行度条指令,要求并行度=3超长指令字计算机(超长指令字计算机(VLIW)的原理结构)的原理结构 675.7 5.7 精简指令系统(精简指令系统(RISCRISC)技术)技术(P111)(P111)什么是RISC?(P107)CISC和RISC是指令系统设计的两种思路,前者注重功能多,后者注重速度快。双方各自发展了很多特色技术。RISC主要用于工作站和其它高性能计算机,以UNIX操作系统为主。IBM-PC个人计算机以CISC为主,吸收了RISC若干适宜技术。20%与80%规律(

38、P112):统计表明,CISC中20%常用指令使用率高达80%,其它为非常用指令。RISC定义与特点(P115)一个周期;一种访存寻址方式;硬联译码;简化指令;固定指令格式;优化译码。减少CPI是RISC思想的精华(P116)分析公式:T=IC CPI CYCLE,RISC使IC增加,其它两项减少。68RISC的关键技术的关键技术(P118)1.延时转移技术:将转移指令与它前面的不相关指令对调位置,以利用计算目的地址的时间。2.指令取消技术:在条件转移指令解释期间提前启动最有可能的一个分支的后继指令,如果“猜”错则及时取消,“猜”对则赢得了时间。3.重叠寄存器窗口技术:用寄存器组代替堆栈传递参数,减少访问主存。4.指令流调整技术:用换名消除相关,消除不了的相关就调整顺序。5.少数复杂指令用微程序实现:不常用的复杂指令用微程序实现,避免专设电路,对平均速度影响也不大。6970本章小结本章小结(1)流水处理与相关的概念;(2)时空图画法及其应用;(3)7种流水线分类方法;(4)3个流水线性能指标;(5)2种“瓶颈”解决方法;(6)2种非线性流水线调度方法;(7)超标量与超流水技术的概念;(8)精简指令系统(RISC)技术。习题:P343,题9,题15。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第五章-标量流水线技术-《计算机系统结构》课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|