内容发布更新时间 : 2024/11/17 12:30:43星期一 下面是文章的全部内容请认真阅读。
现时间就越少。
原则二 看引入这种数据表示后,其通用性和利用率是否提高。如果只对某种数据结构的实现效率很高,而对其他数据结构的实现效率很低,或者引入这种数据表示在应用中很少用到,那么为此所耗费的硬件过多却并未在性能上得到好处,必然导致性能价格比的下降。
P33 习题1 6,7,10,11 第一章 Amdahl定理(大题1个) P79 习题2 9,10,11,12 (第二章 哈夫曼编码,大题1个) P109习题3 5,6,8
第三章 P89中断屏蔽位设置(大题1个) P195 习题5 6,11
第五章 P185 流水线预约表及状态图(大题1个)
P200 习题6 1,2,5
第六章 P200 链接图会画(大题1个)
40、有两台机器,它们对条件转移指令的处理采用不同的设计方案:(1)CPUA采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行测试,以确定是否进行转移。因此实现一次条件转移要执行比较和测试两条指令。(2)CPUB采用比较和测试两种能合在一条指令的方法,这样实现条件转移只需一条指令。
假设在这两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其他指令只需1个时钟周期。又假设CPUA中,条件转移指令占总执行指令条数20%。由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。由于CPUB在转移指令中含了比较功能,因此它的时钟周期就比CPUA要慢25%。问CPUA和CPUB哪个工作速度要快些?
41、假设FPSQR操作占整个测试程序执行时间的20%。改进的一种方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种方法是使FP指令的速度提高到2倍,FP指令占整个执行时间的50%。比较两个设计方案。 42、假设要将某一执行部件改进后速度提高10倍,改进后被改进部件执行时间占系统总运行时间的50%.问改进后,获得的加速比Sp是多少? 43、假设Cache的工作速度是主存的5倍,且Cache被访问命中的概率为90%.问:采用Cache后,能使整个存储系统获得多高的加速比? 44、为提高某计算机运算速度,决定增加向量处理部件.此时处理向量的速度比其通常的运算速度要快20倍.现定义向量处理部件运算的时间占总时间的百分比称为可向量化百分比. (1)求出加速比和可向量化百分比之间的关系.
(2)若要得到加速比为2.5,可向量化百分比是多少? 45、某计算机Cache能存放2000条指令.假设10%的指令承担了90%时间的指令访问,且知这10%指令中每条指令的执行时间相同.如果要执行的某程序共50000条指令,且已知其中的10%是频繁使用的.问:当计算机执行该程序时,在Cache中能访问到的指令会占多少百分比?
58、下列5条指令组成的程序在一台3段流水线处理机上执行,每一流水段上都有相关检测和分解。这3个流水段是取指令IF、取操作数OF(一个或多个)、执行EX(包括写回)。程序中ACC为累加寄存器,M为存储器。 请画时时空图说明:(1)在程序执行中所有可能出现的相关情况,(2)避免相关发生的调度方法。
INC R0 ; R0?(R0)+1 MVL ACC,R0;ACC?(ACC)*(R0) STR R1,ACC; R1?(ACC)
ADD ACC,R0 ; ACC?(ACC)+(R0) STA M,ACC ; M?(ACC)
59、在一台流水线处理机上执行下面程序。 I1 SUB R0,R0 ; R0?0
I2 LOAD R1,#8 ; R1?向量长度8
I3 Loop:LOAD R2,A(R1) ; R2?A向量的第1个元素 I4 MUL R2,R1; R2?(R2)*(R1) I5 ADD R0,R2; R0?(R0)+(R2)
I6 DNE R1 Loop; R1?(R1)-1,若(R1)?0转向Loop I7 STORE R0,M(x); 保存结果 每条指令都要经过“取指”、“译码”、“执行”、“写结果”4个流水段,每个流水段延迟都是5ns。但在“执行”流水段LS部件和ALU部件只能其中一个工作,其中LS部件完成LOAD和STORE操作,ALU部件完成其他操作。这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU部件产生的条件码也直接送入控制器。假定采用静态分支预测技术,每次都预测转移不成功。要求:
(1)画出指出指令流水线的时空图(中间部分可省略,图中可用指令序号表示) (2)计算流水线的吞吐率和加速比,并分别计算译码部件和ALU部件的使用效率。 60、一条有4个流水段的非线性流水线,每个流水段的延迟时间都相等,它的预约表如下图:
时间 流水段 S1 S2 S3 S4 1 2 3 4 5 6 7 X X X X X X X (1)写出流水线的禁止向量和初始冲突向量; (2)画出调度流水线的状态图;
(3)求流水线的最小启动循环和最小启动距离; (4)求平均启动距离最小的恒定循环。
(5)按最小启动距离调度任务时,有10个任务进入流水,画出时空图,计算实际吞吐率。
61、在一个5段的流水线处理机上需经9拍才能完成一个任务,其预约表为:
时t0 间 流水段 S1 S2 S3 S4 S5 t1 t2 t3 t4 t5 t6 t7 t8 V V V V V V V V V V V 分别写出禁止表,冲突向量C;画出流水线状态转移图,求出最小平均延迟及流水线的最大吞吐率、调度方案。按此流水调度方案输入6个任务,求实际吞吐率。
65、向量处理机上用4条向量指令完成如下计算:E:=A*(B+C)+D LD V0,M(A);V0?存储器A向量 ADDV V3,V1,V2 ;V3?V1+V2 MULV V4,V0,V3 ;V4?V0*V3 ADDV V6,V4,V5 ;V6?V4+V5
假设V1、V2、V5向量寄存器已分别存放向量B、C、D,向量长度N=32,两个浮点功能部件执行时间为加法6拍,乘法7拍;存储器取数6拍;数据进入和流出功能部件(包括寄存器)为1拍。
(1)分析指令序列,如果能链接,画出向量链接图。 (2)计算指令组全部完成所需的时间。