中国海洋大学 考研 期末 系统结构2008期末(B卷) 下载本文

内容发布更新时间 : 2024/11/5 19:40:38星期一 下面是文章的全部内容请认真阅读。

优选专业年级 学号 姓名 授课教师 座号 中国海洋大学 2008-2009学年 第一学期 期末考试试卷

信 息 学院《C语言程序设计》课程试题(A卷) 共 3 页 第 1 页 考试说明:本课程为闭卷考试,可携带 钢笔、计算器等 文具,满分为:80 分。 题号 得分 一 二 三 四 五 六 七 八 总分 -------------------------------装装--------------------------------订订--------------------------------线线-------------------------------- -一 (10分)分别用计算机系统设计的定量原理分析以下两个问题。 (1)(5分)假定要将某一执行部件改进后速度提高10倍,改进后被改进部件执行时间占系统总运行时间的50%。求改进后,获得的加速比Sp是多少? (2)(5分)假定FP操作的比例为25%,FP操作的平均CPI为4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%,FPSQR的CPI为20,假设有两种方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试比较这两种设计方案哪一个更好? 二 (10分)某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为4位。如果要求双、单、零地址指令的比例大致为8:2:1。问:双地址、单地址和零地址指令应各有多少条?并为这3类指令分配操作码。 三 (10分)假设在一个采用组相联映象方式的Cache中,主存由B0~B7共8块组成。Cache有2组,每组2块.每块的大小为16个字节,采用LFU块替换算法。在一个程序执行过程中依次访问这个Cache的块地址流如下:B6,B2,B4,B1,B4,B6,B3,B0,B4,B5,B7,B3 (1)(2分)写出主存地址的格式、并标出各字段的长度; (2)(2分)写出Cache地址的格式,并标出各字段的长度; (3)(4分)如果Cache的各个块号为C0、C1、C2和C3,列出执行过程中Cache的块地址流情况; (4)(2分)采用LFU替换算法,计算Cache的块命中率。 四 (10分)在下列三种不同结构的处理机上运行8×8的矩阵乘法C=A×B,计算所需要的最短时间,只计算乘法指令和加法指令的执行时间,不计算取操作数、数据传送和程序控制等指令的执行时间。加法部件和乘法部件的延迟时间都是3个时钟周期,另外,加法指令和乘法指令还要经过一个“取指令”和“指令译码”时钟 号 学 业 姓 师 专 名教 姓 选级 号 授课 座号 名 X 学 优年年级 X X 授 课 座 号 师教 X XXX 优选专业 中国海洋大学 2008-2009学年 第一学期 期末考试试卷 信 息 学院《C语言程序设计》课程试题(A卷) 共 3 页 第 3 页 周期,每个时钟周期为20ns,C的初始值为“0”。各操作部件输出端有直接数据通路35八 (10分)分别在下面三种计算机系统上用最短的时间计算表达式S?(Ai? Bi)。连接到有关操作的输入端,在操作部件的输出端设置有足够多的缓冲寄存器。i?0(1)(3分)单流水线标量处理机,有一个两功能的静态流水线,流水线每个功能假设加法和乘法分别需要段的延迟时间均为一个时钟周期,加法操作和乘法操作各经过2个和4个单位时间,从存储器取指令、取数据、译码的时3个功能段; 间忽略不计,所有的指令和数据已装入有关的(2)(4分)超标量处理机,每个时钟周期同时发射一条乘法指令和加法指令,处PE。试确定下列每种情况的最小计算时间:理机内有两条独立的操作流水线,流水线每个功能段的延迟时间均为一个时钟周期; (1)(3)((23分)分)超流水线处理机,把一个时钟周期分成两个流水级,加法部件和乘法1台串行计算机,处理机中有一个加法器和乘法器,同一时刻只有其中部件的延迟时间都为1个可以使用。 6个流水级,每个时钟周期能够分时发射两条指令(“取指令”和“指令译码”的时间都缩短为一个流水级)(2)(3分)1台有8个PE的SIMD计算机,; 8个PE连成单向环结构。每个PE 用1个单位时间可把数据直接送给它的相邻PE。操作数Ai和Bi最初存放在PEi mod 8中,其中五 (10分)一条有i=0,1,?,35。4 个功能段的非线性流水线,每个功能段的延迟时间都为20ns,预约表如下:(3)(5分)分布存储器的 MIMD多处理机,8个CPU用立方体网络连接。在相邻CPU之间传送一个数据需要一个单位时间。Bi最初存放在PEi mod 8中, 1 2 3 操作数4 Ai和5 6 其中i=0,1,?,35。最终结果可以放在任意CPU。 S1 的寄存器中(通信与计算可以重叠) × × ?---------装装---------订订---------线线--------- --------------------------------装------------------------订------------------------线----------------------------装-订-线- -S2 S3 S4 × × × × × (1)(2分)画出调度该流水线的状态转换图; (2)(2分)求流水线的最小启动循环和最大吞吐率; (3)(4分)在流水线中只插入一个非计算延迟部件,确定流水线的最佳启动循环及最小平均启动距离; (4)(2分)画出插入一个非计算延迟部件后的流水线预约表。 六 (10分)CRAY l机上,按链接方式执行下述4条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传送需1拍,并且向量长度为64,需多少拍才能得到全部结果?若不采用链接方式,则需多少拍才能得到全部结果? V0←存储器 (存储器取数:7拍) V2←V0+V1 (向量加:3拍) V3←V2<A3 (按(A3)左移:4拍) V5←V3∧V4 (向量逻辑乘:2拍) 七 (10分)设32个处理器编号分别为0、1、?、31,使用单级互连网络,当互连函数分别为: (1)Cube1 ;(2)PM2+3 ;(3)PM2–2 ;(4)β;(5)Shuffle(Shuffle) 时,第28号处理器与哪一个处理器相连(要求写出互连函数表达式)