系统结构第5章.ppt

上传人：s*** IP属地：河南上传时间：2020-02-19 格式：PPT 页数：25 大小：220KB 积分：20 举报 版权申诉

已阅读5页，还剩20页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第五章向量流水处理 2 第一节向量流水处理提高标量流水线性能方法增加流水线段数以减少 t 每个时钟同时启动多条指令减少相关减少功能变换次数增加处理指令条数向量操作特点向量元素间操作相互独立无数据相关向量元素间操作相同无功能变换相当于标量循环对指令访问带宽的要求不高向量操作很适合于流水处理或并行处理 3 一向量处理方式以向量操作D A B C 为例 1 横向处理方式循环处理di ai bi ci 特点产生N次相关 2N次功能变换不宜用于向量处理 2 纵向处理方式循环处理ei bi ci 再循环处理di ai ei 特点产生1次相关 1次功能变换适合用于向量处理思考针对不同的N 硬件可采用哪些结构实现纵向处理方式只适合于MEM MEM型结构的处理方式 4 3 纵横处理方式对向量分组 n个元素组内纵向处理组间横向处理特点产生N n次相关 N n次功能变换很适合于REG REG型结构的处理方式思考如何确定向量寄存器中元素个数n 5 二向量指令 1 R R型的向量指令类型向量向量类 Vi Vj Vk或 Vj Vk 向量标量类 Si Vj VkVi Vj Sk或 Vj Sk 向量规约向量 MEM类 M Vk或Vi M M Vl VA或Vl VA M 压缩与还原回下页 6 2 M M型的向量指令类型向量向量类 M1 1 n M2 1 n M 1 n 或 M1 1 n M 1 n 向量标量类 Si M1 1 n M 1 n M1 1 n M2 1 n Sk 3 向量指令操作特点向量指令是各分量之间的流水操作标量指令是各指令之间的流水操作 SIMD指令是各指令内部的操作并行转上页 7 三向量访问模式与处理带宽问题 1 向量访问模式向量一般按行或按列存储向量访问各分量时步长可变一般有按行按列或按对角线等方式访问 2 向量存取指令与处理带宽向量存取指令按访问模式存取相关分量从到向量寄存器或向量缓冲器的相邻分量中要求存储器带宽较大必须解决多个分量流水访问的冲突问题如多个相邻分量在同一存储体内 8 第二节向量处理机结构一 M M向量处理机结构 1 向量处理机结构 M M结构对存储系统带宽要求较高若向量处理部件流水间隔为 t 存储系统带宽应达到3 t 若读写操作为2 t 则存储系统带宽应达到6 t 9 2 存储系统设计 1 提高存储系统带宽存储器与三条总线连接同时只能被一条总线访问 2 提高向量存取性能向量存取采用流水方式左图不同向量并行存取右图回下页 10 3 解决向量访问冲突向量采用错位方式存储解决按行列对角线访问时流水操作的存储体冲突增加可变延迟器可解决访问的操作冲突转上页 11 二 R R向量处理机结构 1 向量处理机结构指令处理部件标量指令直接控制向量指令传递控制向量寄存器 V 向量存取部件设置多级缓冲器缓冲主存与向量寄存器速度差 M M型向量处理机简单得多只需缓冲几个分量 12 2 存储系统设计 1 提高存储系统带宽对MEM的带宽需求相对M M型向量处理机要低得多一般采用单总线即可 2 提高向量存取性能向量存储从无序到错位存储提高向量存取性能设置指令数据缓冲器减少存取频率见下页图设置地址缓冲器实现成组交换提高存取性能 3 解决向量访问冲突向量采用错位存储从空间上解决访问的存储体冲突增加可变延迟器从时间上解决访问的存储体冲突设置向量存取指令指令串行执行可解决访问的操作冲突转下页转下二页 13 中间缓冲器地址寄存器A 8 24bit 中间寄存器B 64 24bit 中间寄存器T 64个64bit 回上页 14 第三节增强向量处理性能方法一多功能部件并行操作使向量机中多个功能部件能并行操作提高向量处理性能并行操作条件 1 不存在向量寄存器使用冲突不允许出现RAW WAR WAW RAR相关例如 V4 V1 V2V5 V2 V3 2 不存在功能部件使用冲突每种功能部件一般只设置一个例如 V3 V1 V2V6 V4 V5 15 二链接技术采用相关专用通路思想解决向量寄存器的RAW相关例执行指令 V3 A V2 V0 V1 V4 V2 V3 访存与浮点加可并行操作访存和浮点加与浮点乘有RAW相关性链接技术可解决RAW相关进行流水操作以减少执行时间因同步要求数据进入流出功能部件需1拍时间回下页 16 链接条件 1 不存在功能部件使用冲突 2 共用向量寄存器的向量长度起始地址偏移量步长均相等 3 参与链接的先行指令产生结果周期相同链接指令为多操作数时若某操作数为Vi时可认为周期相同 4 只有在先行指令产生第一结果分量的那个时钟方可链接否则不行上例时间分析全串行 2 1 6 1 N 1 1 7 1 N 1 3N 22 并行加串行 1 6 1 N 1 1 7 1 N 1 2N 15 并行加链接 1 6 1 1 7 1 N 1 N 16 注意不同向量机对向量指令的链接要求有所不同转上页 17 三条件语句和稀疏向量的加速处理 1 加速条件语句标量循环语句向量化可提高流水线效率条件语句循环向量化方法利用向量屏蔽控制技术实现即用条件语句循环生成VM 用带VM向量指令实现向量屏蔽控制技术的系统支持增加VM置位和复位指令增加带VM运算命令 2 加速稀疏矩阵处理存储压缩向量和位向量操作带VM运算指令系统支持带VM的存取指令运算指令 18 四加速向量归约操作应用需求常规方法 C A B 向量流水操作对C进行递归折叠求和标量循环 n次操作加速方法 C A B 向量流水操作 s C 向量归约操作向量归约操作的实现方法向量归约部件和向量归约指令可归约的向量加法部件对部分分量折叠求和回下页 19 可归约的向量加法部件的实现方法常规向量加法 V0 V1 V2 源和目标向量各不相同带归约向量加法 V0 V0 V1 源和目标向量相同实现见下页图设加法部件需8个时钟周期置V0各分量为0 乘法为1 V0和V1计数器均为0 V0计数器为0 V1计数器每时钟加1 直到第一个结果分量出来 V0和V1计数器每时钟加1 直到V1计数器等于向量计算长度为止 V0的最后8个分量为V10至V163之和转上页回下页 20 常规方法与加速方法性能比较常规方法 T p n 2 1 上例T 8 63 加速方法 T p n p n 2p 1 上例T 8 64 8 7 转上页 21 五向量化编译技术 1 通用优化方法公共子表达式消除常数调入复制语句传递等 2 循环体优化固定表达式移出归约变量消除向量指令表示等 3 向量寄存器优化分配重新分配向量寄存器减少向量寄存器使用冲突 4 向量指令并行化重新排序向量指令减少流水功能转换频率争取功能部件操作并行向量指令链接 22 六向量指令性能分析 1 向量执行时间Tvp Tst n IrTst 启动时间 Ir 启动率 n 向量长度对M M型结构 Tst为取数等待及流水线深度时间对R R型结构 Tst仅为流水线深度时间影响因素向量长度向量指令间功能和数据相关性向量流水线深度对Tvp的影响较小提高性能方法增加n 可提高流水效率减小Tst对Tvp影响尽量减小Tst 提高短向量的处理性能 23 2 最大性能R 用于衡量向量流水线的峰值性能例机器时钟频率200MHz 存取加乘指令分别需12 6 7个时钟周期计算Y a X Y需指令 Mx V0 F0 V0 V1 My V2 V1 V2 V3 V3 My 指令可编成和和共3队各队串行执行向量启动开销 12 7 12 6 12 49Tc 执行标量代码开销归入向量启动开销设为15Tc 回下页 24 3

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

系统结构第5章.ppt

文档简介

温馨提示

最新文档

评论

系统结构第5章.ppt

文档简介

温馨提示

最新文档

评论

相关文档