版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、存储技术概论Cache性能评估评价cache性能公式:平均存储访问时间 = 命中时间 + 缺失率缺失代价命中时间:缓冲命中需要的时间。举个例子:如果缓存的命中时间为2个cycle,缺失率为0.05,缺失代价为20个cycle,那么平均存储访问时间是多少?Cache性能评估公式的应用我们需要在下面的两种cache设计中,进行选择:方案1:分立cache设计,指令和数据cache独立,分别为16KB;方案2:指令和数据cache合并,总共为32KB;这里的load和store操作命中时额外地需要一个时钟周期,因为只有一个cache端口满足请求。假定cache命中需要1个周期,缺失代价为100个周期
2、;并且假设36%的存储器访问为数据访问。其中下图显示每一千条指令发生的缺失次数:每一千条指令的缺失率容量 指令cache数据cache一体cache16KB3.8240.951.032KB1.3638.443.3首先计算缺失率缺失率的定义:每条指令的缺失次数/每条指令的内存访问此处;或1000条指令的缺失次数/1000条指令的内存访问次数;16KB指令cache,其缺失率可以表示为:163.82/10000.0041000/1000KBcache指令缺失率缺失率的计算16KB数据cache,其缺失率表示为:一体32KB cache的缺失率可以表示为:1640.9/10000.1140.36KB
3、cache数据缺失率3243.3/10000.03181.0+0.36KBcache一体缺失率分立cache总的缺失率分立cache的缺失率由指令和数据两部分构成:一体cache的缺失率:74% 0.004 +26% 0.114 =()()0.03243243.3/10000.03181.0+0.36KBcache一体缺失率平均存储器访存时间那么对于分立cache:那么对于一体cache:=+平均存储器访问时间 指令占比 (命中时间 指令缺失率 缺失代价)数据占比 (命中时间 数据缺失率 缺失代价)=74%+26%=4.24cache分立平均存储器访问时间(1+0.004 100)(1+0.1
4、14 100)=+26%4.44cache一体平均存储器访问时间74% (1+0.0318 100)(1+1+0.0318 100)存储器访问时间和处理器性能能够用cache缺失引起的平均存储器访问时间来预测处理器性能呢?1. 其他原因也可引起停顿;2. 取决于cpu的类型,如果是乱序就不行了;为了预测,我们作两个假设:1. 忽略其他引起停顿的原因;2. 假设cpu是顺序运行的;CPU时间的定义那么cpu时间的公式:=+CPU时间 (CPU执行时间时钟周期数 存储器停顿时周期数)时钟周期数案例假设某顺序执行的处理器,其平均缺失率为2%,平均每条指令要访问存储器1.5次,cache缺失代价为10
5、0个周期;此处将cache命中时间包含在cpu执行时间内,cpu理想的cpi为1.0。比较cache的存在与否,对于性能的影响。我们首先对原来的cpu时间进行简单的变换:将题目中的参数依次代入,得到:=+CPU存储器停顿时钟周期时间 指令数 (指令执行时钟周期数)时钟周期时间指令数=+1000cacheCPU30 100时间指令数 (1.0)时钟周期时间=指令数 4.00 时钟周期时间从上述的结果可见,在cache的情况下,cpi为4.0;如果没有cache,又考虑存储访问时间的话:cpi增加到1.0+100*1.5即为151,即为带有cache系统的40倍。结论:cache对于低cpi和高时
6、钟频率的cpu的性能影响尤其重要;最小平均访问时间=性能最好?我们在设计系统时,是不是该以最小化平均存储器访问时间为目的呢?很有道理,但是也有例外。比如下面的例子:假定cache为理想状态,cpi为2.0,时钟周期时间为1.0ns,平均每条指令访问存储器1.5次;另外由于增加组相联后,增加cache访问的复杂性,因此2路组相联的命中时间扩展为原来的1.25倍;两个cache的容量都是64KB,块容量为64字节,一个cache采用直接映射,另一个cache采用2路组相联映射;命中时间均为1个时钟周期,并且假定直接映射和2路组相联的cache缺失率分别为1.4%和1.0%;两者的缺失代价都为75n
7、s;根据平均存访问时间:平均存储访问时间 = 命中时间 + 缺失率缺失代价可以得到直接映射和2路组相联的平均存储访问时间:可见2路组相联的内存访问性能更好。那内存访问性能好,是否意味着cpu的性能好呢?=1.0+=1.0 1.25+=1路2路平均存储器访问时间(0.014 75)2.05ns平均存储器访问时间(0.010 75)2.00ns回到之前的cpu性能公式:适应本题给出的参数,需要对上述表达式作必要的变换:=+CPU缺失次数 缺失代价时间 执行指令数 (指令执行周期数)时钟周期时间指令数=+CPU时间 执行指令数 (指令执行周期数 时钟周期时间)存储器访问次数(缺失率缺失代价 时钟周期
8、时间)指令数用75ns代替上述公式中的(缺失代价时钟周期数),则采用不同的cache组织路数:从上面的数据,我们可以得到2路组相联的处理器性能反而不如直接映射。结论:性能的考察最终还是得从cpu时间入手。1=IC (2 1.0+(1.5 0.014 75)=3.58=IC (2 1.0 1.25+(1.5 0.010 75)=3.63路2路CPU时间指令数CPU时间指令数考虑乱序的情况之前考虑的处理器都是顺序执行的,这里我们考虑乱序执行的情况。乱序执行的特点:即使当前的指令因存储延迟而停顿,后面的指令还是能够继续执行。此处,我们就需要对之前的公式进行修正:=-存储器停顿周期数缺失次数全部缺失延迟 重叠缺失延迟缺失次数指令数重复之前的例子,假设现在的缺失代价为75ns,并且其中30%是重叠的,也就是说平均CPU存储器停顿时间现在为52.5ns。乱序处理器(OOO)的处理器的平均存储访问时间是:OOO处理器的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 健康生活讲座发言材料
- 公务员面试美篇标题面试题及答案
- 海南航空秋招面试题及答案
- 管家服务招聘题目及答案
- 公务员考试试卷题目类型试题及答案
- 中医院感考试题库及答案
- 2025年辽宁省事业单位联考真题试卷 公共基础知识及答案详解(基础+提升)
- 中医院招聘题库及答案
- 2026年福建省三明市单招职业倾向性测试题库含答案
- 2026年襄阳科技职业学院单招职业倾向性考试必刷测试卷新版
- 2025年度安全生产工作述职报告范文
- 2025贵州茅台和义兴酒业分公司招聘笔试历年典型考点题库附带答案详解试卷2套
- 油菜飞播作业合同2025年合同履行进度跟踪
- 宁夏煤业面试题及答案
- 新课标2025版物理培训
- 溃疡性角膜炎症状解读及护理指导培训
- 2025年北京市高职单独招生文化课统一考试(英语)
- 2025首都航空招飞面试题及答案
- 危险辨识、风险评价、风险分级控制制度LC法
- 药师经(横排繁体注音)
- GB/T 30823-2014测定工业淬火油冷却性能的镍合金探头试验方法
评论
0/150
提交评论