![cache和程序访问的局部性_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-5/19/ff37c129-3e08-494e-8de3-412ce07f3af3/ff37c129-3e08-494e-8de3-412ce07f3af31.gif)
![cache和程序访问的局部性_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-5/19/ff37c129-3e08-494e-8de3-412ce07f3af3/ff37c129-3e08-494e-8de3-412ce07f3af32.gif)
![cache和程序访问的局部性_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-5/19/ff37c129-3e08-494e-8de3-412ce07f3af3/ff37c129-3e08-494e-8de3-412ce07f3af33.gif)
![cache和程序访问的局部性_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-5/19/ff37c129-3e08-494e-8de3-412ce07f3af3/ff37c129-3e08-494e-8de3-412ce07f3af34.gif)
![cache和程序访问的局部性_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-5/19/ff37c129-3e08-494e-8de3-412ce07f3af3/ff37c129-3e08-494e-8de3-412ce07f3af35.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选文档实验项目六: cache 和程序访问的局部性一、实验目的:1.通过实际程序的执行结果,了解程序访问的局部性对带有cache 的计算机系统性能的影响。二、实验要求:1. 在以下程序中,修改或添加必要的语句(如添加计时函数等),以计算和打印主体程序段(即 for 循环段)的执行时间。分别以 m=10 、 n=100000 ; m=1000 、 n=1000 ; m=100000 、n=10 ;执行程序a和程序b,以比较两种for循环段执行 时间的长短。下列程序中给出的数组a 是局部临时变量,分配在栈中,也可改用静态全局变量,或在堆中动态申请空间。程序段 aassign-array-rows
2、()int i,j;short amn;for(i=0;im;i+)for(j=0;jn;j+)aij=0;程序段 bassign-array-cols()int i,j;short amn;for(j=0;in;j+)for(i=0;im;i+)aij=0;三、实验报告:1. ( 1)给出源程序(文本文件)和执行结果。#include#include#include#define m 1000#define n 1000void rows()int i,j;short amn;for(i=0;im;i+)for(j=0;jn;j+) aij=0;void cols()int i,j;shor
3、t amn;for(j=0;jm;j+)for(i=0;in;i+)aij=0;/*void main()time_t start_rows,stop_rows,start_cols,stop_cols;start_rows=time(null); /time() 会保存之前的时间, time(null) 清空之前 的时间,并保存当前时间rows();stop_rows=time(null);printf( 程序段 a 的使用时间: %ld,(stop_rows-start_rows);start_cols=time(null);cols();stop_cols=time(null);prin
4、tf( 程序段 b 的使用时间: %ld,(stop_cols-start_cols);精度不够高,导致显示结果均为 0*/ void main()large_integer t1,t2,tc,t3,t4,tc2;获取计算机时钟频率queryperformancefrequency(&tc);/queryperformancecounter(&t1);/获取运行程序前高精度计时器的值rows();queryperformancecounter(&t2);/获取运行程序后高精度计时器的值printf( 程序段 a use time:%fn,(t2.quadpart -t1.quadpart)*1
5、.0/tc.quadpart);queryperformancefrequency(&tc2);queryperformancecounter(&t3);cols();queryperformancecounter(&t4);printf( 程序段 b use time:%fn,(t4.quadpart - t3.quadpart)*1.0/tc2.quadpart);可编辑m=10 , n=100000odai memoers rnam1st ”: dieba杆i. exc*|程序用r u射门怔二11五加3牛1 程序ere use tine = 0,012 783 pt*ess any ke
6、y to contrnuiem=1000 , n=1000m=10000 , n=10m=10000 , n=10000(2)对实验结果进行分析,说明局部数据块大小、数组访问顺序等和执行时间之间的 关系。程序运行时间程序a(先行后列)程序b (先列后行)m=10 , n=100000.000618m=1000 , n=10000.0063440,012783m=10000 , n=100.0088130.007630局部数据块 主存块大可以充分利用程序访问的空间局部性特点,使得一个比较大的局部空间被一起调到 cache中,因而可以增加命中机会。但主存块不能太大,主 要原因有两个:a.块大使得缺失损失更大,因而需花费更多的时间从主存块读一个较大的块; b. 块大则 cache 行数变小,因而替换的可能性增加,导致命中的可能性变 小。数组访问顺序:因为数组在存储器中是按行存储,所以数组的访问顺序对程序执行效率有影响,且总体上先行后列能提高程序运行效率,因为由程序的局部性原理能提高 cache 命中率,减少访存时间。( 3 )分析说明数组 a 分配在静态存储区、堆栈和栈区,对 for 循环段的执行效率有没 有影响。有影响。由上述分析可知,在先行后列访问情况下, m,n 三种取值中程序运行时间都是当
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智慧养老综合服务协议
- 商法顾问服务合同
- 借款合同协议书
- 建筑行业兼职合作协议书
- 企业绿化苗木种植合同范本
- 餐饮服务人员工伤赔偿协议
- 星级酒店预订合同范本
- 培训师劳动合同书样本
- 光学行业务工合同范本
- 个性化内衣定制协议
- 2023年山东济南市初中学业水平考试生物试卷真题(答案详解)
- 汉白玉雕塑台施工方案
- 离线手写签名识别技术研究
- 54设计和开发验证记录表
- 运动人体科学概论考核试题题库及答案
- 锡惠公园七字对联大全集
- 《探究与发现-牛顿法-用导数方法求方程的近似解》课件(浙江省县级优课)
- PDCA提高卧床患者踝泵运动锻炼的正确率
- 五年级下册道德与法治素材-第三单元《百年追梦复兴中华》单元梳理部编版
- 健康促进机关专题会议记录(6月)
- 2023年人教PEP版小学英语六年级(下)期末考试综合测试卷及答案(共5套)
评论
0/150
提交评论