




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
在竞赛中,遇到大数据时,往往读文件成了程序运行速度的瓶颈,需要更快的读取方式。相信几乎所有的C+学习者都在cin机器缓慢的速度上栽过跟头,于是从此以后发誓不用cin读数据。还有人说Pascal的read语句的速度是C/C+中scanf比不上的,C+选手只能干着急。难道C+真的低Pascal一等吗?答案是不言而喻的。一个进阶的方法是把数据一下子读进来,然后再转化字符串,这种方法传说中很不错,但具体如何从没试过,因此今天就索性把能想到的所有的读数据的方式都测试了一边,结果是惊人的。竞赛中读数据的情况最多的莫过于读一大堆整数了,于是我写了一个程序,生成一千万个随机数到data.txt中,一共55MB。然后我写了个程序主干计算运行时间,代码如下:?Copy to clipboardView Code CPP1234567#include int main()int start = clock();/DO SOMETHINGprintf(%.3lfn,double(clock()-start)/CLOCKS_PER_SEC);最简单的方法就算写一个循环scanf了,代码如下:?Copy to clipboardView Code CPP12345678910const int MAXN = 10000000; int numbersMAXN; void scanf_read()freopen(data.txt,r,stdin);for (int i=0;iMAXN;i+)scanf(%d,&numbersi);可是效率如何呢?在我的电脑Linux平台上测试结果为2.01秒。接下来是cin,代码如下?Copy to clipboardView Code CPP12345678910const int MAXN = 10000000; int numbersMAXN; void cin_read()freopen(data.txt,r,stdin);for (int i=0;i numbersi;出乎我的意料,cin仅仅用了6.38秒,比我想象的要快。cin慢是有原因的,其实默认的时候,cin与stdin总是保持同步的,也就是说这两种方法可以混用,而不必担心文件指针混乱,同时cout和stdout也一样,两者混用不会输出顺序错乱。正因为这个兼容性的特性,导致cin有许多额外的开销,如何禁用这个特性呢?只需一个语句std:ios:sync_with_stdio(false);,这样就可以取消cin于stdin的同步了。程序如下:?Copy to clipboardView Code CPP1234567891011const int MAXN = 10000000; int numbersMAXN; void cin_read_nosync()freopen(data.txt,r,stdin);std:ios:sync_with_stdio(false);for (int i=0;i numbersi;取消同步后效率究竟如何?经测试运行时间锐减到了2.05秒,与scanf效率相差无几了!有了这个以后可以放心使用cin和cout了。接下来让我们测试一下读入整个文件再处理的方法,首先要写一个字符串转化为数组的函数,代码如下?Copy to clipboardView Code CPP12345678910111213const int MAXS = 60*1024*1024;char bufMAXS; void analyse(char *buf,int len = MAXS)int i;numbersi=0=0;for (char *p=buf;*p & p-buflen;p+)if (*p = )numbers+i=0;elsenumbersi = numbersi * 10 + *p - 0;把整个文件读入一个字符串最常用的方法是用fread,代码如下:?Copy to clipboardView Code CPP12345678910111213const int MAXN = 10000000;const int MAXS = 60*1024*1024; int numbersMAXN;char bufMAXS; void fread_analyse()freopen(data.txt,rb,stdin);int len = fread(buf,1,MAXS,stdin);buflen = 0;analyse(buf,len);上述代码有着惊人的效率,经测试读取这10000000个数只用了0.29秒,效率提高了几乎10倍!掌握着种方法简直无敌了,不过,我记得fread是封装过的read,如果直接使用read,是不是更快呢?代码如下:?Copy to clipboardView Code CPP12345678910111213const int MAXN = 10000000;const int MAXS = 60*1024*1024; int numbersMAXN;char bufMAXS; void read_analyse()int fd = open(data.txt,O_RDONLY);int len = read(fd,buf,MAXS);buflen = 0;analyse(buf,len);测试发现运行时间仍然是0.29秒,可见read不具备特殊的优势。到此已经结束了吗?不,我可以调用Linux的底层函数mmap,这个函数的功能是将文件映射到内存,是所有读文件方法都要封装的基础方法,直接使用mmap会怎样呢?代码如下:?Copy to clipboardView Code CPP123456789101112const int MAXN = 10000000;const int MAXS = 60*1024*1024; int numbersMAXN;char bufMAXS;void mmap_analyse()int fd = open(data.txt,O_RDONLY);int len = lseek(fd,0,SEEK_END);char *mbuf = (char *) mmap(NULL,len,PROT_READ,MAP_PRIVATE,fd,0);analyse(mbuf,len);经测试,运行时间缩短到了0.25秒,效率继续提高了14%。到此为止我已经没有更好的方法继续提高读文件的速度了。回头测一下Pascal的速度如何?结果令人大跌眼镜,居然运行了2.16秒之多。程序如下:?Copy to clipboardView Code PASCAL1234567891011constMAXN = 10000000;varnumbers :array0.MAXN of longint;i :longint;beginassign(input,data.txt);reset(input);for i:=0 to MAXN doread(numbersi);end.为确保准确性,我又换到Windows平台上测试了一下。结果如下表:方法/平台/时间(秒)Linux gccWindows mingwWindows VC2008scanf2.0103.7043.425cin6.38064.00319.208cin取消同步2.0506.00419.616fread0.2900.2410.304read0.2900.398不支持mmap0.250不支持不支持Pascal read2.1604.668从上面可以看出几个问题1. Linux平台上运行程序普遍比Windows上快。2. Window
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 假期归来活动方案
- 假期走访活动方案
- 假期游戏公司活动方案
- 做母婴妈妈班活动方案
- 停止集会活动方案
- 健康公益扶贫活动方案
- 健康地摊活动方案
- 健康徙步活动方案
- 健康步道活动方案
- 健康班组活动方案
- 家具厂客户投诉处理手册
- 2024年化学水处理工(技师)技能鉴定理论考试题库(含答案)
- 贵州省贵阳市2024年小升初语文模拟考试试卷(含答案)
- 2024高速养护工区标准化建设指南
- 湖北省随州市随县2023-2024学年七年级下学期语文期末考试卷
- 2024年中国城建围挡板市场调查研究报告
- 北京市海淀区101中学2025届数学八年级第一学期期末统考试题含解析
- 重庆市渝中区巴蜀小学校2023-2024学年六年级下学期期末小升初数学试卷
- 专科医院医院财务预算管理知识考核试卷
- 2022-2023学年北京市西城区三帆中学七年级(上)期中数学试卷【含解析】
- 2024年中考语文真题分类汇编标点符号
评论
0/150
提交评论