C++代码优化的27个建议_第1页
C++代码优化的27个建议_第2页
C++代码优化的27个建议_第3页
C++代码优化的27个建议_第4页
C++代码优化的27个建议_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 记住阿姆达尔定律: funccost是函数func运行时间百分比,funcspeedup是你优化函数的运行的系数。 所以,如果你优化了函数TriangleIntersect执行40%的运行时间,使它运行快了近两倍,而你的程序会运行快25%。 这意味着不经常使用的代码不需要做较多优化考虑(或者完全不优化)。 这里有句俗语:让经常执行的路径运行更加高效,而运行稀少的路径正确运行。2. 代码先保证正确,然后再考虑优化 这并不意味着用8周时间写一个全功能的射线追踪算法,然后用8周时间去优化它。 分多步来做性能优化。 先写正确的代码,当你意识到这个函数可能会被经常调用,进行明显的优化。 然后再寻找

2、算法的瓶颈,并解决(通过优化或者改进算法)。通常,改进算法能显著地改进瓶颈也许是采用一个你还没有预想到的方法。所有频繁调用的函数,都需要优化。3. 我所了解的那些写出非常高效代码的人说,他们优化代码的时间,是写代码时间的两倍。4.跳转和分支执行代价高,如果可能,尽量少用。 函数调用需要两次跳转,外加栈内存操作。 优先使用迭代而不是递归。 使用内联函数处理短小的函数来消除函数调用开销。 将循环内的函数调用移动到循环外(例如,将for(i=0;i100;i+) DoSomething();改为DoSomething()for(i=0;i和来代替整数乘除法15. 小心使用表查找函数 许多人都鼓励将复

3、杂的函数(比如:三角函数)转化为使用预编译的查找表。对于射线追踪功能来说,这通常导致了不必要的内存查找,这很昂贵(并不断增长),并且这和计算一个三角函数并从内存中获取值一样快(尤其你考虑到三角查找打乱了cpu的cache存取)。 在其他情况下,查找表会很有用。对于GPU编程通常优先使用表查找而不是复杂函数。16.对大多数类,优先使用+=、-=、*= 和 /=,而不是使用+、-、*、和?/ 这些简单操作需要创建一个匿名临时中间变量。 例如:Vector v = Vector(1,0,0) + Vector(0,1,0) + Vector(0,0,1);?创建了五个匿名临时Vector: Vect

4、or(1,0,0), Vector(0,1,0), Vector(0,0,1), Vector(1,0,0) + Vector(0,1,0), 和 Vector(1,0,0) + Vector(0,1,0) + Vector(0,0,1). 对上述代码进行简单转换:Vector v(1,0,0); v+= Vector(0,1,0); v+= Vector(0,0,1);仅仅创建了两个临时Vector: Vector(0,1,0) 和 Vector(0,0,1)。这节约了6次函数调用(3次构造函数和3次析构函数)。17. 对于基本数据类型,优先使用+?、?-?、?*?、?和?/,而不是+=?、

5、?-=?、?*= 和 /=18. 推迟定义本地变量 定义一个对象变量通常需要调用一次函数(构造函数)。 如果一个变量只在某些情况下需要(例如在一个if声明语句内),仅在其需要的时候定义,这样,构造函数仅在其被使用的时候调用。19. 对于对象,使用前缀操作符(+obj),而不是后缀操作符(obj+) 这在你的射线追踪算法中可能不是一个问题 使用后缀操作符需要执行一次对象拷贝(这也导致了额外的构造和析构函数调用),而前缀的构造函数不需要一个临时的拷贝。20. 小心使用模板 对不同的是实例实现进行不同的优化。 标准模板库已经经过良好的优化,不过我建议你在实现一个交互式射线追踪算法时避免使用它。 使用

6、自己的实现,你知道它如何使用算法,所以你知道如何最有效的实现它。 最重要的是,我的经历告诉我:调试STL库非常低效。通常这也不是一个问题,除非你使用debug版本做性能分析。你会发现STL的构造函数,迭代器和其他一些操作,占用了你15%的运行时间,这会导致你分析性能输出更加费劲。21. 避免在计算时进行动态内存分配 动态内存对于存储场景和运行期间其他数据都很有用。 但是,在许多(大多数)的系统动态内存分配需要获取控制访问分配器的锁。对于多线程应用程序,现实中使用动态内存由于额外的处理器导致了性能下降,因为需要等待分配器锁和释放内存。 即便对于单线程应用,在堆上分配内存也比在栈上分配内存开销大得

7、多。操作系统还需要执行一些操作来计算并找到适合尺寸的内存块。22. 找到你系统内存cache的信息并利用它们 如果一个是数据结构正好适合一个cache行,处理整个类从内存中只需要做一次获取操作。 确保所有的数据结构都是cache行大小对齐(如果你的数据结构和一个cache行大小都是128字节,仍有可能因为你的结构体中的一个字节在一个cache行中,而其他127字节在另外一个cahce行中)。23. 避免不需要的数据初始化 如果你需要初始化一大段的内存,考虑使用memset。24. 尽早结束循环和尽早返回函数调用 考虑一个射线和三角形交叉,通常的情况是射线会越过三角,所以这里可以优化。 如果你决

8、定将射线和三角面板交叉。如果射线和面板交叉t值是负数,你可以立即返回。这允许你跳过射线三角交叉一大半的质心坐标计算。这是一个大的节约,一旦你知道这个交叉不存在,你就应该立即返回交叉计算函数。 同样的,一些循环也应该尽早结束。例如,当设置阴影射线,对于近处的交叉通常都是不必须的,一旦有类似的的交叉,交叉计算就应该尽早返回。(这里的交叉含义不太明白,可能是专业词汇,译者注)25. 在稿纸上简化你的方程式 许多方程式中,通常都可以或者在某些条件中取消计算。 编译器不能发现这些简化,但是你可以。取消一个内部循环的一些昂贵操作可以抵消你在其他地方的好几天的优化工作。26. 整数、定点数、32位浮点数和6

9、4位双精度数字的数学运算差异,没有你想象的那么大 在现代CPU,浮点数运算和整数运算差不多拥有同样的效率。在计算密集型应用(比如射线追踪),这意味这可以忽略整数和浮点数计算的开销差异。这也就是说,你不必要对算数进行整数处理优化。 双精度浮点数运算也不比单精度浮点数运算更慢,尤其是在64位机器上。我在同一台机器测试射线追踪算法全部使用double比全部使用floats运行有时候更快,反过来测试也看到了一样的现象(这里的原文是:I have seen ray tracers run faster using all doubles than all floats on the same machine. Ihave also seen the reverse)。27. 不断改进你的数学计算,以消除昂贵的操作 sqrt()经常可以被优化掉,尤其是在比较两个值的平方根是否一致时。 如果你重复地需要处理 除x 操作,考虑计算1/x的值,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论