已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 計算機效能 計算機結構 第四章 第六 七週 計算機組織 2 謬論及陷阱 FallaciesandPitfalls 電腦的架構已無法再進步 創新機型不需預測未來可能的進步 事實上成本效能比才是真正硬體發展上的真正考量 計算機組織 3 第四章 計算機的效能 計算機的五大組成要件 計算機組織 4 本章重點 討論如何測量 描述及總結效能介紹會影響計算機效能的主要因子有哪些檢測硬體效能常常是決定一個具有軟硬體的系統效率 計算機組織 5 先定義甚麼是效能 Performance 當我們說有一台電腦的效能比另外一台電腦好 這意味著甚麼 下列哪一架飛機有最好的效能協和 concord 會比747快多少 747會比道格拉斯大多少 AirplanePassengersRange mi Speed mph p mphBoeing737 1003754630610228 750Boeing7474704150610286 700BAC SudConcorde13240001350178 200DouglasDC 8 50146872054479 424 計算機組織 6 電腦的執行效能 時間 時間 時間 回應時間 延遲 我的工作要等多少時間到開始執行 執行一個工作要花多久時間 我一定要等多久才能完成資料庫的查詢 總處理能力 Throughput 一次可以執行多少個工作 甚麼是平均執行速度 多少工作量將要完成 假使我們將電腦升級換了一個新CPU 那我們增加了甚麼 假如我們在實驗室內再採購了一台新的電腦 那我們增加了甚麼 計算機組織 7 經過時間 ElapsedTime 計算所有可能要花去的時間 磁碟與記憶體的處理及輸出入等 是有用的數據 但常常沒有被拿來做比較用花去在中央處理器的時間 CPUtime 沒有計算輸出入或花掉在其他程式的時間可以被切開成系統時間 SystemTime 及使用者時間 UserTime 重點是是使用者的CPUtime中央處理器消耗在執行我們這個程式的時間 執行時間 ExecutionTime 計算機組織 8 在機器X上執行某個程式的效能PerformanceX 1 ExecutiontimeX機器X比機器Y快n倍PerformanceX PerformanceY n問題 machineArunsaprogramin20secondsmachineBrunsthesameprogramin25secondsPerformanceA PerformanceB 1 ExecutiontimeA 1 ExecutiontimeB ExecutiontimeB ExecutiontimeA 25 20 1 25 書上有關效能的定義 計算機組織 9 中央處理器的ClockCycle 我們也常用時鐘週期來衡量效能時鐘的tick代表何時開始動作 抽象定義 cycletime timebetweenticks secondspercycleclockrate frequency cyclespersecond 1Hz 1cycle sec A200MHz clockhasacycletime 計算機組織 10 公式告訴我們所以要提昇效能 假設其他要考慮的因素都相同 可以考慮 一個程式所需的時鐘週期或者 theclockcycletime 再來換一種方式是 theclockrate 如何提昇效能 計算機組織 11 是否可以假設執行指令的個數與所要花去的clockcycles是一樣的 這個假設是錯的 在不同的機器上 不同的指令會花去不同的時間Why hint 請記住這些指令都是機器語言 並不是一行行的C程式 time 一個程式究竟需要多少時鐘週期 計算機組織 12 不同的指令需要不同的時鐘週期 乘法要比加法花的時間週期多浮點運算要比整數運算多耗時間週期記憶體的存取要比暫存器的存取多花時間週期重點是改變了週期時間常常改變不同指令所需的週期數 morelater time 計算機組織 13 一個常用的軟體在clockrate為400Mhz 的A電腦上執行花了10秒 我們正嘗試要幫助一個電腦設計師來建立一部可以6 Homework2 6改成3 秒鐘執行完畢剛才那個程式的新電腦B 設計師可以用新的也可能昂貴的技術來提昇clockrate 但也提醒我們這樣的提昇將會影響中央處理器設計的其它部份 使得在相同的程式下B機器要花相對於機器A1 2倍的時間來完成 若要完成前述的目標 那我們要告訴設計師新機器的clockrate該是多少別慌張 可以輕易地由前面所學的基本概念來解決 範例 計算機組織 14 範例及作業解答 課本範例解答CPU執行時間A CPUclockcyclesA clockrateA 10秒 CPUclockcyclesA 400 106 cycles second CPUclockcyclesA 10 seconds 400 106 cycles second 4000 106CPU執行時間B 1 2 CPUclockcyclesA ClockrateB 6seconds 1 2 4000 106cycles ClockrateB ClockrateB 1 2 4000 106cycles 6seconds 800MHzHomeworkClockrateB 1 2 4000 106cycles 3seconds 1600MHz 1 6GHz 計算機組織 15 一個待執行的程式將需要某個數目的指令 machineinstructions 某個數目的週期 clockcycles 某個數目的秒數 seconds 描述這些有關數量單位的辭典 週期時間cycletime secondspercycle 時鐘速率clockrate cyclespersecond CPI cyclesperinstruction 一個指令的平均週期數afloatingpointintensiveapplicationmighthaveahigherCPIMIPS millionsofinstructionspersecond 每秒百萬指令數thiswouldbehigherforaprogramusingsimpleinstructions 現在我們應瞭解了週期 計算機組織 16 效能 效能是由執行時間來決定有沒有其它變因是相等於效能 多少週期來執行程式 cycles 程式中有多少指令 instructions 一秒中有幾個週期 clockrate 一個指令平均週期數 cyclesperinstruction CPI 每秒平均指令數 普遍的陷阱 想想這些看起來很像是會影響效能的變因 實際上是不是 計算機組織 17 假設相同指令集架構 ISA 下的兩種機器設計對某一個程式的執行MachineAhasaclockcycletimeof10ns andaCPIof2 0MachineBhasaclockcycletimeof20ns andaCPIof1 2那一台機器比較快 而且快多少 假使有兩台機器有相同的ISA 下面的那個計算效能值不變 e g clockrate CPI executiontime ofinstructions MIPS millioninstructionspersecond CPI範例 計算機組織 18 效能比較 因為是同樣的程式在不同的機器上執行 所以執行的指令數相同 但執行時間不同假設這個程式有I個指令數CPUclockcyclesA I 2 0CPUclockcyclesB I 1 2CPUtime CPUclockscycles clockcycletimeCPUperformanceA CPUperformanceB ExecutionB ExecutionA 1 2 20 2 10 1 2 計算機組織 19 時間才是完整及可靠的效能測量 計算機組織 20 每個指令的CPI不盡相同一個撰寫編譯 Compiler 的設計師嘗試在某一台機器上寫兩套不同的指令執行順序 基於硬體的製作有三種類型的指令 ClassA ClassB andClassC 它們分別需要一個 兩個 及三個週期 第一個指令執行順序包含了5個指令 ClassA有2個 ClassB有1個而ClassC有2個 第二個指令執行順序包含了6個指令 ClassA有4個 ClassB有1個而ClassC有1個 那一個指令執行順序比較快 快多少 CPI各是多少 指令數的計算範例 計算機組織 21 範例計算過程 CPUclockcycles1 2 1 1 2 2 3 10CPUclockcycles2 4 1 1 2 1 3 9CPI CPUclockcycles Instructioncount CPI1 10 5 2CPI2 9 6 1 5只用instructioncount來判斷performance是很危險的即使clockrate相同 因為指令混用的關係造成CPI的變化 instructioncount與CPI同時都要比較 計算機組織 22 執行一個真正的程式是決定效能的最佳選擇使用可以能到達預期測試工作量的應用程式或者是特定類別的應用程式例如 編譯器 編輯器 科學計算應用程式 繪圖應用程式等小的測量程式對開發及設計新機器的人來說是好用的也比較容易標準化容易被濫用誤用 性能測量的程式 Benchmarks 計算機組織 23 SystemPerformanceEvaluationCooperative眾多公司已同意的一套真正的應用程式及相關的輸入還是會被濫用誤用 Intel s other bug 有價值的效能指標 也常被compilertechnology拿來做效能判斷 SPECBenchmark 計算機組織 24 SPEC 89Compiler enhancements andperformance 計算機組織 25 SPEC 95 計算機組織 26 SPEC 95 是不是讓clockrate加倍 效能就會跟著加倍呢 有沒有一台機器有較慢的clockrate確有較好的效能 計算機組織 27 ExecutionTimeAfterImprovement ExecutionTimeUnaffected ExecutionTimeAffected AmountofImprovement 範例 假使一個程式在一台機器上執行花了100秒 其中的80秒是消耗在乘法運算上 如果我們要這個程式比原來快四倍 我們必須在乘法運算上速度提升是多少 假如要提升五倍呢 原理 讓常用的運算加快 Amdahl sLaw 定律 計算機組織 28 效能對特定的程式的有特定意義的對總結效能來說 以總執行時間來做衡量標準是具有其一致性的對一個給好的機器架構來說 效能的增加是來自增加clockrate 沒有引起CPI反效果的條件下 處理內部組織的提升使得具有較低的CPI編譯器的效能提升使得CPI亦或是instructioncount也都降低 請記住 計算機組織 29 謬論 期待提升機器某一方面的效能就能提升機器全面的效能Youshouldnotalwaysbelieveeverythingyouread Readcarefully seenewspaperarticles e g Exercise2 37 請記住 計算機組織 30 有兩個不同的編譯器在一台100MHz的機器上正在進行測試 這台機器有三類指令 ClassA ClassB andClassC 分別需要1 2及3個週期來完成 這兩個編譯器同時要用來將一個大型軟體編譯產生組合指令 第一組編譯出來的指令有5百萬個ClassA的指令 1百萬個ClassB指令 and1百萬個ClassC指令 第二組編譯出來的指令有一千萬個ClassA的指令 1百萬個ClassB指令 and1百萬個ClassC指令以MIPS來做效能測量 哪一組compiler比較快 以時間來看 哪一組比較快 作業3 有關以MIPS測量效能 計算機組織 31 假設我們將一台機器的浮點運算的速度提升的五倍 如果再還沒有提升之前一個基準測量程式的執行時間是十秒鐘 那麼當這十秒中有一半的時間是消耗在執行浮點運算上 經由浮點運算速度提升後 真正的速度提升是多少倍 我們正在找一個基準測量程式來展現我們如上述新的浮點運算效能 而且測量結果是效能提升了3倍 某個測量程式在舊的浮點運算硬體上執行花了100秒 那麼浮點運算必須擔負的執行時間是多少 這樣才會達到效能的3倍提升 作業4 Amdahl sLaw 定律 計算機組織 Isa32 bitALUasfastasa1 bitALU Istheremorethanonewaytodoaddition twoextremes ripplecarryandsum of productsCanyouseetheripple Howcouldyougetridofit c1 b0c0 a0c0 a0b0c2 b1c1 a1c1 a1b1c2 c3 b2c2 a2c2 a2b2c3 c4 b3c3 a3c3 a3b3c4 Notfeasible Why Problem ripplecarryadderisslow 計算機組織 Anapproachin betweenourtwoextremesMotivation Ifwedidn tknowthevalueofcarry in whatcouldwedo Whenwouldwealwaysgenerateac
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年河北承德市工会系统招聘社会工作岗位人员17名考试模拟卷附答案解析
- 2023年市辖县直遴选考试真题汇编带答案解析
- 2023年揭阳市直属机关遴选公务员笔试真题汇编附答案解析(夺冠)
- 2025吉林长白朝鲜族自治县长发城市发展集团有限公司招聘9人考试历年真题汇编附答案解析(夺冠)
- 2023年潍坊市直遴选考试真题汇编附答案解析(夺冠)
- 2026山东青岛西海岸新区教育和体育系统招聘高层次紧缺急需人才120人笔试备考题库附答案解析
- 2024年文物保护工程从业资格真题及答案解析
- 2023年大庆市直遴选笔试真题汇编附答案解析
- 项目部年度工作总结报告
- 2025年循环经济示范园区项目可行性研究报告
- 组合房计算书
- 宋濂《送东阳马生序》同步测练
- SB/T 10016-2008冷冻饮品冰棍
- GB/T 36624-2018信息技术安全技术可鉴别的加密机制
- GB/T 34108-2017金属材料高应变速率室温压缩试验方法
- GB/T 20329-2006端键传动的铣刀和铣刀刀杆上刀座的互换尺寸
- GB/T 14459-2006贵金属饰品计数抽样检验规则
- 微生物的形态和结构
- 计算机专业英语试题及答案(A卷)
- 一分钟经理人打造高效团队情景领导模式XX0701课件
- 焊接机器人使用说明书
评论
0/150
提交评论