计算机组成原理_第1页
计算机组成原理_第2页
计算机组成原理_第3页
计算机组成原理_第4页
计算机组成原理_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机组成原理

第一章概论

李曦本课程的作用数据结构算法设计组成原理操作系统编译原理体系结构。。。。。。“计算机系统〞涉及的问题计算机科学永恒的问题:如何设计出更好的计算机,如何利用好现有的计算机教学目的课程内容外围部件结构系统总线〔总线性能、总线结构、总线控制〕存储器〔主存储器、高速缓存、辅助存储器〕输入输出系统〔外设、I/O接口、I/O控制方式〕中央处理器〔CPU〕计算机的运算方法指令系统CPU的结构控制单元设计主存ALU控制单元外设主机CPU教材Textbook:唐朔飞,?计算机组成原理?高等教育出版社,2000Reference:PattersonandHennessy,“ComputerOrganizationandDesign:TheHardware/SoftwareInterface〞,2ndEdition,1998王爱英,?计算机组成与结构?,清华大学出版社,1995:///~cs152成绩考核期末考试:55%〔闭卷〕作业:30%,不能抄袭不能补交!课堂练习:5%课外实践:10%编程实践:仿真调查报告:〔2~3篇〕理解与综合能力,不能抄袭,要有参考文献资料来源:教材、参考书、Internet教师主讲:李曦〔〕助教:赵振刚〔〕本章教学内容计算机系统概述计算机软硬件计算机系统的层次结构计算机组成VS.计算机体系结构计算机的根本组成VonNeumann机的特征计算机的硬件构成计算机的工作过程计算机硬件的性能指标能行计算理论可计算性:判断一类数学问题是否机械可解问题的可计算性计算:是一种过程算法:对计算过程的步骤或状态的一种刻画,是计算方法的一种实现方式。计算模型:刻画“计算〞这一概念的抽象的形式化系统或数学系统。指具有状态转换特征,能够对所处理的对象的数据或信息进行表示、加工、变换、输出的数学机器。递归函数、λ演算、图灵机等关于计算模型的两个重要原理相似性原理计算复杂性是否与计算模型有关?不同计算模型解决同一类问题所需资源是否相同?所有计算模型的计算能力等同所有合理的、功能足够强大的计算模型可以相互模拟计算,且使用的本质相同的并行计算时间、串行计算时间和空间丘奇-图灵论题:可计算性等价于图灵机可计算性对偶性原理在并行计算模型上,计算的时间与空间可以互换图灵机模型为存储程序式电子计算机提供了重要的设计思想结构一条两端可以无限延伸的纸带〔其上有无穷多可擦写的小格〕;一个读写头〔符号包括0、1、b〕;一个控制器〔执行控制读写头工作的命令〕五元组:〔状态、符号〕→〔写符号、移动、状态〕状态集:含一个开始状态,一个结束状态00011101111100控制器q101Rq1q110Rq1q1bbRq2q2bbLq3q200Hq1q211Hq1控制命令:当进入结束状态时,图灵机停机,纸带上的内容为输出结果VonNeumann机的特征计算机构成由五个局部构成:运算器、控制器、存储器、输入设备、输出设备指令和数据存储方式“以同等地位〞存放于存储器内,分别按地址访问指令和数据表示形式均用二进制码表示指令构成由操作码和地址码构成指令执行按顺序存放,顺序执行数据传输机器以运算器为中心VonNeumann机的组织结构存储器运算器控制器输入设备输出设备实线:数据流虚线:控制流现代计算机的组织结构运算器存储器控制器输入设备输出设备主存ALU控制单元外设主机CPUHarvardarchitecturePCdatamemoryprogrammemoryaddressdataaddressdataIRCPU细化的计算机系统组织ACCMQALUXCUIRPC

存储体

MDRMARI/O+1运算器控制器主存控制信号CPU功能主存ALU控制单元外设主机CPU例如——指令指令格式指令字长16位:操作码6位,地址码10位例:0000010000001000指令操作码load〔000001〕:[M]->ACCstore〔000010〕:ACC->Madd〔000011〕:ACC+[M]->ACCmul〔000100〕:ACC*[M]->ACCprint〔000101〕:打印[M]hlt〔000110〕:停机指令的执行过程取指根据PC访存读取当前要执行的指令PC+1译码识别指令字中的操作类型,产生相应的控制信号取操作数根据指令字的地址域访存执行写回计算机的工作过程执行每一条指令,都包括取指、译码和执行三个根本步骤,所以,计算机的工作过程,也就是不断地取指令、译码和执行的过程,直到遇到停机指令。取指令,PC值加1停机?译码结束YN执行存储器的组织存储单元按字节或字寻址程序和数据顺序存放数据段代码段读写操作以数据总线宽度为单位00000001001011101111低端高端1KB存储器地址

存储内容

010011010101101011…102310100111

CPU

地址数据读写控制例如——操作过程存放器使用规那么ACC:操作数之一和结果MQ:操作数之一和结果X:操作数之一加法[M]->X;ACC+[X]->ACC减法[M]->X;ACC-[X]->ACC乘法[M]->MQ;ACC->X;0->ACC;[X]*MQ->ACC//MQ除法[M]->X;ACC/[X]->MQ;余数在ACC中例如——ax2+bx+c(ax+b)x+cx->ACCx*a->ACCax+b->ACCx*(ax+b)->ACC(ax+b)x+c->ACC地址opopr0000000001(ld)00000010000001000100(mul)00000010010010000011(add)00000010100011000100(mul)000000100001000000110000001011010100001000000011000110000101000000110001110001101000x1001a1010b1011c1100例如——程序的执行过程计算1+2=?汇编语言程序 对应的机器指令 对应的操作

MOVAL,1 10110000 将立即数1传送到累加存放器AL中 00000001 ADDAL,2 00000100 计算两个数的和,结果存放到AL中 00000010 MOV[0008],AL 10100010 将AL中的数传送到地址单元0008 00001001 00000000 HLT 11110100 停机 程序的执行过程计算机的解题过程用户采用程序设计语言描述问题的求解过程,计算机在程序的控制下完成问题的求解计算机只能识别用0/1代码表示的程序用户需要使用高级语言编程高级语言源程序机器语言目标代码实际机器执行结果问题程序设计语言机器语言由0/1代码表示机器能完成的各种操作〔指令〕例:MCS-51两个存放器相加的机器语言指令:00101000依赖于机器〔处理器指令集〕,难于理解汇编语言用便于书写和记忆的符号表示机器的各种操作ADD、SUB、MUL、DIV、JMP、CMP等例:MCS-51两个存放器相加汇编语言指令:ADDA,R0依赖于机器高级语言程序描述方式适合人类的习惯与平台无关性高级语言的执行方式需要将高级语言程序转换成机器语言程序,才能在实际机器上执行编译执行:利用编译器一次性将高级语言程序翻译成机器语言程序C、FORTRAN。。。解释执行:语句翻译一条,执行一条,直至结束BASIC、JavaScript。。。计算机系统组成计算机系统硬件主机处理器(CPU)软件外围设备运算器控制器存储器(内存)RAMROM外部设备辅助设备输入设备(键盘、扫描仪、语音识别仪…)输出设备(显示器、打印机、绘图仪、…)辅助存储器(磁带、磁盘、光盘)输入/输出接口(PIO、SIO、CTC、ADC、DAC…)(I/O接口)总线(AB、DB、CB)系统软件(操作系统,编辑、编译程序,故障诊断,监控程序…)应用软件(科学计算,工业控制,数据处理…)程序设计语言(机器语言、汇编语言、高级语言)电源电路时钟电路计算机系统组成——硬件系统华硕P4S533-MX主板内存条插槽CPU风扇支架PCI扩展槽IDE硬盘接口各种外设接口,包括:键盘、鼠标、显示器、USB、声卡、网卡、并行口等CPU插槽两个概念层次化结构化分析方法从框架结构到具体实现细节——“逐步求精〞的分析设计方法虚拟机系统的一种抽象视图计算机系统的层次结构实际机器M1(机器语言)实际机器M1(机器语言)虚拟机M2(汇编语言)虚拟机M2(汇编语言)实际机器M1(机器语言)虚拟机M3(高级语言)计算机系统的层次结构虚拟机M2(汇编语言)实际机器M1(机器语言)虚拟机M3(高级语言)虚拟机M2(汇编语言)传统机器M1(机器语言)虚拟机M3(高级语言)微程序机器M1(微指令)虚拟机M3(汇编语言)传统机器M1(机器语言)虚拟机M4(高级语言)微程序机器M0(微指令)虚拟机M2(操作系统)计算机组成VS.计算机体系结构计算机体系结构(Computerarchitecture〕程序员可见的机器属性特指机器语言程序员。属性包含结构特征和功能特征,如数据表示、寻址规那么、存放器定义、指令集、存储系统、I/O结构等。

计算机组织(Computerorganization&implementation〕计算机体系结构的逻辑实现包括实际机器的数据流和控制流的组成,以及逻辑设计等。它着眼于物理机器内部各事件的排序方式与控制方式,各部件的功能,以及各部件的联系。计算机组成VS.计算机体系结构I/OsystemProcessorCompilerOperatingSystem(Windows2K)Application(Netscape)DigitalDesignCircuitDesignInstructionSetArchitecture(ISA)Datapath&ControlLayoutMemoryHardwareSoftwareAssembler计算机组成VS.计算机体系结构计算机体系结构分类按指令集特征复杂指令集〔CISC〕精简指令集〔RISC〕超标量〔Superscalar〕超流水线〔Superpipeline〕超长指令字〔VLIW〕按并行执行特征单指令流单数据流〔SISD〕单指令流多数据流〔SIMD〕多指令流单数据流〔MISD〕多指令流多数据流〔MIMD〕HotTopicsinComputerArchitecture1950sand1960s:ComputerArithmetic1970and1980s:InstructionSetDesignISAAppropriateforCompilers1990s:DesignofCPU,memory,andI/OsystemMultiprocessorsInstructionSetExtensions2000s:SOCdesignSpecializedapplicationprocessors计算机硬件的性能指标机器字长CPU一次能处理数据的位数存放器、ALU、总线、存储器等字长越长,数的表示范围越大,精度越高4位、8位、16位、32位、64位存储容量存储器可存储的二进制数据总数容量=存储单元个数×存储字长MAR=16位,那么有64K个存储单元;MDR=32位,那么共可存储64K×32=2Mb00000001001011101111低端高端计算机硬件的性能指标运算速度依赖于机器的主频、操作类型、存储器访问时间等主频也叫做时钟频率,用来表示微处理器的运行速度主频的单位是MHzMIPS:每秒能执行多少百万条指令由于执行不同类型的指令所需时间长度不同,所以MIPS通常是根据不同指令出现的频度乘上不同的系数求得的统计平均值。FLOPS:每秒钟浮点运算次数可靠性平均无故障运行时间MTBF(MeanTimeBetweenFailures),平均无故障间隔时间。性能/价格比例如——Intel微处理器性能系统性能评价对象硬件系统价格、效劳、应用软件、质量、功能、升级能力、性能、功耗。。。桌面系统性能评价CPU主频、内存大小、内存总线带宽、I/O总线性能、图形处理工作站效劳器网络系统操作系统应用系统事务处理Web性能定点性能浮点性能图形图像处理性能Web效劳性能数据处理性能科学与工程计算性能系统软件性能指标执行时间〔CPU时间、ElapsedTime〕峰值速度〔PeakPerformance〕负载〔load〕开销〔Overhead〕利用率〔UtilizationRatio〕饱和性能〔SaturatePerformance〕带宽〔Bandwidth〕延迟〔Latency〕吞吐率〔Throughput〕加速比〔Speedup〕效率〔Efficiency〕性能评测的常用方法时钟频率体系结构不同,难于比较指令执行速度〔MIPS〕比较加法指令的运算速度等效指令速度〔吉普森(Gibson)混合法〕以程序中各种指令的比例为权重,加权平均数据处理速率PDR(processingdatarate)法每条指令平均位数、每个操作数的平均位数、每条指令平均运算速度基准程序法(benchmark)考虑CPU、I/O结构、操作系统、编译器效率等评价计算机的实际工作能力基准测试套Dhrystone整数测试程序一个综合性的基准测试程序适于比较同一家族的机器Linpack测试向量性能和高速缓存性能Whetstone一个综合性测试程序测试浮点操作、整数计算和功能调用等性能SPECSystemPerformanceEvaluationCooperativeTPC(TransactionProcessingCouncil)计算机〔效劳器〕事务处理性能测试程序SPEC2000系列LmbenchSGI开发,测试操作系统性能空系统调用时间,进程切换时间,pipe、UDP、TCP、RPC的延迟和带宽,内存、Cache、TLB的读写性能,存储映射的性能WebstoneSGI在1995年开发,评测系统在不同环境、不同负载模式下的Web效劳性能系统吞吐量〔MB/s〕、延迟〔完成一个页面请求的时间〕、每分钟传送的页面数、平均连接率、失效率Netperf评测计算机系统的网络性能,也可用来评测DLPI〔DataLinkProviderInterface〕,UnixDomainSocket的性能TCP、UDP的带宽和请求应答数测试程序〔续〕SPECsfs97评测系统的NFS性能采用客户机/效劳器模式,客户机向效劳器发送特定的NFS请求,得到NFS文件效劳器的吞吐量和响应时间SPECjvm98使用8个应用来评测JAVA虚拟机的性能SPLASHStanford大学开发,评测共享存储系统性能pcw2021_v186.exePCPowerPCG5:世界上最快的处理器根据SPEC@CPU2000基准测试结果比较对象配备3GHzPentium4处理器的DellDimension8300配备3.06GHz双Xeon处理器的DellPrecision650。电子计算机ENIAC,运算速度5000次/秒,功耗150kw/h,占地170m2,造价100万美元。电子计算机的开展电子管计算机〔VacuumTubes〕1946-1958:磁鼓存储器,机器语言、汇编语言编程。ENIAC晶体管计算机〔Transistors〕1958-1964:磁芯作主存储器,磁盘作外存储器,开始使用高级语言编程。IBM700/7000系列,50万次/s集成电路计算机1964-1971:使用半导体存储器,出现多终端计算机和计算机网络IBM360系列,百万次/s大规模集成电路计算机1971-:出现微型计算机、单片微型计算机,外部设备多样化人工智能计算机1981-:模拟人的智能和交流方式电子计算机分类电子计算机分类巨型机功能极其强大,速度达上万亿次典型产品有:Cray-1、Cray-2、Cray-3、国产银河I、银河II、银河III等全球高性能计算机500强排行榜:中国高性能计算机100强排行榜:://DependenceonApplicationAreaDesktopHighPerformanceIntegerandfloatingpointprogramsServersHighPerformanceIntegerandcharacterstringsEmbeddedsystemsCodesize

RealtimeperformanceoncontinuousdatastreamsHandoptimizedkernels微型计算机的典型应用两个著名定律ComputingpowerandminiaturizationMoore’sLaw(1965,GordonMoore):Processorspeedandstoragecapacitydoubleevery18months18个月左右CPU性能翻一番,价格减一半CommunicationGilder’sLaw(1996?):Bandwidthgrowsthreetimesfasterthancomputingpowerandstoragecapacity摩尔定律59/87Edholm通信定律MemoryImpactofPerformance

1960-1985:Speed=ƒ(no.operations)1990Pipelined

Execution&

FastClockRateOut-of-Order

executionSuperscalar

InstructionIssue1998:Speed=

ƒ(non-cachedmemoryaccesses)Superscalar,

Out-of-OrdermachineshideL1datacachemiss(­5clocks)butnotL2cachemiss(­50clocks)?现代嵌入式系统的应用新一代智能设备掌上电脑车载智能设备笔记本计算机手表智能卡智能机顶盒POS销售机屏幕〔除了普通话机的功能还可以浏览因特网〕美国福特公司的高级经理曾宣称:“福特出售的'计算能力'已超过了IBM〞Innovationtrendinfutureapplications任天堂可视游戏机Thethirdwaveincomputing普适计算(ubiquitouscomputing)由MarkWeiser(1952-1999,Xerox)在1988年提出Anintegrationofhumanfactors,computerscience,engineering,andsocialsciencesIBM在1999年创造了一个名词,即“pervasivecomputing〔普及计算〕〞AnyContentAnyPlaceAnyDeviceAnyTimePersonalServerWashableComputingPowerConstraintHigh-endsystems,e.g.servers,stationsanddesktopsCoolingandpackagingcostReliabilityrequiresevery10℃increaseonoperatingtemperaturedoublefailurerateforthecomponentsbattery-poweredsystemse.g.laptop,cellphoneandPDAEnergyisacriticalnon-functionalconstraintinmobileandportablesystems系统评价指标处理器的功耗完成不同计算任务所需的功耗PowerandEnergyCircuitlevelview—dynamic(transistorswitching),shortcircuit,leakagecurrentVDD:supplyvoltage;CL:nodecapacitance;

f:

clockfrequency;A:activityfactor;Isc:Shortcircuitcurrent;Ilk:leakagecurrentArchitecturelevelview

—MemorySystemPower,BusPower,DatapathPower,etcEnergy=power*timeDynamicpoweristhedominantsourcenow.StaticpowerisgrowingfasterHigherMIPS/WattistheinnovationtrendNewprocessorswillprovidehigherMIPS/WattNewprocessorswillprovidehigherMIPS/Watt系统级低功耗研究(System-levelLow-power)System-levelPower-awareArchitecture、OS、Compiler——Synopsys资料并行计算〔ParallelComputing〕

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论