




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机系统组成与工作原理,2.1计算机系统的基本结构与组成(掌握)计算机系统的层次模型计算机系统的结构、组织与实现2.2计算机系统的工作原理(掌握)冯诺依曼计算机架构模型机系统结构模型机指令集模型机工作流程,1,第2章计算机系统组成与工作原理,2.3微处理器体系结构的改进(理解)冯诺依曼结构的改进并行技术的发展流水线结构超标量与超长指令字结构多机与多核结构2.4计算机体系结构分类(理解)2.5计算机性能评测(掌握)字长、存储容量、运算速度,2,2.1.1计算机系统的层次模型,(a)图自下而上反映了系统逐级生成的过程,自上而下反映了系统求解问题的过程;软硬件的逻辑等价性可以表现为:硬件软化(如RISC思想)、软件硬化(如CISC思想)、固件化(如微程序);(b)图中的虚拟机:与某种特殊编程语言对应的假想硬件机器,微体系结构层(微程序或硬连逻辑),操作系统层,语言处理层(解释、编译),用户程序层(语言编程),系统分析层(数学模型、算法),硬核级,数字逻辑层(硬件),指令系统层(机器语言指令),应用语言虚拟机,高级语言虚拟机,汇编语言虚拟机,操作系统虚拟机,机器语言级,微程序级,寄存器级(硬件),硬件系统:异常处理机构、指令系统、CPU、存储器、I/O及通信子系统,系统软件:操作系统、编译器、数据库管理系统、Web浏览器、设备驱动、中断服务程序,应用软件,3,2.1.2计算机系统的结构、组成与实现,体系结构Architecture程序员关心的计算机概念结构与功能特性如:确定指令集中是否有乘法指令;计算机组成Organization从硬件角度关注物理机器的组织如:乘法指令由专用乘法器还是用加法器实现计算机实现Realization底层的器件技术、微组装技术、冷却技术等如:加法器底层的物理器件类型及微组装技术,系列机,4,计算机的体系结构,1946年,美国宾夕法尼亚大学莫尔学院的物理学博士Mauchley和电气工程师Eckert领导的小组研制成功世界上第一台数字式电子计算机ENIAC。著名的美籍匈牙利数学家VonNeumann参加了为改进ENIAC而举行的一系列专家会议,研究了新型计算机的体系结构。1949年,英国剑桥大学的威尔克斯等人在EDSAC机上实现了冯诺依曼模式。直至今天冯诺依曼体系结构依然是绝大多数数字计算机的基础。,5,冯诺伊曼计算机系统结构框图,6,体系结构角度的多层结构,硬件向上提供的接口:指令系统异常事件端口定义,7,体系结构、组成与实现,体系结构Architecture程序员关心的计算机概念结构与功能特性如:确定指令集中是否有乘法指令;计算机组成Organization从硬件角度关注物理机器的组织如:乘法指令由专用乘法器还是用加法器实现计算机实现Realization底层的器件技术、微组装技术、冷却技术等如:加法器底层的物理器件类型及微组装技术,系列机,8,计算机的组成(1),9,计算机的组成(2),总线结构,10,计算机的组成(3),同步数字系统,11,组织角度的多层结构,12,体系结构、组成与实现,体系结构Architecture程序员关心的计算机概念结构与功能特性如:确定指令集中是否有乘法指令;计算机组成Organization从硬件角度关注物理机器的组织如:乘法指令由专用乘法器还是用加法器实现计算机实现Realization底层的器件技术、微组装技术、冷却技术等如:加法器底层的物理器件类型及微组装技术,系列机,13,计算机的实现,半导体技术制造技术封装技术装配技术电源技术冷却技术,14,15,2.2.1冯诺依曼体系架构,硬件组成五大部分以存储器为中心信息表示:二进制计算机内部的控制信息和数据信息均采用二进制表示,并存放在同一个存储器中工作原理:存储程序/指令(控制)驱动编制好的程序(包括指令和数据)预先经由输入设备输入并保存在存储器中计算机开始工作后,在不需要人工干预的情况下由控制器自动、高速地依次从存储器中取出指令并加以执行,2.2.2模型机系统结构,基于总线的冯诺依曼架构模型机总线子系统:作为公共通道连接各子部件,用于实现各部件之间的数据、信息等的传输和交换(第4章)存储器子系统:存放当前的运行程序和数据(第5章)输入输出子系统:完成计算机与外部的信息交换(第6章)CPU子系统:集成了运算器、控制器和寄存器的超大规模集成电路芯片(VLSI)(第3章),16,1.模型机总线结构,按传输信息的不同,可将总线分为数据总线DB、地址总线AB和控制总线CB三类:地址总线通常是单向的,由主设备(如CPU)发出,用于选择读写对象(如某个特定的存储单元或外部设备);数据总线用于数据交换,通常是双向的;控制总线包括真正的控制信号线(如读/写信号)和一些状态信号线(如是否已将数据送上总线),用于实现对设备的监视和控制。,MPU,RAM,ROM,I/O接口,外设,AB,DB,CB,17,2.模型机内存储器,存储器组织由许多字节单元组成,每个单元都有一个唯一的编号(存储单元地址),保存的信息称为存储单元内容。访问(读或写)存储单元:存储单元地址经地址译码后产生相应的选通信号,同时在控制信号的作用下读出存储单元内容到数据缓冲器,或将数据缓冲器中的内容写入选定的单元。,18,19,smallendianness,20,各种宽度信息的存储,(a)按任意相连存储紧凑,但访问需要2总线操作,(b)按整数边界存储有浪费,但访问效率高,21,3.输入/输出子系统,计算机与直接相联的外围设备进行数据交换的过程通常称为输入/输出(In/Out),而与远方设备进行数据交换的过程习惯上称为数据通信(datacommunication),通用寄存器组堆栈指针SP程序计数器PC,微操作控制电路,控制总线CB,地址总线AB,数据总线DB,运算器,寄存器组,控制器,4.模型机CPU子系统,22,模型机指令系统,指令是发送到CPU的命令,指示CPU执行一个特定的处理,如从存储器取数据、对数据进行逻辑运算等。CPU可以处理的全部指令集合称为指令集(InstructionSet)。指令集结构(ISA,InstructionSetArchitecture)是体系结构的主要内容之一,对CPU的基本组织会产生非常大的影响。ISA功能设计实际就是确定软硬件的功能分配。指令通常包含操作码和操作数两部分。操作码指明要完成操作的性质,如加、减、乘、除、数据传送、移位等;操作数指明参加上述规定操作的数据或数据所存放的地址。,23,2.2.3模型机常用汇编指令,24,2.2.4模型机工作原理,计算机的工作本质上就是执行程序的过程。顺序执行指令执行的基本过程可以分为取指令(fetch)、分析指令(decode)和执行指令(execute)三个阶段。非顺序执行转移(jump):执行条件/无条件转移指令,不返回过程(procedure)调用:主程序调用子程序后返回断点中断(interrupt):外界突发事件处理完后返回断点异常(exception):程序本身产生的某些例外处理完后重新执行陷阱(trap):程序本身产生某些例外条件处理完后返回断点,25,程序的执行过程,取指令、分析指令、执行指令,AB,DB,地址译码,读控制,MOV5CH,R1ADDR1,2EH,R2,1,26,2.3冯诺依曼体系结构的演进,演进CPU指令集存储器子系统总线输入/输出子系统改变改变控制方式,发展数据、需求、模式等其它驱动方式;改变串行执行模式,发展并行技术;,3-6章重点,指令功能、指令格式、寻址方式,分层结构,高速总线+多种接口方式,冯诺依曼型计算机的本质特点也造成了其瓶颈:指令执行的串行性存储器读取的串行性,27,2.3.1不同的指令集设计策略:CISC与RISC,CISC(ComplexInstructionSetComputer,复杂指令集计算机)不断增强指令的功能以及设置更复杂的新指令取代原先由程序段完成的功能,从而实现软件功能的硬化。RISC(ReducedInstructionSetComputer,精简指令集计算机)通过减少指令种类和简化指令功能来降低硬件设计复杂度,从而提高指令的执行速度。,现代计算机:RISC+CISC,28,按处理器指令架构分类,复杂指令集计算机(ComplexInstructionSetComputer,CISC),如X86控制器的设计实现复杂包含了复杂计算指令且运行时间长精简指令集计算机(ReducedInstructionSetComputer,RISC),如IBM的PowerPC,Sun的SPARC,MIPS的MIPSRxxx系列高效的编译器才能使RISC优点充分体现指令数据少且每条指令都能在单时钟周期完成超长指令集架构是英文(VeryLongInstructionWord,VLIW),IA-64,如INTEL的IA64,AMD的X8664简化处理器结构,删除复杂的控制器电路,每时钟周期可运行20条指令,而CISC通常只能运行1-3条指令,RISC能运行4条指令,29,30,CISC的设计思想及特点,每条指令执行单一功能,硬件复杂为编程方便,往往增加指令数目,指令编码长度增加,硬件译码更复杂为编程灵活,增加寻址方式,指令长度不一,译码复杂每条指令完成一个完整功能,因此单条指令涉及多个操作,如取指、参数、运算、存结果等为增加新功能,需增加新指令,因此指令系统越来越复杂,这也是CISC的由来如MC68020机就有25种寻址模式,31,RISC的设计思想及特点,RISC的出现简化了指令系统,克服了CISC的缺点,使更多的芯片硅面积可以用于实现流水和高速缓存,有效地提高了计算机的性能。RISC机的设计应当遵循以下五个原则。指令条数少,格式简单,易于译码;提供足够的寄存器,只允许load和store指令访问内存;指令由硬件直接执行,在单个周期内完成;充分利用流水线;强调优化编译器的作用,32,CISC和RISC的区别,内核结构CISC:数据线和指令线分时复用,即冯.诺依曼结构,程序存储器和数据存储器合并编址RISC:数据线和指令线分离,即哈佛结构。取指令和取数据可同时进行处理器指令集CISC:不等长指令集,需要对不等长指令进行分割,执行时间长,采用微码RISC:等长精简指令集,执行速度快且性能稳定。可同时执行多条指令,可将一条指令分割成若干个进程或线程,交由多个处理器同时执行,并行处理方面RISC明显优于CISC软件CISC:DOS、WindowsRISC:成熟的操作系统少,Windows需要翻译过程,速度慢,33,RISC,CISC看法的误区,RISC指令都是简单指令LDREQR0,R1,R2,LSR#16!指令的强大,一般的CISC处理器望尘莫及。RISC的“简单”是指指令集的执行时间、指令长度、指令格式整齐划一CISC的复杂指令速度慢、执行效率很低现代CISC处理器具有非常长的流水线(PIII采用了25级的流水线),执行速度快。但老的CPU执行速度可能较慢但RISC不管是老的CPU,还是新的CPU,指令执行时间都是相同的,不需要在对指令执行作出优化RISC处理器比CISC处理器需要更多的寄存器这不是一个需求问题,而是一个实现问题。所以有的CISC寄存器与RISC相当。一般情况RISC需要比较多的寄存器RISC都有流水线ARM2没有采用流水线,CISC与RISC的数据流,34,分层的存储子系统,如何以合理的价格搭建出容量和速度都满足要求的存储系统,始终是计算机体系结构设计中的关键问题之一。现代计算机系统通常把不同的存储设备按一定的体系结构组织起来,以解决存储容量、存取速度和价格之间的矛盾,设计目标:整个存储系统速度接近M1而价格和容量接近Mn,35,36,存储子系统,主存(内存):DRAM(存储数据和临时调入的程序)、FLASH(存储引导程序、固化程序(固件),占用寻址空间,临时性存储,解决速度问题编址方式:字节编址信息存放方式:大/小端(big/smallendianness)系统辅存(外存):磁盘、光盘。文件/块存储,虚拟存储介质,较长时间存储,解决容量问题均衡速度、容量、成本、长期存储等要求而分级存储器需考虑的主要因素速度、容量、成本,其他增加存储器带宽的方法,并行存储器,双端口存储器,哈佛体系结构,37,现代高速总线,高速并行总线,高速总线串行化,38,多级总线结构,北桥,南桥,前端总线FrontSideBus,39,40,外部总线、(系统)外总线如并口、串口,系统总线、(系统)内总线如ISA、PCI,片(间)总线三总线形式,片内总线单总线形式,计算机系统的四层总线结构,输入输出管理方式,41,2.3.2并行处理技术,指令级并行技术ISP流水线、超标量、超长指令字系统级并行技术SLP多处理器(多机/多核)、多磁盘线程级并行技术TLP同时多线程SMT电路级并行技术CLP组相联cache、先行进位加法器,并行处理技术实现多个处理器或处理器模块的并行性,其基本思想包括时间重叠(timeinterleaving)、资源重复(resourcereplicaiton)和资源共享(resourcesharing)。,42,2.3.3流水线技术,可通过分割逻辑,插入缓冲寄存器(流水线Reg)来构建,43,指令时空图,顺序执行,4级流水线执行,流水线满载,44,更细的流水线,取指(FI)指令译码(DI)计算操作数地址(CO)取操作数(FO)执行指令(EI)写操作数(WO),45,流水线CPU的特点,优点:通过指令级并行来提高性能。缺点:增加了硬件成本。流水寄存器会引入延迟和时钟偏移,这些额外开销会使每条指令的执行时间有所增加,同时限制了流水线的深度。流水线中各段的操作存在关联(dependence)时可能会引起流水线中断,从而影响流水线的性能和效率。,46,流水线冲突,理想流水线的性能:每个时钟周期完成一条指令实际流水机器中可能存在冒险(hazard)导致停顿:数据冲突(如后面的计算要用到前面的结果)定向技术可将结果数据从其产生的地方直接传送到所有需要它的功能部件编译器可利用流水线调度(scheduling)技术来重新组织指令顺序结构冲突(硬件资源不够)增加额外的同类型资源改变资源的设计使其能被同时使用控制冲突(分支等跳转指令引起)可采用分支预测及预测执行技术最大限度地使处理器各部分保持运行状态。,多端口的寄存器堆,哈佛结构存储器、超标量,47,流水线数据冲突及乱序执行,注意这里其实需要两个独立执行部件,48,流水线结构冲突及超标量流水线,?,有5个执行单元的超标量流水线,有2套硬件的超标量流水线CPU,共用一个取指单元的5段双流水线,49,2.3.4超标量CPU的体系结构,超标量技术:可在一个时钟周期内对多条指令进行并行处理,使CPI小于1;特点:处理器中有两个或两个以上的相同的功能部件;要求操作数之间必须没有相关性;,整数指令,浮点指令,50,超标量处理机一般概念性结构,instructionfetching多个流水线读取及转移预测逻辑instructiondecoding并行译码器,预译码技术instructiondispatching动态规划instructionexecution多个流水线功能单元instructioncompletion暂存结果数据instructionretiring真正更新Reg和Mem中的结果数据,超标量结构,两条输入流水线,三条执行流水线,每个时钟周期可从存储器中获取两条指令,用于执行不需要访问存储器的指令,可处理所有需要或不需要访问存储器的指令,可用于进行乘、除类较复杂的算术运算,决定应使用哪一条执行流水线,52,和超标量处理机不同,超长指令字VLIW(VeryLongInstructionWord)依靠编译器在编译时找出指令之间潜在的并行性,并通过指令调度把可能出现的数据冲突减少到最小,最后把能并行执行的多条指令组装成一条很长的指令,然后由处理机中多个相互独立的执行部件分别执行长指令中的一个操作,即相当于同时执行多条指令。VLIW处理机能否成功,很大程度上取决于代码压缩的效率,其编译程序和体系结构的关系非常密切,缺乏对传统软件和硬件的兼容,因而不大适用一般应用领域。,VLIW处理机,53,2.3.5多机与多核结构,大规模并行处理机(MPP)是一种价格昂贵的超级计算机,它由许多CPU通过高速专用互联网络连接。机群(cluster)由多台同构或异构的独立计算机通过高性能网络或局域网连在一起协同完成特定的并行计算任务。刀片(blade)通常指包含一个或多个CPU、内存以及网络接口的服务器主板。通常一个刀片柜共享其它外部I/O和电源,而辅助存储器则有距离刀片柜较近的存储服务器提供。网格(Network)是一组由高速网络连接的不同的计算机系统,可以相互合作也可独立工作。网格计算机将接受中央服务器分配的任务,然后在不忙的时候(如晚上或周末)执行这些任务。,54,多核处理器,55,多线程技术,单片多处理器(ChipMulitProcessor,CMP)问题:晶体管数量、芯片面积及芯片发热量多线程处理器(MultithreadedProcessor)细粒度多线程(Fine-GrailMultithreading)在每个指令中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络贷款财务担保合同负债监管与风险控制协议
- 住宅小区场地租赁合同终止及社区服务协议
- 厂房租赁合同违约责任范本
- 建筑材料性能测试加工及认证合同
- 餐饮行业服务员招聘及培训考核合同
- 文物保护区施工专项方案
- 卡尺使用培训
- 中班健康活动《零食要少吃》主题教案
- 糖尿病病人的护理和教育
- 员工应急能力培训
- 人工智能应用产业园及配套基础设施项目可行性研究报告(范文模板)
- 未成年人权益保护法律解析
- 药品售后服务承诺书示例
- 2025年南模中学自招试题及答案
- 《水利工程建设项目文件收集与归档规范SLT 824-2024》知识培训
- “艾梅乙”感染者消除医疗歧视制度-
- 肉类食品供货合同7篇
- 天津师范大学《心理与教育统计学》2023-2024学年第二学期期末试卷
- 铝合金楼梯踏步施工方案
- 装修工程招标书范本
- 2025团校入团培训考试题库(含答案)
评论
0/150
提交评论