已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机系统结构 第4章输入输出系统 4 1输入输出系统概述 4 2输入输出总线 4 3I O处理机 第4章输入输出系统 输入输出系统包括输入输出总线外围设备或I O设备设备控制器与输入输出操作有关的软硬件 4 1输入输出系统概述 4 1输入输出系统概述 4 1 1输入输出系统的特点4 1 2基本的输入输出方式 4 1输入输出系统概述 输入输出系统的特点集中反映在异步性 实时性和与设备无关性上 1 异步性各个设备按照自己的时钟工作 它们相对于主机通常是异步工作的 但在某些时刻又必须接受处理机的控制 为此 必须考虑以下因素 1 数据缓冲 在外设接口中应有相关数据寄存器或缓冲器 2 数据传输的配合 外设与处理机之间速度差异非常大 信息格式也不同 直接传输一般是不可行的 4 1 1输入输出系统的特点 2 实时性处理机必须实时地按照不同设备所要求的传送方式和传送速率为输入输出设备服务 包括从外设接收数据 向设备发送数据和有关控制信息 及时地处理数据传送中的错误 以及处理机本身的硬件和软件错误 如电源故障 数据校验错 页面失效等 在I O设备提出中断 DMA等请求时 CPU要及时响应 完成必要的I O操作或控制 3 与设备无关性制定统一的独立于具体设备的接口标准 包括物理接口和软件接口 使得应用程序依据这一接口可以访问或支持各种I O设备 使用即插即用 PNP 技术 这种技术使得各种I O设备都可能通过统一的接口与计算机系统连接 这些接口提供了有关设备配置信息 其中断 I O端口地址 DMA通道号等由系统自动识别并赋值 无需应用人员进行配置 解决I O系统的异步性 实时性及与设备无关性的问题基本方法是采用层次结构组织I O设备 有层次地实现I O设备自治控制和对I O设备进行分类处理 并针对不同的设备采用不同的输入输出方式 在外围设备很多的情况下 I O系统具有四级层次结构 靠近处理机和主存储器的最高层采用标准的控制功能 如I O处理机或I O通道 中间层是标准接口 外围设备通过设备控制器与标准结构相连接 所谓自治控制 是指由I O系统自身管理大部分工作 包括数据传输 数据缓冲 信息格式转换等 CPU只对I O设备作启动 初始化 关闭 暂停等控制操作 I O系统的不同层次的自治控制程度和目标不一样 I O设备一般要按工作方式 工作速度和使用场合进行分类 如按工作速度可分为面向字符设备 Character OrientedDevice 和面向数据块的设备 Block OrientedDevice 前者速度较低 有键盘 打印机 串行通讯口等 常以字符或字作为传送的基本单位 后者速度较快 如磁盘机 扫描仪等 常以一定长度的字符组或字块作为传送的基本单位 对面向数据块的设备进行I O控制一般要求在传送过程中能自行管理 I O设备分类有利于让不同类型的设备连接到不同的I O通道或处理机上 也便于对不同设备采用不同的数据传输方式 如对实时控制设备采用中断方式 并按照中断的优先级采取不同的相应策略 对块设备采用DMA方式等 1 程序控制输入输出 状态驱动 应答 查询 条件驱动等 2 中断输入输出方式3 直接存储器访问 DMA 方式 4 1 2基本输入输出方式 1 程序控制输入输出 该方式具有如下特点 1 何时对何设备进行输入输出操作完全受CPU控制 2 I O设备和CPU处于异步工作关系 CPU必须测试外设的工作状态 才能决定是否进行数据传输 CPU本身资源浪费十分严重 3 数据的输入输出都要经过CPU 其过程为 I O设备 I O接口寄存器 CPU 主存 要占用与CPU相连的总线资源 4 灵活性较好 程序员可任意安排外设的优先级和数据传送的检查和变换 5 一般用于连接低速字符设备 2 中断方式 该方式具有如下特点 1 CPU和I O设备能够并行运行 2 具有及时响应意外事件或异常的能力 3 与程序控制的输入 输出方式一样 数据的输入输出都要经过CPU 要在程序的控制下完成其过程 要占用与CPU相连的总线资源 同样具有灵活性较好的特点 一般用于连接低速字符设备 3 DMA方式 该方式具有如下特点 1 主存可被CPU访问 也可被外设访问 要有存储管理部件为各种访存申请排队 一般外设访存申请安排在最高级 2 需要有专用部件 如DMA控制器 该部件除具有数据缓冲 状态和控制寄存器外 还要有主存地址寄存器 设备地址寄存器 数据交换计数器等控制传送过程的寄存器 以及从字节装配成字和把字拆分成字节的硬件 3 外设与主存之间的数据传送不需要执行程序 由DMA控制器独立管理 CPU仅仅对DMA控制器事先进行初始化 4 DMA数据传送过程完全在硬件控制下由DMA控制器完成 CPU可与外设并行工作 如果主存频宽足够的话 外设的工作完全不影响CPU自身的运行 5 一般用于连接较高速的块设备 也可用于连接字符设备 4 2输入输出总线 4 2 1总线概述4 2 2输入输出总线的设计 4 2输入输出总线 4 2 1总线概述 总线是连接计算机系统相关组件的公共信息通路 按系统中的位置分类芯片级 片内总线 板级 连接插件板内的各个组件 也称局部总线 系统级 主板上连接各插件板的总线 即系统总线 系统外部 连接主机和外围设备的信息通路 即输入输出总线或I O总线 4 2 1总线概述 专用总线只连接一对物理部件成本高 但不争用总线 可靠性高非专用总线可被多个部件分时共享优点 成本低 接口标准化 易扩充缺点 产生总线争用 可靠性问题 1 专用总线和非专用总线 A B D C E 所有部件之间用专用总线互连 若增设部件E 则需增设多条连接通路 采用非专用总线连接各个部件 很方便增设部件 图4 1专用总线和非专用总线 一般芯片级 板级和系统级总线采用非专用总线 而I O系统中的外部总线 外围设备与主机连接的信号线 使用专用总线 通常CPU通过一个接口芯片与存储器或外设连接 这个接口芯片称为主桥 通常外部总线是标准化的 以便主机设计和外围设备的设计相互独立进行 使不同厂商的产品能够相互兼容 使系统的成本降低 图4 4一种基于ARM的芯片结构 ARMCPU核 AHB ASB 片内RAM 桥 DMA控制器 APB UART 定时器 并行口 外部总线接口 测试口 2 总线的控制方式 对总线的使用进行合理的分配和管理 主要是优先级仲裁根据总线控制部件的位置 控制方式分为两类 集中式总线控制分散式总线控制集中式总线控制有三种 1 串行链式查询总线BSBRBGBS 忙BR 总线请求BG 总线响应请求优点 用线少 算法简单 易扩充 缺点 优先级固定 不灵活 对响应链的电路故障很敏感 2 计数器定时查询BS 0时 计数器开始计数 计数值通过一组地址线发向各设备 各接口中的设备地址与计数值一致时 该设备置 1 BS线 线数为 2n根 优点 计数器的初值可用程序来设置 优先级灵活 缺点 控制线较多 控制较复杂 总线分配速度受限 3 独立请求优点 总线分配速度高 控制灵活 优先级可通过程序改变 缺点 控制线数多 要2n根 控制复杂 3总线的通信技术 通讯联络的控制信号有同步式和异步式两种 对应着两种不同的总线通讯方式 同步通讯与异步通讯 1 同步通信 同步通讯 又称无应答通讯 是指通讯联络信号采用同步式的一种通讯方式 在这种方式中 总线上的部件通过总线传送信息时 源部件除传送有关信息外 还传送同步脉冲 作为公共的时标 进行同步 目的部件通过检查同步脉冲 才认为信号线传送的信息有效 可以取用 同步脉冲的产生方法有两种 一是在总线控制器中设置统一的时钟系统 产生同步时钟 为所有部件共享 即由总线控制器发送到每个部件 二是每个部件自带时钟发生器 由源部件发送同步脉冲 然而 它们必须与中央时标发生器的时标同步 在同步通讯时 两个部件通过总线传送信息由定宽 定距的时标同步 因而 传送速度快 具有较高的传输速率 而且受总线长度的影响小 即当信号在总线上因长度而滞后时 也不会影响传送速率 但是 时标线上的干扰信号会引起错误的同步 而且 滞后的时标也会造成同步误差 因此 同步通讯适用于总统长度较短及总线所接部件的存取时间比较接近的系统 2 异步通信 异步通讯 又称应答通讯 是指通讯联络的控制信号采用异步式的一种通讯方式 即总线上的部件通过总统传送信息时 源部件不只是单向发送信息 它在发出一个信息后 要等待目的部件发回确认信号 再发送下一个信息 也就是说 源部件先发请求号 等待目的部件给出回答信号 建立了通讯联络标志 再开始通讯 在通讯的每一个进程都有应答 彼此进行确认 它与异步控制的 握手 联络完全类似 总线宽度 总线宽度是指总线中信号线的数量 总线的线数越多 成本越高 干扰越大 可靠性越低 占用的空间也越大 当然传送速度和流量也越高 此外 总线的长度越长 成本越高 干扰越大 波形畸变越严重 可靠性越低 为此 越是长的总线 其线数就应尽可能减少 数据总线的宽度有一位 一个字节或一个全字等等 还有 一般采用传输信号复用的方式 比如地址 数据复用比不采用复用方式的总线性能要低 4 2 2输入输出总线的设计 1 输入输出总线设计中要考虑的因素 数据通路宽度数据总线的物理宽度 即一个时钟周期所传送的信息量 它直接取决于数据总线的线数 总线中数据线数量多 其数据通路宽度宽 数据宽度数据宽度是I O设备取得I O总线后所传输数据的总量 又称数据逻辑宽度 一般数据传送完后就释放总线 重新开始分配总线 二次分配总线之间所传送的数据宽度可能要经许多个时钟周期的分次传送来完成 采用何种数据宽度与总线上各设备的工作特点 所采用的总线控制方式和通信技术有关 数据宽度有单字 单字节 适合低速设备定长块 适合高速设备可变长块 适合高优先级的中高速设备单字加定长块 适合高优先级的低速设备单字加可变长块 灵活高效但复杂花钱 传输单位的大小 传输单位是总线上一次操作传输的数据量 传输单个字可以简化总线设计 传输多个字的数据块则可以减少总线开销 提高总线带宽 总线主设备的数量 只有单个主设备的总线控制简单 而具有多个主设备的总线虽然增加了总线功能 但应设有总线仲裁机构 使得总线控制复杂 事务的分离性 总线事务的分离是指将总线上的操作分成请求操作 应答操作等更加基本的操作元素 以消息的形式传递 而不是在整个数据传输过程中占用总线资源 从而可以减少总线占用时间 使多个数据传输可以重叠进行 提高了总线带宽 也就是说 总线事务分离是在总线上不传送地址或数据的时钟周期内及时释放总线 如在存储器访问迟延时间内将总线释放 从而提高总线资源的利用率 如果系统能够重叠地在总线上处理多个事务的话 总线的实际带宽会明显提高 总线的定时方式 即同步方式和异步方式 总线带宽 总线带宽是指单位时间内传输的数据速率 单位是B s 2 提高总线带宽的新途径 长期以来 总线带宽的提高明显低于CPU性能提高的速度 也明显低于网络传输带宽的提高速度 出现严重的I O传输数据瓶颈 近年来 出现了一些新型的I O总线 采用的新技术有 1 采用高速串行传输技术 该技术通过在每一条信号线上独立进行数据传输的同步 使各条线路上的信号异步进行 从而提高数据传输速率 2 采用消息传递方式 在I O系统中 1条消息可以包含1条命令 1个访问地址 1个数据或是它们的组合 还可以包含与设备相关的一些参数 以及识别不同消息的标志信息 这样形成几种不同的消息格式 总线上的每一个事务可以用1条消息来表达 一般分为请求消息和应答消息 消息传递方式提高了总线传输信息的灵活性 减少了信号线的数量和总线的成本 3 支持匀时传输机制 视频 音频等多媒体数据流信息需要建立匀时 isochronous 的数据传输机制 该机制要求把每一个数据的传输迟延控制在一定的范围内 比如1ms 为此 通常把总线上的传输时间分成1ms的时间片 在每一个时间片中 首先完成具有匀时传输要求的数据传输 然后传输其它可以容忍较大迟延的I O数据 USB总线 PCIExpress总线和InfiniBand总线 以及连接磁盘的SATA总线等新型总线都支持高速串行传输和消息传递方式 USB总线还支持匀时传输机制 4 应用交换式I O连接结构交换式输入输出结构以高速串行传输为基础 采用主桥作为交换机构 交换机构类似高速公路立交桥 它是一个多端口的芯片 可以在外围设备接口之间建立多条连接通路 替代了一条多点连接的共享线路 实现多对点对点的通信 在交换式I O系统结构中 有一个连接CPU的系统主桥和多个其它总线桥 传输线路在桥与设备接口之间形成点到点的连接 其通信采用同步串行方式 容许信号迟延大于1个时钟周期情况 其线路上的传输速率达到2 5GHz以上 相当于传统并行总线的带宽 这种I O系统结构普遍采用基于分组的传输方式 将传输请求以消息传递的方式将每个输入输出操作分割成若干个分离的事务 使多个输入输出操作之间可以重叠进行 提高了线路的传输效率 这里 事务的分割表现为请求消息和应答消息的分离传输 例4 1设32位总线的工作频率是33MHz 通过总线访问存储器的过程分为地址传输 1个周期 访存延迟等待 3个周期 数据传输 1个周期 求 总线在连续传输4个字时的传输带宽 如果采用分离的总线事务 在延迟等待期间可传输其它访问的地址或数据 总线在连续传输4个字时的传输带宽 如果传输无限多的数据 总线能够达到的最大传输带宽 解 总线用5个周期传输了1个32位字 连续传输4个字时的带宽为 4B 5 33M 26 4 106B s 总线利用3个延迟等待周期传输后3个地址 然后用4个周期连续传输4个字 这样在8个周期连续传输16个字节 传输带宽为 16B 8 33M 66 106B s 如果连续不断地传输数据 总线每1个周期传输1个字 传输带宽为 4B 1 33M 132 106B s 4 3 1通道4 3 2外围处理机 4 3I O处理机 基本输入输出方式对CPU存在一定的依赖性 有的要求对I O接口进行初始化 有的要求作专门的输入输出控制 状态监测等 使CPU负担过重 特别是一些大型计算机外围设备众多 差异较大 为了将CPU从I O事务中脱离出来 普遍采用了I O处理机方式 I O处理机有两种 即通道处理机 简称通道 和外围处理机 通道是一个具有输入输出处理器控制的输入输出部件 通道控制器具有自己的指令系统和通道程序 能够根据程序控制多个外部设备 并提供了DMA共享的功能 通常 一台大型计算机可有多个通道 一个通道可连接多个设备控制器 一个设备控制器可管理多台I O设备 形成典型的输入输出系统的四级层次结构 4 3 1通道 1 通道的工作原理 IBM370的I O结构 通道的一般工作过程 1 接受CPU的I O指令 目态程序中含有访管指令 选定外设与通道相连2 进入管态 执行CPU为通道组织的通道程序 启动通道进行I O操作 此时CPU返回目态程序 3 给出外设的有关地址 主存缓冲区的首地址 控制外设与主存之间的数据交换4 检查外设的工作状态 对部分异常进行处理5 在数据传送过程中完成必要的格式转换6 指定传送工作结束时要进行的操作 如以中断方式要求CPU进入管态处理后返回目态 2 通道的种类 1 字节多路通道 ByteMultiplexorChannel 这是一种简单的共享通道 依靠它与CPU之间的高速数据通路 采用分时工作方式为多台低速或中速的外围设备服务 字节多路通道工作方式有两种 一种是字节交叉方式 byte interleavemode 各设备占用时间片很短 1次传输1个字节 还有一种是成组方式 blockmode 即1次传输1组数据 通过一个超时控制机构来自动实现两种工作方式的转换 若在预置的时间内 数据仍未传送完毕 则自动转入成组方式 否则继续采用字节交叉方式 2 通道的种类 2 选择通道 SelectorChannel 针对高速外围设备 如磁盘机 必须设置专门通道在一段时间内单独为一台外围设备服务 但在不同的时间内仍可以选择其它设备 选择通道一旦选中某设备 就一直工作到数据传输结束为止 3 数组多路通道 BlockMultiplexorChannel 数组多路通道是前两种通道工作方式的结合 它每次选择一个高速设备后即传送一个数据块 这样可以并发地轮流为多台高速设备服务 通道流量是指通道在数据传送期内 单位时间内传送的字节数 它能达到的最大流量称通道极限流量 一个通道能达到的极限流量与其工作方式 数据传送期内选择一次设备的时间TS和传送一个字节的时间TD的长短有关 通道极限流量fmax byte 1 TS TD 3 通道流量的分析 字节多路通道方式 每选择一台设备只传送一个字节 通道极限流量fmax byte 1 TS TD 数组多路通道方式 每选择一台设备只传送K个字节 如果要传送N个字节 就得经 N K 次传送才行 每次都要花去一个选择设备的时间TS 通道极限流量fmax block K TS KTD 1 S K TD 选择通道方式 每选择一台设备就把N个字节全部传送完 通道极限流量fmax select N TS NTD 1 TS N TD 显然 若通道的TS TD一定 且N K时 字节多路方式工作时所能达到的极限流量最小 数组多路方式工作的居中 选择方式工作的最大 由通道工作原理可知 当挂上设备后 设备要求通道的实际最大流量 对于采用字节交叉方式工作的字节多路通道应为该通道所接各设备的字节传送速率之和 即 而对于其他两种类型的通道应为所接各设备的字节传送速率中之最大的那个 即 式中 j为通道的编号 fi j为第j通道上所挂的第i台设备的字节传送速率 pj为第j号通道中所接设备的台数 为了保证第j号通道上所挂的设备在满负荷的最坏情况下都不丢失信息 必须满足设备要求通道的实际最大流量不超过通道所能达到的极限流量这一流量设计的最基本原则 因此 对上述3种类型的通道应分别满足关系式 如果I O系统有m个通道 其中1至m1为字节多路通道 m1 1至m2为数组多路通道 m2 1至m为选择通道 则该I O系统工作时的极限流量将为 必然会满足 设有一字节多路通道 它有3个子通道 0 号 1 号高速印字机各占一个子通道 0 号打印机 1 号打印机和 0 号光电输入机合用一个子通道 假定数据传送期内高速印字机每隔25 s发一个字节请求 低速打印机每隔150 s发一个字节请求 光电输入机每隔800 s发一个字节请求 则这5台设备要求通道的流量为 字节多路通道响应和处理各设备请求的时间示意图 通道处理机并不是独立的处理机 指令简单 存储容量较小 输入输出时CPU要承担大量的前处理和后处理等工作 用一般的通用机作外围处理机可使CPU摆脱I O操作的负担 外围处理机与主处理机异步并行工作 可有独立的内存 能自由选择通道和设备进行通信 非常灵活 能承担主机外围任务处理和操作控制 有利于整个系统的效率提高 外围处理机的硬件利用率低 成本比通道处理机高 4 3 2外围处理机 外围处理机子系统包括分时使用主存的10台PPU 通过输入输出交叉开关网络 I OCrossbarSwitching 共享12个输入输出通道 CH0 CH11 每个PPU有一个容量为4K 13位 其中一位为奇偶位 的局部存储器 系统监督程序常驻在PPU0的局存中 操作台显示程序常驻在PPU1的局存中 其余均装有各自的常驻程序 每台PPU都能独立执行有关PPU的程序 都有相同的指令系统 完成算术 逻辑运算 读 写主存 与外设交换信息等功能 用这些指令编制的PPU程序存放于系统主存的程序库中 可以为管理外部设备随时调用 图中DC为设备控制器 D为外围设备 中央处理机不能直接与外部设备交往 当用户程序需要输入输出时 中央处理机只需发调用PPU的请求 即可继续执行它的用户程序 像通道处理机方式中那种前处理工作就不用做了 其后由外围处理机就自己来与外部设备通信 所有10台PPU分时循环使用同一个算术 逻辑部件 每台PPU一次占用一个时间片 隔10个时间片之后又可再次占用一个时间片 因此 一条PPU指令可能要经过多个大循环周期才能完成 由于主存字长60位 PPU局存字长12位 它们之间交换信息时 需要采用桶形移位器的方法进行拆卸和装配 这种拆卸和装配所用的部件也是由10个PPU分时共享的 CYBER170的通道比较简单 和通道处理机中的通道概念完全不同 它只起通路连接作用 使外围处理机可以与12个通道中的任何一个相接 每个通道最多可接8台外部设备 用设备号来选择 在每个通道中有一个双向13位 1位奇偶位 的通道寄存器及 忙 闲 满 空 两个状态标志触发器 利用这两个状态标志触发器以及PPU执行相关的I O指令来控制PPU 通道与外设的通信 输入输出系统的发展方向 I O处理机功能的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版设备施工员试题及答案
- 2024年四川阿坝教师招聘考试模拟题及答案
- 2025年城市固体废弃物处理系统可行性研究报告及总结分析
- 2025年体育健身中心建设项目可行性研究报告及总结分析
- 2025年特色小镇建设与运营可行性研究报告及总结分析
- 2025年城市安全与应急管理系统项目可行性研究报告及总结分析
- 2025年智能化农机设备市场可行性研究报告及总结分析
- 2025年绿色出行推广模式研究可行性研究报告及总结分析
- 2025年游戏行业新商业模式研究可行性研究报告及总结分析
- 2025年区块链金融交易平台开发项目可行性研究报告及总结分析
- 墓地成本分析报告范文
- 《HTML5+CSS3网站设计基础教程(第3版)》ppt第5章 盒子模型
- 武松的主要事迹概括
- 光缆线路障碍点的定位
- 南瑞集团考试真题
- 小学数学结构化面试经典100题
- T、K、Y管节点焊缝超声波检验缺陷的判定
- ZJ70DB钻机绞车安装、操作及维护保养规程
- GB/T 34940.3-2017静态切换系统(STS)第3部分:确定性能的方法和试验要求
- GB/T 21198.5-2007贵金属合金首饰中贵金属含量的测定ICP光谱法第5部分:999‰银合金首饰银含量的测定差减法
- 现代优化算法-蚁群算法
评论
0/150
提交评论