【大学】第二代网络系统ppt课件_第1页
【大学】第二代网络系统ppt课件_第2页
【大学】第二代网络系统ppt课件_第3页
【大学】第二代网络系统ppt课件_第4页
【大学】第二代网络系统ppt课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二部分 第二代网络系统主要内容p用于协议处置的硬件体系构造p分类和转发p交换构造1. 传统的软件路由器p第一个网络设备是分组交换机,运用的是小型机。p第一个商用的IP路由器是软件路由器,运用常规的计算机硬件:p由通用途置器、共享内存、共享总线、假设干个网卡组成p通用途置器执行大部分的协议处置义务,网卡完成组帧及地址识别p适用于低速系统,本钱低。2. 路由器的速度p路由器的处置速度决议了:p可以衔接到路由器上的网络的最大速率p路由器可以支持的最大网络接口数p集合速率和端口速率:p集合速率:数据进入或分开一个网络系统的总速率,是系统处置才干的测度。p端口速率:在一个网络接口上数据进入或分开的速度

2、。p数据速率和包速率:p数据速率:单位为比特/秒。p包速率:单位为包/秒pps,取决于网络的吞吐量和包的长度。不同网络中的包速 注:灰色条块代表大数据包的速率一个包的最大处置时间注:以上仅是一个网络接口的数据,假设有N个端口,那么每个包的处置 时间还要除以N。一个软件系统可以支持多大的包速?p处置一个数据包的时间包括:p中断处置p将包拷入内存p包的协议处置:取决于包的内容如运用的协议p一个典型的运转Linux内核的PC机,每秒最多可以处置50000个IP包每个数据报只做最少的处置。p假设数据包要经过防火墙软件处置,那么每秒种最多处置8000个包。软件路由器的才干p思索两个10Base-T的以太

3、网。每个网络的最大包速是19500pps,每个包的处置时间不超越25.6微秒,处置每个包的指令数普通在500010000条之内。因此,CPU的执行速度必需在195Mips390Mips之间。p许多商用的CPU可以有超越400Mips的执行速度,因此软件路由器可以衔接大约两个10Mbps以太网。p思索一个10Gbps的网络,每微秒产生大约20个数据包,CPU每秒钟必需执行21011 条指令。p结论:运转在通用途置器上的软件无法应对高速网络。3. 抑制单CPU瓶颈p细粒度并行指令级并行p对称粗粒度并行对称多处置器p非对称粗粒度并行非对称多处置器p公用协处置器p智能NICp数据流水线3.1 细粒度并

4、行指令级并行p目前几乎一切的处置器均采用了指令流水线来重叠指令的执行,但数据包处置程序中可以利用的指令重叠很少。p利用程序中的循环级并行,如采用向量指令。向量指令可以同时操作在一组数据单元上,比如进展检查和计算时,对内存中延续8个位置的数值同时相加。但数据包处置程序中可以利用的循环级并行很少。p细粒度并行对包处置来说优势不明显p包处置功能很少能被细粒度优化的p程序必需花时间建立并行指令p细粒度并行仅能改善CPU性能,而多数情况下访存或I/O是瓶颈3.2 对称粗粒度并行SMPp在一个计算机上聚集一组一样的CPU,系统资源被一切CPU共享,任务负载被均匀分配到一切可用的CPU上。p典型的设计:每个

5、CPU处置一个包,或者每个CPU执行一个协议。p运用N个处置器的网络系统获得的性能增益不是单处置器系统的N倍:p大多数多处置器系统运用一个共享内存p包处置软件必需协调对共享数据构造如队列的访问p只能添加处置才干,不能自动添加I/O带宽。3.3 非对称粗粒度并行p运用多个可并行执行的异构处置器,每个处置器针对一种义务而优化,运用特殊的指令集。p非对称多处置器的缺陷:p每一个处置器都要有本人的指令p比对称系统难以编程p需求协调对共享数据构造的访问p通用性差,不适用于其它义务或协议p本钱很高3.4 公用协处置器p运用一个通用CPU加上一个或多个公用协处置器构成网络系统。p协处置器是在CPU控制下运转

6、的一个硬件:p灵敏的设计自在度:协处置器可以设计得很复杂,也可以设计得很简单p不要求独立运转,没有通用指令,也没有取指令-执行周期p可以像软件例程一样被调用p可以被异步伐用,从而允许系统同时处置多个包或对同一个包执行多个独立的操作 p普通将耗费CPU时间最多或最频繁执行的操作如检查和计算,加/解密等用公用协处置器实现。p协处置器通常采用ASIC技术实现,ASICApplication Specific Integrated Circuit是指为某种特殊需求而定制的集成电路。3.5 智能NICp可以将一部分处置转移到网卡上:p地址识别和过滤,包缓存,DMA,操作链p验证IP头校验,从IP头中抽取

7、某些域,执行加密或紧缩等 p在网卡上添加处置的优点:p减轻CPU的负担p不要求NIC有很高的处置速度p运用ASIC硬件实现智能NIC:p设计公用芯片,集成到网卡上,如链路层芯片组、第3层ASIC芯片等p速度快p运用嵌入式RISC硬件实现智能NIC:p运用规范的RISC处置器替代定制硬件p代价低,易于修正,允许将更多的处置功能转移到NIC上TCP Offload EngineTOE pTOE将处置TCP/IP的许多开销从主机转移到网卡,只将TCP/IP控制保管在主机上。 3.6 数据流水线p由一系列硬件stage组成的硬件体系构造,数据包经过每一级时被执行一种操作。p优点:p适宜于多种协议处置义

8、务p每一级可以做得很简单,运转得很快p一切级可以同时运转4. 总结p传统的基于软件的网络系统曾经不能顺应高速网络的需求p高速网络系统需求特殊的硬件支持p能够的硬件体系构造包括:p多处置器系统pASIC协处置器p智能NICp数据流水线主要内容p用于协议处置的硬件体系构造p分类和转发p交换构造1. 解多路复用的局限性p解多路复用:p与分层协议一同运用,数据包穿过协议栈时每次前进一层。p在输出端,包头中的类型域指明封装的格式。p在输入端,每一层上的软件选择高一层上的一个协议模块。p特点:p运用全局类型系统,发送方参与,逐层执行。p优点:p传输效率高:每一种协议的包头只需求包含本协议需求的域p灵敏定义

9、新的协议类型:每个协议独立地定义它的协议头,不同协议头中的域不共享 p缺陷:p逐层顺序执行使得实现上很低效2. 包分类p根本思想:一次性检查一切层次上的相关域,将包划分到相应的类也称流中。p举例:p从输入的以太帧流中分别出去往Web效力器的流量p描画该流量的规那么集:p以太帧的type域为0 x0800IPpIP头中的protocol域为6TCPpTCP段中的destination port域为80p从概念上说,分类器需求计算以上三个条件的逻辑“与3. 用软件实现分类p比较各级包头中的相关域,进展逻辑“与运算p比如:pIf(type=0 x0800)&(protocol=6)&(destina

10、tion port=80)p Declare the packet matches the classification;pElsep Declare the packet does not match; 优化软件实现方法p重新陈列条件测试的顺序,将可以过滤掉较多流量的测试排在前面;p比如,假设知95%的帧携带了IP包,92%的IP包携带了TCP段,85%的TCP段的目的端口号为80,那么:pIf(destination port=80) &(protocol=6) &(type=0 x0800)p Declare the packet matches the classification;p

11、Elsep Declare the packet does not match the classification; 4. 用硬件实现分类p建立公用的并行硬件,防止头域的顺序测试。p步骤p抽取多层报头中的相关域p将这些域衔接成一个多字节的值p与分类规那么中给出的常数进展比较p在前面的例子中,分类器将type、protocol和destination port三个域中的值衔接成一个5字节的值,然后与08 00 06 00 50进展比较。一个硬件分类器的例子包头长度不固定的处理方法p方法一:在并行测试中添加对长度域的检查,针对每一种能够的包头长度设计一组分类规那么。如在前面的例子中,假设IP头长

12、度有20字节和24字节两种,那么设计两组规那么:p Set 1Set2p 以太帧的type域为0 x0800 以太帧的type域为0 x0800p IP头中的头两个字节为0 x45 IP头中的头两个字节为0 x46p IP头中的protocol域为6 IP头中的protocol域为6p 距IP头22个字节处的域为80 距IP头24个字节处的域为80 p方法二:建立一个可以顺序计算报头偏移量的硬件,抽取当前协议头长度,并挪动相应的间隔到下一个协议头。5. 混合硬件/软件实现方法p硬件分类方法:代价高昂,灵敏性差p软件分类方法:灵敏性好,速度不高p混合硬件/软件方法:p结合硬件分类的高速度与软件分

13、类的灵敏性p包含硬件分类与软件分类两个阶段,硬件分类处置规范格式的包,软件分类处置异常的包一个混合分类器系统 留意:软件分类器可以运转在较低的速率6. 多规那么集分类与查找引擎p系统中通常定义了很多个流,分类器要将每个包分配到一个对应的流,为此需求查找一切的规那么集。p普通做法:p分类器从包中抽取出相关域的值p经过一个查找引擎去查找分类规那么表p查找引擎的实现:p算法:曾经提出了很多种优化的包分类算法,可以并行地检查一切的规那么集。p内容可寻址存储器CAM:目前绝大多数的查找引擎是基于CAM实现的。Content Addressable Memoryp一种支持快速查找的特殊存储器,与普通存储器

14、的实现机制完全不同。p查找操作:p在CAM中输入查找关键字pCAM将查找关键字与其存储的一切表项匹配p前往匹配表项的地址p有两种类型的CAM:pBCAMBinary CAM:存储位有0、1两种形状,准确匹配查找,普通用于低层运用。pTCAMTernary CAM:存储位有0、1和不确定三种形状,支持通配符查找,常用于协议栈的高层,运用最为广泛。CAM续p优点:p查找速度快,最快在一个时钟周期内完成查找关键字的匹配p可以经过级联多个CAM添加容量p具有自动更新才干,可以更新查找表p缺陷:p价钱昂贵,封装面积大,功耗太大,容量有限p普通来说,以下运用适宜采用CAM:p识别大比特方式p处置小规模的查

15、找表p对查找延时有严厉要求7. 静态分类与动态分类p静态分类p流的集合及每个流的分类规那么事先知p主要用于根据效力类型或运用来隔离不同的流p动态分类p流的集合随时间而变,允许创建和改动流p动态分类通常运用地址和包类型来区分流p灵敏性好,允许细粒度的流控制p开销大,需求保管形状信息p动态分类器应能自动建立和维护流描画表,并进展分类查找。通常用软件实现,形状信息保管在内存中。8. 分类与转发p转发的义务是根据接纳到的数据包确定包的处置方法,比如根据数据包的目的地址将包转发到适宜的下一跳节点。 p可以将以上义务分成两步来做:p分类:将输入数据包映射到一个流包-流p转发:根据流确定包的处置方法流-包的

16、处置用分类优化无衔接网络中的转发p将无衔接转发划分成两个过程:p分类:destination address-flow IDp转发:flow ID-(next_hop, interface)p引入分类的益处:p可以将转发信息放在一个路由cache中,用流标识进展查找。p可用0, N中的整数作为流标识F,并用F作为路由cache的索引。p路由cache比路由表小很多,而且采用索引查找,查找速度快。p高速转发的过程:p分类器将数据包映射为一个流标识Fp转发器运用F作为索引查找路由cache。p分类和索引的全过程比传统的解多路复用和查表快得多。9. 第二代网络系统p运用专门的协议处置硬件,为更高速度

17、的网络而设计的网络系统。p第二代网络系统具有以下三个显著的特点:p运用分类替代解多路复用途置大部分的包p将包处置功能分散到各个网络接口,每个NIC都有分类和转发的才干p提供高速内部互连机制,在各个网络接口间提供快速数据通道p以上三个特点都允许系统扩展,即允许提高每个端口的数据速率,允许系统支持更多的网络衔接。第二代网络系统的概念组织p运用一个常规CPU,用于管理和控制系统、向系统管理员提供管理接口、运转路由协议和更新路由表、处置异常和错误。p网络接口运用路由表转发包p快速数据通道衔接各个网络接口一个典型的NIC的组成p物理芯片组:组帧p嵌入式RISC处置器:实现分类和转发pROM:存放软件、分

18、类规那么集等pRAM:卡上包缓存p总线接口主要内容p用于协议处置的硬件体系构造p分类和转发p交换构造1. 内部数据通路p常规计算机中的总线不能提供足够的带宽处置高速网络之间的包转发。p数据通路的速度通常用集合数据速率和集合包速来衡量。p系统的集合数据速率及集合包速对内部互连机制也称背板的要求:必需有足够的带宽传输进入系统的一切包。2. 交换构造的概念p从概念上说,交换构造是一种承当背板义务的硬件机制,它在一组输入端口、输出端口和CPU之间提供数据通路。 交换构造的概念续p用于网络系统的交换构造需求优化以下特性:p可提供在CPU和智能I/O端口之间的衔接p支持单播、多播和广播包的传输p可扩展支持

19、恣意的数据速率p可扩展支持恣意的包速率p可扩展支持恣意数目的输入或输出端口p低开销p低代价p实践的交换构造是对以上各种特性的权衡3. 交换构造的分类p同步构造与异步构造p同步构造:交换构造按固定的时间间隔传输固定长度的数据块,最早用于交换机中。p异步构造:交换构造可以在任何时辰传输数据,最早用于通用多处置器系统中。p大多数网络交换构造是同步的,每个包被划分成固定大小的块,按固定的时间间隔传输。 p空分构造与时分构造p空分构造:交换构造中运用许多通路以减小延迟,集合吞吐量高,代价高。p时分构造:许多端口共享一条或者很少几条内部通路,集合吞吐量低,代价低。空分交换构造公用内部通路p每一对输入、输出

20、端口之间有一条公用硬件通路p每个输出接口都包含了附加的电路用于处置端口竞争 空分交换构造- Crossbar构造p运用NM 个交叉开关衔接输入与输出端口p控制器硬件处置端口竞争p控制器允许多个端口之间并行传输p优点:p允许同时建立多条途径,集合吞吐率高p途径上的硬件只需求包容一条数据传输,易于支持更高的端口速度。 p比全衔接构造经济 p缺陷:p要求NM个部件,代价要比其它的一些设计高。 空分交换构造根本队列p输入队列p设置在输入端口与交换构造之间p队头阻塞问题p将输入队列改为随机访问列表,或者p为每个输出端口设置一个队列p通常在每个输入端口上设置两个队列,分别存放单播包和多播包p输出队列p设置

21、在交换构造与输出端口之间p只运用输入队列p队头阻塞p只运用输出队列p输出队列及交换构造必需运转在集合速率上,或者p针对每个输入端口设置一个队列有输入输出队列的Crossbar构造时分交换构造共享总线构造p交换构造总线包括地址线、数据线和控制线p每个输入和输出端口都有一个接口硬件,每个端口被分配一个独一的地址。p端口运用总线硬件将数据包传输到另一个端口p总线协议防止多个端口同时传输总线操作的粒度p包粒度:p端口一次发送一个完好的包p操作和硬件均简单,但添加了包的延迟 p数据块粒度:p包被划分成较小的数据块,每个发送端每次发送一个数据块;p防止了长延迟,多个传输可以并行进展;但添加了从一个发送者切

22、换到另一个发送者的开销 p信元粒度:p传输长度等于网络数据单元的长度;p类似于数据块粒度,但特别针对特殊协议而优化了总线协议p普通采用时分多路复用的方法,将运用总线的时间片分配给各个输入端口。p各个输入端口在总线上轮番广播收到的包;每个输出端口的地址过滤器检查包中携带的内部路由标签,将发往本端口的包存放到相应的缓冲区中。共享总线构造的可扩展性p总线及接口硬件必需操作在集合速率上。p受底层硬件技术的制约,该构造普通不能简单地扩展以顺应恣意数目的端口。时分交换构造共享存储构造p运用内存作为共享媒体衔接输入和输出端口。p每个端口需求一个内存接口硬件,将端口衔接到存储系统。p运用一个控制器硬件在端口之间传输控制信息。传输控制p一个控制器提供一条单独的高速总线,各个端口运用总线来协调各自的行为。p输入端口将一个包放入内存后,接口硬件经过控制器发送一个音讯,通知输出端口数据预备好,音讯中给出包在内存中的存放地址。p输出端口从控制器收到音讯后,从内存的指定位置读取包,然后发回呼应音讯。p控制器只是用来传输短的控制音讯,不用于传输大量的数据包。共享存储构造的可扩展性p由于内存接口硬件非常昂贵,通常让许多端口共享一个内存接口。共享存储接口在降低代价

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论