（计算机应用技术专业论文）面向网络处理器的资源调度研究.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-22 格式：PDF 页数：107 大小：3.56MB 积分：0 举报 版权申诉

已阅读5页，还剩102页未读，继续免费阅读

（计算机应用技术专业论文）面向网络处理器的资源调度研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

西北工业大学硕士学位论文摘要摘要传统的网络设备大多采用基于g p p 或a s i c 的嵌入式处理器。随着网络流量的迅速增长和网络业务的日益多样，它们在性能或灵活性上已难以满足应用需要。在这种背景下，兼具高速处理能力和灵活编程能力的网络处理器 ( n p , n e t w o r k p r o c e s s o r ) 为下一代通信产品的设计提供了一种灵活的解决方案。目前，网络应用系统的设计越来越多地采用高速、灵活的网络处理器。网络处理器是典型的多r i s c 内核的并行实时处理结构，担负着数据包的处理和网络带宽管理等实时任务。在系统结构上， n p 一般由一个通用处理器和多个并行或流水的数据包处理引擎( p e , p r o c e s s i n g e n g i n e ) 组成，每个处理引擎内部支持多个线程. 如何在多个p e 上进行有效的资源分配和调度以提高系统吞吐量、降低数据包时延和应用程序开发时间、保证系统服务质量( q o s , q u a l i t y o f s e r v i c e ) 要求是当前网络处理器研究的一个热点问题。论文以8 6 3 计划 ( 国家高科技技术研究发展计划) 资助课题面向网络处理器结构的新型操作系统核心技术为基础，研究了网络处理器软件开发平台中有关资源调度的问题。主要涉及两个方面: 对于流水组织模式的网络处理器，其处理任务到各个p e的分配目前主要由手工完成，开发效率低且对开发人员素质要求较高，形成产品开发的瓶颈。为解决这一问题，本文首先提出一种任务到 p e的自动分配方法。给定划分好的应用任务集和处理流水线级数，应用该方法可以迅速得到近似最优的分配方案。网络服务形式的日益多样使得用户对于q o s 的要求越来越高。网络设备的功能由传统的存储一转发模式到存储一处理一转发模式的转换，使得 q o s 的保证不再仅仅限于网络带宽的分配，还要求处理资源按照q o s 的要求进行分配。因此，本文研究了链路调度和多 p e调度问题，给出有效的调度策略，保证调度会平、时延等特性。工么论文的硬件开发环境使用i n t e l i x p 2 4 0 0 网络处理器开发平台，开发板是 r a d i s y s 公司开发的e n p - 2 6 1 1 ，它是一个完整的可设计开发的设备，具有非常灵活的可编程性。软件开发平台包括基于x s c a l e 的开发工具链 ( l i n u x g n u ) 和微代码开发工具 ( i n t e l 为i x p 2 4 0 0 提供的d e v e l o p e r w o r k b e n c h ) 。关键词:网络处理器，处理引擎，服务质量，任务分配，遗传算法，链路调度，多p e 调度西北z业大学硕士学位论文摘要 ab s t r a c t i n c re a s i n g r e q u i r e m e n t s o f n e t w o r k r a t e s a n d s o p h i s t i c a t e d n e t w o r k i n g s e r v i c e s m a k e t h e t r a d i t i o n a l n e t w o r k i n g d e v i c e s b a s e d o n g p p o r a s i c a b o tt l e n e c k o f n e t w o r k i n g a p p l i c a t i o n s . a s a s o l u t i o n , n e t w o r k p ro c e s s o r ( n p ) , w h i c h h a s h i g h p r o c e s s i n g r a t e a n d f l e x i b l e p r o g r a m m i n g a b i l i t y , i s a d o p t e d in t h e d e s i g n o f n e t w o r k i n g a p p l i c a t i o n s y s t e m s m o r e a n d m o r e w i d e l y . n p g e n e r a l l y c o n s i s t s o f m u l t i p l e p a r a l l e l re a l - t i m e p ro c e s s i n g r i s c s , c a l l e d p r o c e s s i n g e n g i n e s ( p e s ) , e a c h o f w h i c h s u p p o r ts m u lt i p l e t h r e a d s . p e s a r e r e s p o n s i b l e f o r p a c k e t p r o c e s s i n g , n e t w o r k i n g b a n d w 记由m a n a g i n g , a n d s o o n . a f o c u s o f a tt e n t i o n i s h o w t o a l l o c a t e a n d s c h e d u l e r e s o u r c e s e ff e c t i v e l y t o i m p r o v e s y s t e m t h r o u g h p u t , r e d u c e p a c k e t d e l a y a n d d e v e l o p in g t im e , e n s u r e s y s t e m r e q u i r e m e n t o f q u a l i t y o f s e r v i c e ( q o s ) . t h i s p a p e r i s b a s e d o n t h e p r o j e c t n e t w o r k p r o c e s s o r a r c h i t e c t u re f a c e d n e w - t y p e o p e r a t i n g s y s t e m c o re t e c h n i q u e s p o n s o re d b y t h e n a t i o n a l h i g h - t e c h d e v e l o p m e n t p l a n ( 8 6 3 p l a n ) . t w o p ro b l e m s a r e a d d r e s s e d in t h e p 叩e r : . a p r o b l e m t h a t m u s t b e f a c e d w h e n d e s i g n i n g s y s t e m s b a s e d o n n p s i s h o w t o a s s i g n t h e p a c k e t - p r o c e s s i n g t a s k s t o t h e p r o c e s s o r p i p e l i n e s c o n s i s t i n g o f m a n y p r o c e s s i n g e n g in e s . n o w a d a y s , t h i s w o r k is d o n e m a n u a l l y , w h i c h i s e r r o r - p ro n e a n d in e f f i c i e n t . t o a l l e v i a t e t h i s , t h i s p a p e r p r o p o s e s a g e n e t i c a l g o r i t h m - b a s e d m e t h o d t o as s i g n p r o c e s s i n g t a s k s t o p r o c e s s i n g e n g i n e s a u t o m a t i c a l ly . . t h is p a p e r t h e n a d d re s s e s t h e p ro b l e m o f q o s s c h e d u l i n g o f p r o c e s s i n g r e s o u r c e s o n n p . w e f i r s t p r e s e n t a p a c k e t s c h e d u l i n g a l g o r i t h m s f q + b a s e d o n s f q a n d d wc s , w h i c h i m p r o v e s t h e f a i rn e s s s h a r i n g o f b a n d w i d t h . a s n e t w o r k p r o c e s s in g w o r k l o a d s a r e h i g h l y r e g u l a r a n d p re d i c t a b le , w e p r e s e n t a p r o c e s s o r s c h e d u l i n g a l g o r it h m c a l l e d f o r e c a s t i n g - b a s e d f a i r q u e u i n g ( f f q ) w h i c h u s e s t h e s e e s t i m a t e s a n d p r o v i d e s s i g n i f i c a n t l y b e tt e r d e l a y g u a r a n t e e s t h a n p r o c e s s o r s c h e d u l i n g a l g o r i t h m s w h i c h d o n o t t a k e p a c k e t e x e c u t i o n t i m e s i n t o c o n s i d e r a t i o n . r e s e a r c h e s a r e b a s e d o n t h e h a r d wa r e o f i n t e l i xp 2 4 0 0 . e x p e r i m e n t s o f th i s p a p e r a r e b a s e d o n t h e e v a l u a t io n b o a r d , e n p - 2 6 1 l , a p r o d u c t o f r a d i s y s c o r p o r a t i o n . s o ft w a r e i s l i n u x g n u t o o l wo r k b e n c h c h a i n s f o r xs c a l e a n d i n t e l k e y w o r d s : n e t w o r k p r o c e s s o r , p roc e s s i n g e n g i n e , q u a l it y o f s e r v i c e , t as k a l l o c a t i o n , g e n e r i c a l g o r i t h m , l i n k s c h e d u l i n g , m u l t i - p e s c h e d u l i n g 西北工业大学硕士学位论文前言月 u舌随着网络规模和接口速度的不断增加，基于通用 r i s c技术的网络设备无法在性能上满足线速处理要求; 另一方面新的网络通信协议、标准不断出现或变化，用户的需求也在不断变化之中，使得数据通信产品的更新换代周期迅速缩短。在这种背景下，兼具高速处理能力和灵活编程能力的网络处理器 n p ( n e t w o r k p r o c e s s o r )为下一代通信产品的设计提供了一种灵活的解决方案。网络处理器是一种专用于网络通信设备的通用芯片，是一种开放式的、多样化的、可编程的开发环境，允许不同的设备供应商采用同样的芯片制造出各自不同功能和特色的网络设备。 n p综合了r i s c和a s i c的优点:既像r i s c 可以软件编程、提供足够的灵活性来适应数据通信市场高速的发展，又具有 a s i c 那样的高性能，但又不像a s i c 那样需要很长的开发周期。 n p 在兼顾r i s c 的灵活性和 a s i c的执行效率的同时，为第二层到第七层的多种应用提供良好支持。通过下载不同的程序，同样的硬件平台可以支持v l a n 交换机、路由器、宽带接入服务器、 n a t 、防火墙、 we b交换机等，支持各种速率的以太网、 a t m, p o s 等接口，升级非常方便。与此同时，围绕着n p应用展开的相关研究也得到了飞速的发展，一些企业和学校也给予了足够的重视。比如i n t e l 公司专门投资支持全球1 0 0 所大学进行 n p 及其相关应用的研究，并每年召开一次w o r k s h o p 进行交流与总结。华盛顿州立大学2 0 4 2 年专门召开了以网络处理器为主题的学术会议，并在网络处理器硬件体系结构和性能评价分析等方面作了深入的探讨。国家的“ 8 6 3 高新技术发展计划也将n p 的研发作为一个重要项目，研发自己的n p 软件开发平台具有重要意义。网络处理器是典型的多r i s c内核的并行实时处理结构，担负着数据包的处理和网络带宽管理等实时任务，其内部的组成一般由一个通用处理器和多个并行或流水的数据包处理引擎p e ( p r o c e s s i n g e n g i n e ) 组成，每个处理引擎内部支持多个线程。网络处理器的多 p e实时并行调度问题就是当一个待处理的数据包到达时交由哪一个p e 服务以及如何服务的问题。如何高效地调度一组并行/ 流水的p e 集合，目前是一个挑战性的研究课题，需要考虑包括系统负载和流量特性在内西北s业大学硕士学位论文前言的多种信息，同时追求不同数据流之间公平共享处理资源，并使处理资源利用率达到最大双重目标。目前网络处理器各 p e内的多线程调度基本上采用基于硬件的静态调度，由硬件仲裁器决定下一个可激活的线程:在此基础上，还需要研究多 p e调度算法及其软件实现机制，结合硬件线程静态调度，实现软硬件结合的n p资源优化管理。 n p 的应用模式一般分为三类: a ) 并行模式: 在多个p e 上执行相同的处理功能，一个包可以由其中任何一个p e 进行处理，需要研究的是如何将处理资源和桩路资源进行合理的分配，即多p e 调度和链路调度的问题; b ) 流水模式: 每个p e 完成一个功能模块，多个p e 共同完成总的处理任务，每个待处理的包必须经由每一个p e ，如何合理的将任务映射到p e 以达到最大包处理速度是一个关健问题; c ) 并行与流水混合模式: 根据任务的特性选择是流水还是并行，可以在某些阶段使用并行，而在另一些阶段使用流水。由于传统的分组处理系统仅执行存储转发的处理过程，仅涉及到链路调度器，因此己有一些带宽调度算法 ( 如p f q , p a c k e t f a i r q u e u i n g ) 可以用于链路调度器中。但由于带宽调度算法依赖于分组长度，分组使用带宽接口的时间很容易提前知道，可以计算出公平有效的调度方式，而一个任意指令集的处理时间难以提前确定。也就是说分组处理时间难以预测，导致己有的带宽调度算法难以用于处理器调度器中。目前的多p e 调度大部分采用f c f s ( fi r s t c o m e f i r s t s e r v e ) . t - o p t ( th r o u g h p u t - o p t i m a l ) 等算法，不能做到资源的优化管理，更不能对综合q o s 策略提供支持。因此，本文主要研究流水模式下的任务到 p e自动映射技术，并行模式下的多p e 实时调度技术和链路调度技术。本文所依托的课题为国家高科技技术发展计划 ( 8 6 3计划)支持的高新技术课题，其研发基于i n t e l i x p 2 4 0 0 网络处理器开发平台，开发板是r a d i s y s 公司开发的e n p - 2 6 1 1 ，它是一个完整的可设计开发的设备，具有非常灵活的可编程性。i n t e l i x p 2 4 0 0 网络处理器主要包括8 个完全可编程的4 线程微引擎和 1 个x s c a l e 内核。此外，还有用于连接外部ma c设备的ms f单元、连接西北工业大学硕士学位论文前言 s r a m的s r a m单元 ( 2 个)以及连接 s d r a m设备的s d r a m单元 ( i 个) 等等。这些单元通过内部高速的数据和控制总线彼此协作。软件开发平台包括基于 x s c a l e 的开发工具链 ( 如 t o r n a d o g n u, l i n u x g n u等) 和微代码开发工具 ( i n t e l 为i x p 2 4 0 0 提供的d e v e l o p e r w o r k b e n c h ) . 本文结构如下:第一章介绍网络处理器的基本状况，包括其产生、典型体系结构、编程环境、应用领域、研究现状和发展趋势等，重点介绍了 i x p 2 4 0 0 的体系结构和仿真环境。基于网络处理器多处理引擎的体系结构，第二章给出流水组织模式下任务自动分配的算法，试验结果证明该算法可以优化代码分配，提高系统吞吐量，降低开发难度，加速开发进程。对于网络处理器的并行应用模式，为保证系统q o s 方面的需求，第三章提出一种新的分组调度算法，这种算法基于己有的s f q和d w c s 算法，考虑网络处理器特殊体系结构，综合两种算法，在保证系统公平性和时延的同时，降低了系统的丢包率。第四章针对研究较少的处理资源调度，提出一种多 p e调度算法。该算法根据常规网络处理程序的特性: 处理时间与包的长度呈线性关系，根据预测时间来调度p e ，试验证明该算法性能很好。最后一章对全文进行总结。西北工业大学硕士学位论文网络处理器研究与发展第一章网络处理器研究与发展网络设备的基本功能是实现网络通信业务流的控制和转发，处于网络边缘的设备需要将来自不同物理链路的各种业务流复用到统一的传输链路上，传统的方法是在网络边缘设备上采用通用的处理器来完成协议栈处理、路由选择以及包头的剥离等功能。随着传输线速率的增加，通用处理器无法维持和传输速率一样的处理速度，于是用专用芯片完成包的处理成为一种趋势。利用专用集成电路( a s i c ) 来完成特定包的处理工作，性能得到很大的改善，但是a s i c 缺乏灵活性，给网络设备的升级和功能扩展改进带来很大麻烦。随着传输线速率的高速增长和高层协议处理复杂度的日益增加，以及各种网络应用需求的灵活多变，高速和灵活地完成各种协议层上包处理显得更为迫切，而微电子集成技术的进步则为这种要求提供了坚实的物理基础，网络处理器就是在这样的背景下诞生的，它同时具有 r i s c的灵活性和a s i c的高速处理的能力。 1 . 1 网络处理器典型体系结构在 1 9 9 9 年初，网络处理器刚兴起时，市场主要被一些新兴的小公司占领，如c - p o r t , a g e r e , s it e r a , e z c h ip 等，它们的产品基本都定位在网络处理器或其它专用通信芯片上， 1 9 9 9 年9 月i n t e l 和i b m公司宣布正式进入网络处理器市场，标志着网络处理器从此在半导体设备市场真正拥有一席之地。国内目前只有少数几家领先的通信设备制造商如中兴微电子、华为技术等自主开展了网络处理器的研制项目，可以预见的是在不远的将来，网络处理器必将成为i c设计尤其是片上系统( s o c : s y s t e m o n c h ip ) 设计领域的研究热点。目前已面市的主流网络处理器产品一般都能达到o c - 4 8 ( 2 . 5 g b p s )的处理能力，且很快将升级到o c - 1 9 2 ( 1 0 0 b p s )的水平: 支持在第二、三、四层上的线速数据处理; 支持各种q o s 应用如d i ff s e r v , r e d , m p l s 等; 基于硬件的队列管理、调度机制: 可通过专用汇编语言编程甚至支持高级语言c + + 语言编程如 m o t o r o la c - 5 系列; 将交换单元、 m a c单元与网络处理器单元集成到一块芯片提高处理速率也是进一步发展的趋势，而a m c c n p 3 4 0 0 己经做到了这一点。作为世界上最大的微处理器厂商， i n t e l 在处理器领域有着无与伦比的技术优势和丰厚的技术积累。 i x p 2 4 0 0 网络处理器是i n t e l 公司推出的广泛应用于网络、西北工业大学硕士学位论文网络处理器研究与发展第一章网络处理器研究与发展网络设备的基本功能是实现网络通信业务流的控制和转发，处于网络边缘的设备需要将来自不同物理链路的各种业务流复用到统一的传输链路上，传统的方法是在网络边缘设备上采用通用的处理器来完成协议栈处理、路由选择以及包头的剥离等功能。随着传输线速率的增加，通用处理器无法维持和传输速率一样的处理速度，于是用专用芯片完成包的处理成为一种趋势。利用专用集成电路( a s i c ) 来完成特定包的处理工作，性能得到很大的改善，但是a s i c 缺乏灵活性，给网络设备的升级和功能扩展改进带来很大麻烦。随着传输线速率的高速增长和高层协议处理复杂度的日益增加，以及各种网络应用需求的灵活多变，高速和灵活地完成各种协议层上包处理显得更为迫切，而微电子集成技术的进步则为这种要求提供了坚实的物理基础，网络处理器就是在这样的背景下诞生的，它同时具有 r i s c的灵活性和a s i c的高速处理的能力。 1 . 1 网络处理器典型体系结构在 1 9 9 9 年初，网络处理器刚兴起时，市场主要被一些新兴的小公司占领，如c - p o r t , a g e r e , s it e r a , e z c h ip 等，它们的产品基本都定位在网络处理器或其它专用通信芯片上， 1 9 9 9 年9 月i n t e l 和i b m公司宣布正式进入网络处理器市场，标志着网络处理器从此在半导体设备市场真正拥有一席之地。国内目前只有少数几家领先的通信设备制造商如中兴微电子、华为技术等自主开展了网络处理器的研制项目，可以预见的是在不远的将来，网络处理器必将成为i c设计尤其是片上系统( s o c : s y s t e m o n c h ip ) 设计领域的研究热点。目前已面市的主流网络处理器产品一般都能达到o c - 4 8 ( 2 . 5 g b p s )的处理能力，且很快将升级到o c - 1 9 2 ( 1 0 0 b p s )的水平: 支持在第二、三、四层上的线速数据处理; 支持各种q o s 应用如d i ff s e r v , r e d , m p l s 等; 基于硬件的队列管理、调度机制: 可通过专用汇编语言编程甚至支持高级语言c + + 语言编程如 m o t o r o la c - 5 系列; 将交换单元、 m a c单元与网络处理器单元集成到一块芯片提高处理速率也是进一步发展的趋势，而a m c c n p 3 4 0 0 己经做到了这一点。作为世界上最大的微处理器厂商， i n t e l 在处理器领域有着无与伦比的技术优势和丰厚的技术积累。 i x p 2 4 0 0 网络处理器是i n t e l 公司推出的广泛应用于网络、西北工业大学硕士学位论文网络处理器研究与发展通信和其他数据传输终端的一种高度集成的网络设备，采用并行处理器结构实现了数据的线速转发。现己经被公司、高校和研究机构广泛使用和研究。 1 . 1 . 1 i n t e l i x p 2 4 0 0 体系结构 i x p 2 4 0 0 是i n t e l 公司继i x p i 2 0 0 之后推出的又一个基于i x a ( i n t e l e x c h a n g e a r c h i t e c t u r e ) 体系结构的网络处理器。它支持2 . 5 g b p s 应用，具有8 个6 0 0 m h z 的微引擎、 6 0 0 m h z 的处理核心x s c a l e ，可外接i 块d d r d r a m和2 块q d r s r a m，支持标准的ms f 接口标准s p i - 3 或c s i x - l i 。微引擎的处理能力适用于数据包转发等功能，8 个微引擎能够在每秒钟转发3 层数据包3 百万个。 x s c a l e 处理器可用于处理更加复杂的任务，如地址学习建立和维护转发表以及网络管理等。 me d i a s wi t c h f a b r i c ( ms f ) s 凡4 m co n t r o l l e r 0 dr am co n t rol l e r 俩固国 c ij o n 国 a me c l u s t e r 0 m e0 x 1 1m e0 x 10m e0 x 0m ed x l m e0 x 13med x 1 2m e0 x 3m e0 x 2 i n t e i la xs c a l e t m c0r e 图 1 . 1 i x p 2 4 0 0 体系结构图 i x p 2 4 0 0 网络处理器是一个高度集成的综合数据处理器。它提供高性能并行处理能力，具有各种层次的可扩展性。它结合x s c a l e 微处理器以及8 个独立的 3 2位 r i s c数据包转发微引擎，加上硬件的多线程支持可达到每秒 5 .4 g次操作。它支持各种各样的w a n和l a n应用。通过改进微引擎的系统结构达到高性能和可扩展性，这些改进包括多线程的分配和使软件具有流水特性的高速缓存系统结构。 i x p 2 4 0 0 包含8 个可编程的3 2 位r i s c处理器、称为微引擎 1 1 ，专用于网络通信处理。每个微引擎可执行4 个线程，有4 个程序计数器能在一个时钟周期完成a l u和移位操作。微引擎的指令集是专门为网络和通信应用设计的能快速有西北工业大学硕士学位论文网络处理器研究与发展通信和其他数据传输终端的一种高度集成的网络设备，采用并行处理器结构实现了数据的线速转发。现己经被公司、高校和研究机构广泛使用和研究。 1 . 1 . 1 i n t e l i x p 2 4 0 0 体系结构 i x p 2 4 0 0 是i n t e l 公司继i x p i 2 0 0 之后推出的又一个基于i x a ( i n t e l e x c h a n g e a r c h i t e c t u r e ) 体系结构的网络处理器。它支持2 . 5 g b p s 应用，具有8 个6 0 0 m h z 的微引擎、 6 0 0 m h z 的处理核心x s c a l e ，可外接i 块d d r d r a m和2 块q d r s r a m，支持标准的ms f 接口标准s p i - 3 或c s i x - l i 。微引擎的处理能力适用于数据包转发等功能，8 个微引擎能够在每秒钟转发3 层数据包3 百万个。 x s c a l e 处理器可用于处理更加复杂的任务，如地址学习建立和维护转发表以及网络管理等。 me d i a s wi t c h f a b r i c ( ms f ) s 凡4 m co n t r o l l e r 0 dr am co n t rol l e r 俩固国 c ij o n 国 a me c l u s t e r 0 m e0 x 1 1m e0 x 10m e0 x 0m ed x l m e0 x 13med x 1 2m e0 x 3m e0 x 2 i n t e i la xs c a l e t m c0r e 图 1 . 1 i x p 2 4 0 0 体系结构图 i x p 2 4 0 0 网络处理器是一个高度集成的综合数据处理器。它提供高性能并行处理能力，具有各种层次的可扩展性。它结合x s c a l e 微处理器以及8 个独立的 3 2位 r i s c数据包转发微引擎，加上硬件的多线程支持可达到每秒 5 .4 g次操作。它支持各种各样的w a n和l a n应用。通过改进微引擎的系统结构达到高性能和可扩展性，这些改进包括多线程的分配和使软件具有流水特性的高速缓存系统结构。 i x p 2 4 0 0 包含8 个可编程的3 2 位r i s c处理器、称为微引擎 1 1 ，专用于网络通信处理。每个微引擎可执行4 个线程，有4 个程序计数器能在一个时钟周期完成a l u和移位操作。微引擎的指令集是专门为网络和通信应用设计的能快速有西北工业大学硕士学位论文网络处理器研究与发展效地转发数据包数据类型，有位、字节和长字。微引擎中采用一种硬件多线程的特征，线程的切换没有时间开销。每个微引擎具有4 个程序计数器，分别用于4 个线程。每个线程有自己的线程标识，使得对于访存的结果能够直接返回给请求的线程。在微引擎中的一个线程发出访存请求时，这个线程把自己切换出去使得其他线程得到运行，等到存储器返回结果时再切换到该线程。线程的切换不是采用中断机制，而是在微指令的控制下进行。这种线程切换机制可以充分利用访存间隙，提高微引擎的利用率和吞吐率。 1 . i .2结构特征 . 多处理器: 八个微引擎，加上x s c a l e 弥补了1 x p 2 4 0 0 的计算资源。他们共享了一系列的资源:s d r a m , s r a m , m s f , 1 x b u s , s c r a t c h p a d r a m ，和一些其它的功能. 0 分布式的数据存储结构: 每个徽引擎都有可编程的4 x 指令存储区、 2 “个通用寄存器、5 1 2 个传输寄存器、1 2 8 个邻居寄存器及6 4 0 个3 2 h i t 的本地存储器. 微引擎有一个下载一存储结构. 一个微引擎不能够访问位于它外部的数据。它必须把这些数据放入它的传输寄存器，对该数据进行操作，然后将数据写回位于传输寄存器外部的目的地址( 例如dr a m ) . 一旦数据位于传精寄存器后，一个微引李有一个周期的时间访问，这大大的提高了它的处理能力。如果数据没有在传愉寄存器中，微引擎可以发出一条引用命令来取得所需要的数据，然后 “ 进入睡眠” ，等待所需数据的到来。这时候硬件的多线程开始工作. . 硬件多线程: 每个橄引擎实际上有四个程序计数器，设计成可以支持四个线程( 称为上下丈。当其中一个线程等待数据的时候，它可以 “ 入睡”并且允许其它在同一微引擎上的线程运行。这样的话，就可以在一个徽引擎上运行四个线程，以一种更为有效的方式使用微引李的计算资源. 这样的方式也获得了更好的芯片利用率，比实现更多的橄引擎，但是没有多线程的方法的消耗更低。在无多线程的设计中，微引擎在等持数据的时间内仅仅是等待. i x p 2 4 0 0 的多线程是硬件中实现的，但是由软件拉制. 硬件中实现多线程使上下文切换的零消耗成为可能， . 动态的内存优化: d r a m 和s r a m 单元有一些队列和优化. 这九许八个微引擎( 实际上的3 2 个微引擎线程) 和x s c a l 。从内存单元请求读或者写，并且内存单元可以智能的决定执行这些请求的优化的顺序控制的在指令基础上的动态的内存优化。通过这些，实现了在硬件级别，并由软件西北工业大学硕士学位论文网络处理器研究与发展效地转发数据包数据类型，有位、字节和长字。微引擎中采用一种硬件多线程的特征，线程的切换没有时间开销。每个微引擎具有4 个程序计数器，分别用于4 个线程。每个线程有自己的线程标识，使得对于访存的结果能够直接返回给请求的线程。在微引擎中的一个线程发出访存请求时，这个线程把自己切换出去使得其他线程得到运行，等到存储器返回结果时再切换到该线程。线程的切换不是采用中断机制，而是在微指令的控制下进行。这种线程切换机制可以充分利用访存间隙，提高微引擎的利用率和吞吐率。 1 . i .2结构特征 . 多处理器: 八个微引擎，加上x s c a l e 弥补了1 x p 2 4 0 0 的计算资源。他们共享了一系列的资源:s d r a m , s r a m , m s f , 1 x b u s , s c r a t c h p a d r a m ，和一些其它的功能. 0 分布式的数据存储结构: 每个徽引擎都有可编程的4 x 指令存储区、 2 “个通用寄存器、5 1 2 个传输寄存器、1 2 8 个邻居寄存器及6 4 0 个3 2 h i t 的本地存储器. 微引擎有一个下载一存储结构. 一个微引擎不能够访问位于它外部的数据。它必须把这些数据放入它的传输寄存器，对该数据进行操作，然后将数据写回位于传输寄存器外部的目的地址( 例如dr a m ) . 一旦数据位于传精寄存器后，一个微引李有一个周期的时间访问，这大大的提高了它的处理能力。如果数据没有在传愉寄存器中，微引擎可以发出一条引用命令来取得所需要的数据，然后 “ 进入睡眠” ，等待所需数据的到来。这时候硬件的多线程开始工作. . 硬件多线程: 每个橄引擎实际上有四个程序计数器，设计成可以支持四个线程( 称为上下丈。当其中一个线程等待数据的时候，它可以 “ 入睡”并且允许其它在同一微引擎上的线程运行。这样的话，就可以在一个徽引擎上运行四个线程，以一种更为有效的方式使用微引李的计算资源. 这样的方式也获得了更好的芯片利用率，比实现更多的橄引擎，但是没有多线程的方法的消耗更低。在无多线程的设计中，微引擎在等持数据的时间内仅仅是等待. i x p 2 4 0 0 的多线程是硬件中实现的，但是由软件拉制. 硬件中实现多线程使上下文切换的零消耗成为可能， . 动态的内存优化: d r a m 和s r a m 单元有一些队列和优化. 这九许八个微引擎( 实际上的3 2 个微引擎线程) 和x s c a l 。从内存单元请求读或者写，并且内存单元可以智能的决定执行这些请求的优化的顺序控制的在指令基础上的动态的内存优化。通过这些，实现了在硬件级别，并由软件西北工业大学硕士学位论文网络处理器研究与发展 . 并发:i x p 2 4 0 0 内部的几个相互独立的数据和控制总线可以使数据同时被移动: 岔s d r a m 毕元和澎引翁成者i x b u s 翼元之阿伺时岔两价才冲，梦 11 写夕，注 s r a m 毕元和澎影裁之 1 1 7 c 伺时左两产方! 7 ;涝和写夕 : 注s d r a m 毕元和 p c i 毕元之m r , 岔i x b u s脚御引攀之凤所有以上的各条都可以同时而且互相独立的发生。在软件拉制下但是在硬件的基础上实现，所以程序员不用考虑细节问题. . 块传输: 每个微引擎上都有大寄存器，这样的话一个指今就可以使6 4 字节的数据从一个功能单元到另一个功能单元，或者 1 2 8 字节的数据通过 i x b u s 。这样就更好的利用了微引擎的计算资源，同时也减小了代码规模. . 可扩展性:工 x p 2 4 0 0结构在不同的层次上实现了可扩展性.首先，这样的结构使 i x p 2 4 0 。系列的成员可以增加额外的微引擎，同时仍保持同样的编程模型. 其次， u p 特性网络处理器可以在徽引擎内增加指令的存储. 第三，多个i x p 2 4 0 。可以简单的设计连接在一起，提高处理能力和带宽. 1 . 1 . 3 i x p 2 4 0 0 功能模块图1 . 1 显示了i x p 2 4 0 0 主要功能单元的简化块状图，这些功能单元在下面给出简要的描述。 . x s c a l e 核心: 完全的3 2 b i t r i s c处理器，具有高性能、低功耗和紧凑设计等特点，适用于与其它专用的可执行单元集成在同一个芯片中。它带有综合的缓存，可以用来实现管理功能，运行路由协议，例外处理和其他的功能。 . 八个微引擎: 如图1 .2 容的探测，数据处理，器组的完全可编程3 2 快速的上下文切换。所示，这些高效的r i s c引擎可以用于任何要求快速的包内或数据传输的任务。他们是具有5 级执行流水的一个大寄存位引擎。硬件多线程，和上下文敏感的寄存器窗口可以进行 . s d r a m单元: 一个共享的，智能存储器接口，可以由x s c a l e 核心 s d r a m和微引擎或者i x b u s 单元间，，微引擎不 1 1 p c i 总线上的设备接入。可以在数据块。 p c i 总线间移动西北工业大学硕士学位论文网络处理器研究与发展 . 并发:i x p 2 4 0 0 内部的几个相互独立的数据和控制总线可以使数据同时被移动: 岔s d r a m 毕元和澎引翁成者i x b u s 翼元之阿伺时岔两价才冲，梦 11 写夕，注 s r a m 毕元和澎影裁之 1 1 7 c 伺时左两产方! 7 ;涝和写夕 : 注s d r a m 毕元和 p c i 毕元之m r , 岔i x b u s脚御引攀之凤所有以上的各条都可以同时而且互相独立的发生。在软件拉制下但是在硬件的基础上实现，所以程序员不用考虑细节问题. . 块传输: 每个微引擎上都有大寄存器，这样的话一个指今就可以使6 4 字节的数据从一个功能单元到另一个功能单元，或者 1 2 8 字节的数据通过 i x b u s 。这样就更好的利用了微引擎的计算资源，同时也减小了代码规模. . 可扩展性:工 x p 2 4 0 0结构在不同的层次上实现了可扩展性.首先，这样的结构使 i x p 2 4 0 。系列的成员可以增加额外的微引擎，同时仍保持同样的编程模型. 其次， u p 特性网络处理器可以在徽引擎内增加指令的存储. 第三，多个i x p 2 4 0 。可以简单的设计连接在一起，提高处理能力和带宽. 1 . 1 . 3 i x p 2 4 0 0 功能模块图1 . 1 显示了i x p 2 4 0 0 主要功能单元的简化块状图，这些功能单元在下面给出简要的描述。 . x s c a l e 核心: 完全的3 2 b i t r i s c处理器，具有高性能、低功耗和紧凑设计等特点，适用于与其它专用的可执行单元集成在同一个芯片中。它带有综合的缓存，可以用来实现管理功能，运行路由协议，例外处理和其他的功

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）面向网络处理器的资源调度研究.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）面向网络处理器的资源调度研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档