(计算机科学与技术专业论文)低功耗tlb设计关键技术研究.pdf_第1页
(计算机科学与技术专业论文)低功耗tlb设计关键技术研究.pdf_第2页
(计算机科学与技术专业论文)低功耗tlb设计关键技术研究.pdf_第3页
(计算机科学与技术专业论文)低功耗tlb设计关键技术研究.pdf_第4页
(计算机科学与技术专业论文)低功耗tlb设计关键技术研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(计算机科学与技术专业论文)低功耗tlb设计关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术大学研究生院学位论文 a b s t r a c t a l o n gw i t ht h ee x t e n s i v ea p p l i c a t i o no ft h ec o m p u t e r , t h er e q u i r e m e n to fm e m o r y c a p a b i l i t yi nt h ec o m p u t e ri sa l s om o r ea n dm o r el a r g e a l t h o u g ht h em o d e mm e m o r y t e c h n i q u ei sd e v e l o p e dr a p i d l y , b u tt h ep e r f o r m a n c eo fc p ui se n h a n c e da b o u t5 5 e v e r y y e a r t h i sr e s u l t si nt h a tt h es p e e dc p u r u na ti sf a s t e rt h a nt h a to ft h em e m o r ya c c e s s i n g b e c a u s eo ft h em e m o r y sa n n u a l l y7 e x a l t a t i o ns p e e d t h e r e f o r et h ec o m p u t e re n g i n e e r s u s em e m o r yh i e r a r c h yt os o l v et h i sq u e s t i o n t l bi st h ea d d r e s st r a n s l a t i o np a r tf o r c a c h ew h i c hi sp l a c e dm o s tc l o s e l yt oc p ui nt h em e m o r yh i e r a r c h y s o t h es p e e di st h e m o s ti m p o r t a n tt h i n gt od e s i g nt l b d u et ot h en u m b e ro ft h et r a n s i s t o r si nt h eu n i tc h i pa r e ai n c r e a s e se x p o n e n t i a l l y t h e p o w e rd i s s i p a t i o no ft h em i c r o d r o c e s s o rc o n s u m e sr i s e sc o n t i n u i n g a n dt h et l b u s e sf u l l y a s s o c i a t i v ep l a c e m e n tg e n e r a l l y , t h i sm a k ei tb e c o m et h ef o c u so ft h em i c r o p r o c e s s o rp o w e r d i s s i p a t i o n t h e r e f o r e h o wt ol o w e rt h ep o w e rd i s s i p a t i o no ft l b i sa l s oi m p o r t a n t t h em i c r 叩r o c e s s o rd e s i g nc o m p l i c a t ei n c r e a s i n g l y , b u tt h en u m b e ro ft h ep r o f e s s i o n a l d e s i g ne n g i n e e ri sv e r ys h o r t ,a n dt h ed e s i g nl e v e lo fm i c r o p r o c e s s o ri no l l rc o u n t r yt r a i l e d t h ew o r l dl e a d e r , a l lo ft h e s ed e c i d et h a to n ra r c h i t e c t sm u s tp a ya t t e n t i o nt ot h er e u s a b i l i t y a n de x p a n d a b i l i t yw h e nt h e yd e s i g nm i c r o p r o c e s s o rt os h o r t e nt h eg a pb e t w e e no u r c o u n t r y a n dt h eo t h e r a sar e s u l t ,i nt h i st o p i ca b o u ts t u d yd e s i g no ft h et l b ,t h er e u s a b i l i t ya n d e x p a n d a b i l i t yb e c o m eap o i n te q u a l l y t h i st o p i ce m p h a s i z e si nt h e s et h r e ea s p e c t st or e s e a r c ht h ek e yt e c h n i q u eo ft l b d e s i g n ,f r o mt h em i c r o a r c h i t e c t u r es t u d yt ot h er e a l i z a t i o no ft h ec o n c r e t ee l e c t r i cc i r c u i t a n dl a y o u tr e a l i z a t i o n ,i na l io ft h e s et h ea b u n d a n tr e s u l t sh a sb e e no b t a i n e d i nt h e f o u n d a t i o no ft h ed e s i g na n dr e a l i z a t i o n ,t h ef u l lt e s tv e r i f i c a t i o nt ot h ec o n t e n t sd e s i g nh a s b e e nc a r r i e do n ,a n dt h et e s tr e s u l t sh a v eb e e na n a l y z e di nd e t a i l t h i st o p i co b t a i n e dt h e i m p o r t a n tr e s e a r c hr e s u l t st o t a l l ya sf o l l o w s : 1 a tt h em i c r o a r c h i t e e t u r e ,t h ea r c h i t e c t u r eo f t l bi ss t u d i e dd e e p l y , an e w p r e c o m p a r i s o nt l bs t r u c t u r ei 自d e s i g n e dt ol o w e rt h ep o w e rd i s s i p a t i o no b s e r v a b l y c o n s u m e db yt l b ,a n dt h ed e t a i l e de m u l a t i o nf o rt h i sn e ws t r u c t u r eh a sb e e nc a r r i e do n n l er e s u l ts h o w st h a tc o m p a r ew i t ht r a d i t i o n a lf e wt l bs t r u c t u r e s t h i sk i n do fs t r u c t u r e a c q u i r e sv e r yo b s e r v a b l ee f f e c t 2 t h el o g i cs t r u c t u r eo fc a mi sa n a l y z e d a n dan e w t y p ec a m e l e c t r i cc i r c u i tt h a tu s i n g ak i n do f c l a s s i f i e dn o rs t r u c t u r ei sp r e s e n t e d t h ea d v a n t a g eo f t h i sk i n do f s t r u c t u r ei s t h a ti tc a na d a p tt ot h ee x t e n s i o no fd i f i e r e n tr e q u e s tf o rt h ea p p l i c a t i o no fc a m c o n t i n u o u s l yc u r r e n t l y t h i ss t r u c t u r ec a ns a t i s f ym a n yd i f f e r e n tr e q u i r e m e n t s ,a n dc a l l b ed e s i g n e do rc o m p o u n d e dt h ec a mn e e d e d s ot h i ss t r u c t u r es u f f i c i e n t l ya c h i e v e st h e r e u s a b i l i t ya n de x p a n d a b i l i t yf o rc a md e s i g n 3 as r a mh a sb e e nd e s i g n e dt oc o m b i n ew i t ht h ea b o v e dc a m a n dw i t hs o m ec o n t r o l e l e c t r i cc i r c u i t st op r o d u c eat l b i nt h i sa r t i c l e ,t h ed e t a i l e dt e s t t ot h ec a m ,s r a m a n dt l b ,h a sb e e nc a r r i e do n ,a n dt h ee x p l o i t a t i o no f t e s tc o d ei si n t r o d u c e d a tt h e s a m et i m e , t h et l bh a sb e e ns i m u l a t e dw i t hs p i c em o d e l s t h es i m u l a t i o nr e s u l t sh a v e i i 国防科学技术大学研究生院学位论文 b e e na n a l y z e di nd e t m lt og e tt h ep e r f o r m a n c eo f t h ed e s i g n e dt l b 4 a c h i pw i t ht w om o d u l e so f c a m h a sb e e np r o d u c e di no 1 8 1 1 mc m o s t e c h n o l o g y e a c hm o d u l eh a s3 2 i t e m + 16 b i t t h i sc h i pi su s e dt ot e s tt h ef u n c t i o na n dp e r f o r m a n c eo f t h en e wc l a s s i f i e dn o r t y p ec a ms t r u c t u r e a n dt h et e s tp c bh a sb e e nd e s i g n e da n d p r o d u c e dt ot e s tt h ec h i p k e yw o r d s :t l b ,c a m ,s r a m ,l o w - p o w e r , r e u s a b i l i t y , e x p a n d a b i l i t y h i 国防科学技术大学研究生院学位论文 图目录 图2 1 虚拟地址到物理地址转换示意图 3 图22t l b 的工作原理4 图31t l b 整体结构原理5 图32 过滤t l b 结构6 图33 分体t i b 结构7 图34 支持两种页大小的t l b 结构7 图35 预比较f l b s 结构 ,9 圈3 6 预比较和b l o c k b u f f e r 比较同时进行的c a m 结构 1 0 圈3 7 预比较在b l o c kb u f f e r 比较之后进行的c a m 结构。1 0 图38 节约位数,1 2 图39 节约比例 1 2 图31 0 传统的t l b 与本文t l b 失效率比较1 3 图3 1 l 多种t l b 结构性能比较1 3 图41c a m 基本结构1 4 图4 2 外围接口图1 5 圈4 3c a m 工作时序图1 6 图44 采用p 管的异或比较逻辑 1 6 图4 5 采用传输门加n 管的同或比较逻辑1 7 图46 采用n 管的与非比较逻辑1 7 图47 采用n 管的或非比较逻辑1 8 图4 8 采用n 管的与非比较逻辑1 8 图4 9 典型c a m 并联或非字结构1 9 图4 1 0 串联与结构1 9 图41 1 分级c a m 字结构2 0 图41 2 位单元电路和版图2 0 图41 3 传统n o r 结构2 l 图41 4 传统n a n d 结构2 1 图41 5 分级n o r 结构2 2 图4 1 6 一个“类字节”和一个字的求值电路的版图2 3 图41 7 下拉管运算图2 3 图41 8 一位的屏蔽电路结构及其版图,2 4 图41 95 - 3 2 译码器结构2 4 图4 2 0 一个字的译码电路2 4 图4 2 1 锁存器电路结构及其版图2 5 图4 ,2 2 顶层c a m 结构图 2 5 图42 3 整体版图2 6 图51t l bs r a m 接口图一一 2 8 图52t l b r a m 工作时序图2 9 国防科学技术大学研究生院学位论文 第1 章引言 现在的计算机应用中,计算机软件设计者和计算机用户对于存储器容量的需求是无 止境的。认为c p u 面对的是足够大、足够快的存储器。其理论寻址空间般总是远远 大于实际的物理主存。因此为了程序执行的灵活性,为了对存储器中的程序及数据实现 保护和共享,为了运行大型程序和真正实现多任务,提出了虚拟存储技术,即以透明的 方式向用户或c p u 提供了一个比实际主存大的多程序地址空间虚拟存储器。 在c p u 内部,是使用虚拟存储器的虚地址,不是真正的物理地址。虚地址是程序 编译后生成的逻辑地址,在程序运行时,必须映射到真正的物理地址,而且还必须是快 速的。于是,t l b ( t r a n s l a t el o o k a s i d eb u f f e r ) 应运而生。t l b 就是做虚地址向物理 地址转换的。t l b 是一个快速缓存,它包含了最近使用的虚地址转换到的实地址。从而 能够快速地确定c p u 所访问内容在c a c h e 中是否命中。可见,t l b 是高性能微处理 器设计中的关键部件。 1 1 选题背景 在信息社会,计算机系统是信息处理的核心,而目前各类计算机基本都采用以微处 理器为核心的体系结构。现代通信设备、网络设备也无一不构筑在微处理器上,有人把 微处理器称为知识经济的“脑细胞”。我国微电子产业每年虽以大于3 0 的增长率快速发 展,但总体而言,产业仍处起步阶段,与国际先进水平相比差距甚大。产量小、产品技 术低,设计能力、制造技术、产品和市场开发都远远落后于国际先进水平。微处理器虽 然已有“方舟”、“龙芯”等几种型号,但其性能和相关应用还无法与国外微处理器芯片竞 争,总之目前国内微处理器应用领域所需主要是从国外进口。技术上受制于人不仅仅 是经济受损,而且对国家安全构成严重的隐患,从目前的互联网上经常发生的黑客事件 使我们已经能够看出潜在的威胁了。因此研制开发自己的微处理器,已经迫在眉睫【4 】o 为了进一步加快我国的微处理器研制与产业化发展,缩短与国际先进水平的差距,减小 微处理器设计周期,预先研制微处理器中关键部件是个行之有效的方法,并形成i p 核, 为以后研制高性能微处理器进行技术储备和研究试验。 1 2 课题研究的内容、成果和意义 本课题研究主要内容包括以下几个方面: 一、对t l b 相关技术资料的搜集、整理和研究,特别是关于c a m ( c o n t e n t a d d r e s s a b l em e m o r y ) 、s r a m ( s t a t i cr a n d o ma c c e s sm e m o r y ) 实现,存储阵 列的写入、读出及其时序控制的研究。 二、t l b 的微体系结构研究。由于t l b 的功耗在微处理器中相对其它部件较大,本 文在微体系结构级,研究t l b 的电路结构,提出降低t l b 的功耗的方法。 三、t l b 的全定制设计实现。具体包括c a m 、s r a m 等的研究与实现。 四、对验证方法和功能测试码的开发进行了研究,对本文所设计的c a m 、s r a m 、 和t l b 进行详细的验证规划,并对部分内容进行详细验证。 课题研究的主要成果: 一、提出了一种降低t l b 功耗的预比较t l b 结构,并进行了实验模拟: 二、提出并设计实现了一种为满足多种应用需求的易扩展的c a m 电路结构; 第1 页 国防科学技术大学研究生院学位论文 3 1 1t l b 结构概述 第3 章t l b 结构技术研究 3 1t l b 结构概述 由第二章内容得知,t l b 作用就是加速线性地址向物理地址转换,这种转换很容易 处在决定处理器时钟周期的关键路径上,因此设计t l b 首先考虑的是地址比较速度。 t l b 总体结构如图3 1 1 4 j 所示。 主体分为标识t a g 、s r a m 和写信号生成三部分: 标识t a g 由相联存储体c a m ( c o n t e n ta d d r e s sm e m o r y ) 构成,功能是完成线 性地址的存储和比较; s r a m 中保存的就是对应于线性地址的物理地址; 写信号生成逻辑主要包括替换算法、访问记录位等,功能是根据各项的访问记 录自动生成在不命中后需写入时的写信号。 此外,t l b 的每一项都还包含有相应的页大小控制逻辑、有效位、页c a c h e 使能 位、奇偶校验位,读出放大等。 测试编码和测试译码两个模块主要是为了可测试性目的而增加的逻辑。在测试模式 下,t e s t c o d i n g 对3 2 项比较结果编码,输出5 位信号,指明具体命中哪一项:t e s t d e e o d e r 根据输入的5 位信号,译码后生成具体写信号。如果没有这两个逻辑则t l b 对所有人 员透明,即命中时不知命中哪一项,写入时不知写入到哪一项中。此外在c a m 和s r a m 之间除了放大电路以外,还有总的命中判断逻辑,此逻辑输出一位命中指示信号h i t , 用于t l b 和c p u 的相关控制。 h i 量 一 j o u t p u ti j r l 。 i 一。 。r ! j 。 叫。 虮 l 一】l g 岛g r 扑l , 二a y 怯i 一 i c a ma r r a y 引 一 。,:弘c hk 僦l 卷厂 】拉1 一 广 引 ! l 吲 k 一“ “i tif 二一 i 厂孟ik i l 一 i ”础t 口n v c r s 1 一一一。:- - f :二 图31t l b 整体结构原理 t l b 按照相联度可以分为三种:全相联结构、直接映射结构、组相联结构 全相联结构:即虚拟地址与t l b 全部标记位进行比较 第5 页 国防科学技术大学研究生院学位沧文 本文提出的t l b 结构是为了得到高性能和低功耗。在该t l b 结构中,对于t l b 的访 闯( 写入和地址转换) ,总是先访问b l o c kb u f f e r ,这样能够更充分地利用程序空闯局部 性特征。因此高性能可以通过b l o c kb u f f e r 的快速访问得到,并且如果b l o c kb u f f e r 命中 则由于不用访问t l b 体使得t l b 的功耗得到非常显著的节约。同时当b l o c kb u f f e r 失效 时,预比较c a m 结构同样能够降低访问t l b 体时的功耗。c a m 的第二级比较( 如果需 要) 可以在同一个周期也可在下一个周期完成。 3 2 4 运算模型 囝3 ,5 预比较t l b s 结构 本t l b 写入时与传统的t l b 不同,弱化了处理器中m m u 部件有关t l b 的功能,而在 t l b 内部加以实现。每个t l b 的项由虚页号( v p n ) + 页内偏移( p a g e o f f s e t ) 组成, c a m 中是保存的已经读入t l b 的虚页号( v p n ) ,s r a m 中保存相应的物理页号( p p n ) 。 t l b 比较时,t a g 区的v p n 与b l o c kb u f f e r 的v p n 相比较,此时有两种情况,b u f f e r 命中 和不命中。 ( 1 ) b l o c kb u f f e r 命中时 此时,b u f f e rh i t 信号为1 ,b l o c kb u f f e r 将缓存的p p n 输出,而c a m 则不进行比较, 由此而节约了功耗,整个t l b 的命中信号t l b h i t 就为高,表示t l b 命中,并且b u f f e r h i t 驱动一个两路选择器,输出物理页号b u f f e rp p n 和页内偏1 l p a g e o f f s e t 到c a c h e 。由于程 序空间局部性原理,并且顺序访问的高可能性,使得这种结构对于节约功耗很有效。如 果b l o c kb u f f e r 没有命中,将进入c a m 进行比较访问。 ( 2 )b l o c kb u f f e r 不命中时 此时根据c a m 的结构有两种情况,如果c a m 的预比较与b l o c kb u f f o r l k , 较同步进行 时( 这种情况下延迟小) ,则进行c a m 的第二级比较,确定出c a m 命中情况。如果c a m 的预比较与b l o c kb u f f e r 比较没有同步进行,此时由b u f f e r h i t ( 为0 ) 来对c a m 进行预充 电控制,并且开始t l b 的两级比较。整个t l b 可以一个周期实现,也可将b l o c kb u f f e r 和c a m 预比较、c a m 的二级比较分成两个周期来实现,具体根据所设计的微处理器性 能要求确定。 当c a m 二级命中时,此时输出s r a mp p n 就是转换成功的物理页号p p n ,并将其 和页内偏址p a g e o f f s e t 送到c a c h e ,且t l b h i t 为高,表示t l b 命中。当b l o c kb u t i e r 和 c a m 均失效时,由c o n t r o l 单元进行控制替换,替换策略是新载八的项替换掉b l o c k b u f f e r 中的项,并且将b l o c kb u f f e r 中原来的项保存入c a m 中,因为它可能对于c a m 第9 页 国防科学技术大学研究生院学位论文 图31 0 传统的t l b 与本文t l b 失效率比较 并且模拟结果显示,b l o c kb u 行e r 的平均命中率达5 2 以上,充分说明了程序访问的 空间局部性原理,这为采用本结构节约t l b 功耗提供了保证。 采用改进的c a c t l 3 1 2 l 】模拟这些t l b 结构,模拟得到o 8 u m 工艺下访问t l b 访问命 中功耗、命中延迟和失效功耗、失效延迟情况。 本t l b 功耗= 命中率1 命中l 功耗+ 命中率2 命中2 功耗+ 失效率失效功耗 其中,命中率1 是b u 疗e r 命中率,命中1 功耗是此时的命中功耗,命中率2 是b u 腩r 失效而t l b 主体( 除去b u f r c r ) 命中率,命中2 开销是此时命中功耗,失效率是整个 t l b 的失效率,失效功耗是整个t l b 的失效时的功耗开销。 图3 1 l 中列出了四种传统的t l b 与本文t l b 两种结构的性能比较。有平均加权功 耗、平均加权延迟和功耗延迟。自权值是由改进的c a c t l 3 模拟的结果与图3 1 0 中 的失效率加权乘得到的值。 l 擂藤 图3 1 1 多种t l b 结构性能比较 可以看出,本文的两种t l b 结构比f a t l b 平均功耗延迟降低约8 5 ,比 m i c m t l b 降低8 0 ,比c t i m 降低6 6 ,比b a n k t l b 降低6 6 以上。 3 3 本章小节 本章主要介绍t l b 微体系结构,列举了现代微处理器研究当中提出的高性能低功 耗t l b 结构技术,并且自己根据程序局部性原理,以及结合b l o c k b u f f e r i n g 技术,提出 了一种预比较t l b 结构,并进行了详细的分析和模拟验证。 第1 3 页 国防科学技术大学研究生院学位论文 第4 章易扩展t l b _ c 圳的设计实现 4 t ,1c a m 基本结构 4 1c a m 概述 c a m ( c o n t e n t a d d r e s s a b l e m e m o r y ) 是按内容访问的存储器,或者称为相联存储器 ( a s s o c i a t i v em e m o r y ) 。是采用全相联的结构,可对所存储的数据与想要比较的数据进 行全并行的比较。由于是全并行的,因此速度非常快,应用非常广泛。在微处理器中用 于c a c h c 访问非常关键的地址转换部件t l b ( t r 趴s l a 虹o nl 0 0 k a s i d eb u 氐r s ) 就是由c a m 和s r a m 加上一些控制单元组成的,由c a m 比较c p u 所给的虚地址和c a m 中所暂存的 项来命中s r a m 相应的项,从而得到物理地址。同样,c a m 在人工智能【2 “,图像处理器 ( 模式识别) ,数据库,和网络路由【2 3 】等方面也有非常广泛的应用。 图4 1c a m 基本结构 c a m 的结构如图4 1 所示,c a m 有两种工作方式:写入和比较。当写入时,c - 蝴 类同于s r a m ,由译码单元译码,选中相应的字,然后将要写入的数据i n p u td a t a 写入。 当比较时,比较参考数据r e f e r e n c ed a t a 经过屏蔽寄存器m a s kr e 西s t e r 后与c a m 中所 有的字进行比较,比较的结果可直接输出,也可输出到命中寄存器h i tf l a gr e g i s t e r 中 暂存。屏蔽寄存器的主要作用是屏蔽比较参考数据中的某些位,当不希望参考数据中的 某些位参加比较时,则通过设置屏蔽寄存器中相应位,使得参考数据的相应位并不真正 加到c a m 所存的数据阵列中,从而参考数据的这些位并不影响比较结果。 4 1 2 设计c a m 规模及其接口信号 所设计的c a m 具有一个比较端口,一个写端口,读写分时。c a m 容量:3 2 字 6 4 位。 所设计c a m 的外围接口如图4 2 所示: 第1 4 页 国防科学技术大学研究生院学位论文 d a t a m a s k 6 3 :0 c a m d i n 6 3 :0 一 m a t c h a d d r e s t t l b i n 6 3 :o l c a m 3 1 :0 一 e n 一 一 e r n w。 r c l k 图4 2 外围接口图 端口定义: i n 口u tf 4 :0 1a d d r ;c a m 写地址 i n p u t 6 3 :o 】d a _ bm a s k ; c a m 比较屏蔽码 i n p u tf 6 3 :o c a m d 跳 c a m 写入数据 i n p u t 6 3 :0 】t l b i n ; 输入的参考比较数据 i n p u te n ;片选使能 i n p u ten w ;,写使能 i n p u tc l k ; ,时钟输入 o u t p u tm a t c ha d d r e s s ,比较后得到的匹配的o n e _ h o t 编码 控制信号有效电平: en w 一低电平为写有效,高电平为读有效: e n 片选高电平有效; m a t c h 高电平为命中有效,低电平为不命中: d a t a i n a s 卜参加比较的c a m 内容由屏蔽码确定,不参加比较部分对应的屏蔽位 为l 、允许比较位对应的屏蔽位为0 :两个端口共享一个屏蔽码。 ( 注:m a t c h 信号是否命中取决于没有被屏蔽的比较t a g 位;写入c a m 时,c a m 的 i a g 和数据体同时写入;不使用该屏蔽码) 4 1 3 设计整体思想 首先,在0 1 8 c m o s 工艺下设计实现,采用自底向上、模块化、层次化方式设 计。 其次,所有的信号通过时钟信号同步后进入各个功能模块。采用片选使能e n 和读 写方式e _ n w 主要控制整个芯片的工作情况,如果使能e n 为高有效,那么整个芯片才 能正常工作。这样做能够通过控制信号控制整个芯片的工作,使得动态电流减少,节约 功耗。 再次,在译码单元也是通过e n 和en w 来控制译码,只有e n 为高,en w 为 低即写工作方式,才能够译码这样做也是为了节约功耗。 最后,在比较的时候,所有的项与所输入的比较数据全并行进行比较。 4 1 4 工作时序 c a m 工作时序简单示意如图4 3 所示。 第1 5 页 国防科学技术大学研究生院学位论文 都是在时钟上升沿开始工作,并且只有在片选信号e n 为高电平时才能够工作。 c a m d a t a 3 :o 表示c a m 对应写入某字之后的数据。en w 为低电平时,进行写入 操作,将c a m d i n 写入由a d d r “:o 译码选通的c a m 字中;当e n w 为高电平 时,进行比较操作。比较参考数据t l b i n 与c a m 中所有的字进行比较, m a t c ha d d r e s s 就是比较结果。 c l k e n en w a d d r 4 : 门几一n 门门j _ 几几n 几n ;厂f 1:! nnn 厂 n ! o 口口仁 i 口口 c a m d i n 口口口口i c a m d a t a ! 二 工= 二工二二二二二二 t l b i n ! 口l | = :二 il ( : i 口 m a t c h d d r e s s 皿型! 卫i 卫 图43c a m 工作时序圈 4 2c a m 电路设计 4 1 2 1 常用的c a m 单元电路设计 1 c a m 位单元电路 基本的c a m 位单元是由s r a m 的六管存储单元的基础上再加上为比较而加的求值 管而组成的。目前提出了有多种电路结构【2 4 】,其主要区别在于求值电路的结构。求值电 路有采用n 管,也有采用p 管,也可采用传输门。 采用p 管的异或比较逻辑 这种c a m 位单元电路结构如图4 4 所示,比较电路由三个p m o s 管( m o 、m l 、m 2 ) 组成。比较时,所存储的数据与要比较的参考数据交叉比较,即图中x 与,y 、x 与y 进 行比较,当x 与y 相同时,此时,z 为高电平,使得m 0 截止,从而使得m a t c h 线保持 为低,取反后即表示命中。反之,当x 与y 相反时,z 为低电平,使得m o 导通,m a 把h 线充到高电平,取反后即不命中。 图44 采用p 管的异或比较逻辑 第1 6 页 国防科学技术大学研究生院学位论文 时信号交叉。是或非结构。 图4 7 采用n 管的或非比较逻辑 采用r l 管的与非比较逻辑 这种c a m 位单元电路结构如图4 8 所示,比较电路由三个r i m o s 管组成,其中的 一个l a a l l o s 管与时钟信号c l k 做与运算,即在时钟正半周期求值。比较时进行交叉比较。 与前面运算过程基本类似。 芒 图4 8 采用n 管的与非比较逻辑 2 c a m 字结构 针对c a m 的字组织结构也有几种不同形式,比如串联与结构、并联或非结构、还有 分级结构等。各种结构有优缺点,针对不同的应用需求,可以采用不同的结构设计。 典型并联结构 这种结构类似于s r a m 等存储器组织结构,如图4 9 所示。由行列选通做与运算 得到选中某字线w o r d 进行写操作,写操作过程同s r a m 的写入过程。 c a m 位单位电路采用放电类型的电路( 图4 5 、图4 6 、图4 7 ) ,比较时,由g n d 或时钟负半周期控制p m o s 管对m a t c h 线进行预充。然后位线加载参考数据进行比较, 当某位不匹配时,该位就将m a t c h 线下拉到低电平,如果所有位都匹配,则m a t c h 线保 持。由l a t c h 锁存结果输出。 这种结构有利于做成很大的c a m 阵列,但对于设计时的时序控制、晶体管尺寸调 整要非常细致。 第1 8 页 国防科学技术大学研究生院学位论文 u 、 u l 宙 密 o 由 f l 芎 c 图4 9 典型c a m 并联或非宇结构 串联与非结构 这种结构如图4 1 0 所示,c a m 字结构是串联的与结构,比较时,首先进行预充, 然后经过所有的比较咖o s 管进行传值,当某位匹配时,高电平向后传,当某位不匹配 时,则就截止,从而整个字不命中。由于n f n o s 管是传递弱l ,n m o s 管串联之后受闽值 电压影响,高电平越来越小,因此这种串联结构的效果不会很好。如果采用交叉比较的 d m o s 管结构,效果则相对好一些。 图4 1 0 串联与结构 分级结构 这种结构如图4 1 1 所示。写入过程同前面几种结构。比较时,时钟负半周期预充, 每个反相器的输入端为高,输出为低,使得下一级同样进行预充,最终的m a t c h 为低, 时钟正半周期求值,位元比较电路中,匹配为高,第一级所有位都匹配,则放电,即第 一个反相器的输入变为低,输出为高。第二级开始求值,依此类推,直至最终求值完毕。 中间如果某位不匹配,则对应的n m o s 管关断,该级不放电,对应的反相器输入为高, 输出为低,最终求值的m a t c h 为低,即不匹配。 由于求值要通过每一级的反相器传输,反相器链的速度成为该结构提高性能的瓶 颈。这种方式是在“越早发现不匹配越快”。这种方式比较容易扩展,加一级就是扩展 了好几位。 第1 9 页 国防科学技术火学研究生院学位论文 4 2 2 位单元电路设计 图41 1 分级c a m 字结构 孓 本文设计的c a m 中位单元电路采用基本的s r a m 六管存储和传输门比较电路的结 构,位单元电路结构( 同图4 5 ) 及其版图如图4 1 2 所示。 图41 2 位单兀电路和版图 当写入c a m 时,将要写入的数据以互补的方式加在写入控制1 3 管m 1 和m 2 两端, 在字线w o r d 为高的情况下,m 1 和m 2 导通,使得数据写入,图中s b i t 就是所保存的 数据,s n b i t 是真正保存数据的非。中间的两个反相器对接,保证了写入的速度和正确 性。 当比较时,如图4 1 2 所示,参考数据以互补的方式( a 年【1 a ) 加在两个传输门上, 当参考数据a 与存储数据s b i t 相同时( 同时a 和s n b i t 也相同) ,该位不命中信号h i t 就为0 ,此时m 3 管关断,m a t c h 线信号保持;当参考数据a 与存储数据s b i t 不同时( 同 时a 和s n b i t 也不同) ,该位不命中信号h i t 就为1 ,此时m 3 管打开,m a t c h 线信号下 拉到弱0 。 在本设计中,之所以采用两个传输门而不是单个n 管或p 管,主要是为了比较电路 的快速,防止这样的错误:当h i t 本次为高而下次为低时快速放电,以免引延迟而导致 m a t c h 线信号出错。 4 2 3 宇结构设计 第2 0 页 国防科学技术大学研究生院学位论文 目前,c a m 字电路结构主要有两种结构:与非和或非结构2 ”。 f o r d t i n e p r e c h a n g e刊 r j r c i r c u i t 一c i ic e l l l _ | 叫c e l ll _一哪c e l l l jl - j h t d g i n e llt丌 吒 叫叫 3 屈t 丑j i a t c b 图4 1 3 传统n o r 结构 在图4 1 3 的n o r 结构中,每个c a m 单元数据与比较参考数据相比较的结果来 连接在m a t c h 线上的n l n o s 管打开或关断。当比较时,所有连接在m a t c h 线上的n n l o s 管关断,m a t c h 线开始预充。当比较数据加载到c a m 上时,位单元将存储的数据与比 较数据进行比较。当两个数据不同时,比较结果信号打开该单元连接在m a t c h 线上的 r l m o s 管,从而放掉m a t c h 线上的电荷。当两个数据相同时,对应的n l t l o s 管保持关断, 使得m a t c h 线保持预充时的电压。在n o r 结构中,每个位单元的比较结果都影响整个 m a t c h 线上的电压,从而快速地得到整个字的比较结果。然而,这种结构是预充点分时 进行的,并没有使得性能最大化,并且对于目前c a m 的字的长度越来越长,使得预充 电负载大,时间长,不利于c a m 结构字长的继续扩展。 生勋f 出h e iil l iil ii - tc l ic e l l 卜 1 眦1 1r c a l lc e l l 卜 ill i l j _j 上 酝t c h l i n e r t 下tt t 如t a l l a t c h 图4 4 4 传统n a n d 结构 在n a n d 结构中( 图4 1 4 ) ,所有的传输n n l o s 管串联。这种结构的位单元是当比 较相同时,传输a l o s 管导通,不相同时则关断,与上面的n o r 恰恰相反,并且一个显 著的优势是功耗低。但由于匹配运算是串行传输,尤其是当c a m 的字长较长时,对速 度影响会更大。与前面的n o r 结构相比,n a n d 的速度非常慢,根本不能适应如今的 高性能微处理器的发展要求,同时也不能适应对于c a m 字长扩展的需要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论