(计算机应用技术专业论文)分布式快速直接2didct算法及其ip核设计.pdf_第1页
(计算机应用技术专业论文)分布式快速直接2didct算法及其ip核设计.pdf_第2页
(计算机应用技术专业论文)分布式快速直接2didct算法及其ip核设计.pdf_第3页
(计算机应用技术专业论文)分布式快速直接2didct算法及其ip核设计.pdf_第4页
(计算机应用技术专业论文)分布式快速直接2didct算法及其ip核设计.pdf_第5页
已阅读5页,还剩113页未读 继续免费阅读

(计算机应用技术专业论文)分布式快速直接2didct算法及其ip核设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 作为次最优正交交挨的d c t d d c t 舆有计算复杂度适中、可分离特性、 及快遮算法等特点,在数字信号处理,特别在图像视频数据压缩解压缩编码 颚域应溺广泛。近年来多媒体鼓术与数字通信援术豹不断发展,蘅豫帮视频 压缩与解压缩不版应用到手机这类咀电池供电的有限电源系统中。因此研究 d c t i d c t 算疆及箕w 。s l 实璐鹃遗谴醴趋重要,茏箕楚高往魏且低功耗算 法及其v l s i 实现结构。而设计个专用的二维i d c t 的i p 核是设计m p e g 筏额释玛s o c 芯片豹萋覆帮分。 本文完成了分布式快速直接2 d i d c t 算法及其i p 核设计。该算法在快 速壹接2 d - i d c t 算法中霉;天了分布式诤算f d a 方法,有效黪黢少算法实囊 的面积和不规则结构,形成一个低功耗算法级的设计。该算法坤核进行了 深入黥r t l 弋褥缀霞晓,冀诗冀淹积豹藤热结鞠静分布式诗算蜜凌不是镑绕 的基于r o m 查找表的d a ,而怒基于经过深入优化的缀合逻辑的d a 。该口 核经过严捺瑟门缀霹序糖奏,终采 歪骧蒸毫吞渡量, 慕凌耗,小嚣积,褒精 度。其兼容w e e1 1 8 0 。1 9 9 0 标准,支持j p e g 。m p e g ( m p e g i ,m p e g 2 和 m p e g 4 ) 数字鬻像程鞭标准,支薅h 2 6 1 窝h ,2 6 3 程鬃会议标准,瘦_ 醒j ;镁域 广泛。 另终本文提滏一秘鼗蛇逻爨筵佬方法,熙予 乏楚复杂缓合逻辑与漕除逻 辑冗余。用这种新的化简方法,设计出的计算4 输入变魑内积的乘加结构具 有毫性能露小露积的特点。 基键词:离散余弦逆变捩;直接二二维变换法;分布式计算方法;知识产权核 专用集成电路;现场可编程门列阵 a b s t r a c t s i n c eo r t h o g o n a ld c t i d c th a st h en e x tb e s tp e r f o r m a n c ef o rh i g h t y c o r r e l a t e ds i g n a l s ,a p p r o p r i a t ec o m p u t a t i o n a lc o m p l e x i t y , r e p a r a b i l i t ya n df a s t a l g o r i t h n li t i sw i d e l yu s e di nd i g i t a ls i g n a lp r o c e s s i n g ,e s p e c i a l l yf o ri m a g ea n d v i d e od a t ac o m p r e s s i o n d e c o m p r e s s i o n a n dt h e s ep r o c e s s e sr e c e m t ya p p l yt o b a t t e r y o p e r a t e ds y s t e m l i k ew i r e l e s sc o m m u n i c a t i o ne q u i p m e n t sw i t h d e v e l o p m e n to fm e d i aa n dd i g i t a lc o m m u n i c a t i o nt e c h n o l o g y i tb e c o m e s i m p e r a t i v e t o d e v e l o pd c t 1 d c ta l g o r i t h ma n di t s v l s ii m p l e m e n t a t i o n , e s p e c i a l l yt od e v e l o pl o wp o w e ra n dh i g hp e r f o r m a n c ea l g o r i t h ma n di t sv l s i i m p l e m e n t a t i o na so n ec o m p o n e n to ft h e s ee n e r g y c r u c i a ld e s k t o p s ,t h u si ti s s i g n i f i c a n tt od e s i g na na p p l i c a t i o ns p e c i f i ci d c ti pc o r ea n di ti si m p o r t a n t c o m p o n e n to f m p e gd e c o d es o cc h i p t h i sp a p e rp r e s e n t st h et w od i m e n s i o n a li d c ta l g o r i t h mb a s e do nt h e d i s t r i b u t e da r i t h m e t i cf a s td i r e c tm e t h o da n di t si pc o r ei m p l e m e n t a t i o n t h el o w p o w e ra l g o r i t h ml e v e ld e s i g nr e d u c e sg a t e sc o u n ta n di r r e g u l a r i t ya r c h i t e c t u r eo f t h ea l g o r i t h mi m p l e m e n t a t i o n t h ed e s i g nc o d eh a sb e e no p t i m i z e dc a r e f u l l yi n r t ll e v e l t h ec o r eu s e sc o m b i n a t i o n a ll o g i co p t i m i z e dt og e n e r a t et h es u mo f a c c u m u l a t i o ni n s t e a do ft h ec o n v e n t i o n a lr o m b a s e dl o o k - u pt a b l ed i s t r i b u t e d a r i t h m e t i c ,t h ec o r eh a sb e e ns i m u l a t e dr i g o r o u s l yi ng a t el e v e l ,a n dt h er e s u l t v a l i d a t ei ti sl o wp o w e r , l o wg a t e sc o u n t ,h i g hp r e c i s i o na n dh i g ht h r o u g h p u t i ti s c o m p l i a n tt oi e e e1 1 8 0 - 1 9 9 0n u m b e rp r e c i s i o ns t a n d a r d ,s u p p l yj p e gi m a g e s t a n d a r d ,m p e g ( m p e g l ,m p e g 2a n dm p e g 4 ) d i g i t a lv i d e os t a n d a r d sh 2 6 1 a n dh 2 6 3v i d e oc o n f e r e n c i n gs t a n d a r d s i tc a nb ew i d e l yu s e f i n a l l y , t h i sp a p e rd o s ed e e pr e a c h e so ns i m p l i f yl o g i cn e t w o r k , a n dp r e s e n ta n e wm e t h o du s e dt os i m p l i f yc o m p l e xc o m b i n a t i o n a ll o g i ca n dr e d u c el o g i c r e d u n d a n c y ac i r c u i tu s e dt oc o m p u t e4 - v a r i a b l ei n n e rp r o d u c ti sd e s i g n e dw i t h t h em e t h o d c h a r a c t e r i s t i c so ft h ec i r c u i ta r e h i g hp e r f o r m a n c ea sl o wg a t e s c o u n t k e yw o r d s :1 d c t :d i r e c t2 - dm e t h o d ;d a ;i p ;a s i c ;f p g a 耍壶窒适当鲎亟髓窒生黧焦迨塞蔑! 夏 第1 章绪论 ,l 。1 课惩的鹜景、意义翻鏊标 a s i c ( a p p l i c a t i o ns p e c i f i ci n t e g r a t e dc i # 致) 鼷专鬟集残遣路,是针对菜一 应用而设计制造的半导体集成电路。随着半导体工艺技术的迅猛发展,已经 步入深遥激米毙避大援模集或电路制造王艺孵健。按照潦尔定镎,芯片熬集 成度每3 年增长4 倍。从2 0 世纪9 0 年代中期,a s i c 技术从芯片集成的理 念发展戏巍基予嵌入式竣酶片上系绞( s y e t e mo n8c h i p ,s o c ) ,s o c 憝一穆 将多个独立的v l s i 设计拼合柱一一起,来完成菜一应用所需的全部功能的集 成电路。在赝露瓣s o c 设计中,预先设计的i p ( i n t e l l e c t u a l p r o p e a y ) 棱楚基本 的部件。i p 核通常是由可综合的硬件描述语言( h d l ) ,如v e r i l o g 或v h d l , 或经过优化的岛髂管级蕊版图。可分为软棱、阎捩和硬攘【1 2 】: 软梭:是用可综合的r t l 缀插述或通过库元件的黼表形式表示的可复用 的模块。 圃梭:是指在结构和拓朴方面针对性能和面积通过版图蕊划,甚至是用 某种工艺技术( 例如f p g a ) 进行过优化的可复用的模块。以综台好的代码或 通过库元件两表的形式存在。 硬核:是指在性能、功耗和面积t 经过优化,并映射到特定工艺技术的 可复用躺模块。以完整布两布线后网表固定敝图形式存在。 这些桉可以是徽处理器( 如a r m ) 、存诘器( 如r a m ) 、总线控制器( 如p c i ) 、 d s p 等功能模块。基于袄的s o c 广泛应瘸于通倍、计算梳、家电等多个领域。 本课题就是一个d s p 的i p 核设计,其执行的是二维的离散余弦逆变换 ( i n v e r s ed i s c r e t ec o s i n et r a n s f o r m ,i d c t ) ,可鹾作为软缓和溺核往精。 离散余弦变换( d c t ) 【3 】是将空域信号变换到频域,产生一批表示这些信 号豹交按系数静变换照耀。两羹橡空城髂号熬变换楚蘧稼为离散余弦逶交换 ( i d c t ) 。 在强蒙器筏频售号藏压缩中,透露涛空域浆强像数据决欢囊季变换强舅一 耍塞童逗盘鲎亟避窒圭堂焦迨塞 篓2 亟 个正交的矢量空阀( 通索为频域) ,以提供更紧凑靛信息凌达。羧理想的变换 是卡洛变换( k a r h u n e n - l o e v et r a n s f o r m , k l t ) ,它封装最多的块能量到最少的 频域单元,它最小化熵,它的元素是完全不相关龅。但是其变换核矩黪不是 龋定不变的,而是隧原始输入图像而改变的,这使电路寓现复杂化,难于实 现。1 9 7 4 年由a h m e de ta l 提出的离散余弦变换作为次最优正交变换,在数 字图像数据压缩编码技术中,萁压缩效槊接近瑷想的k l t 变换,且d c t 的 计算复杂度适中,又具有可分离特性,及快速舞法等特点。冀广泛应用到 j p e g 蕊缩裤藤缩、d v d n c d 搐放祝、电缆魄褫、h d t v 、瀚形与图像处 理卡、趔声波拨磁共振成像系统、数字录像机、机顶盒、数字照相机、视频 瞧话帮褫频会议、图象传输系统等。强前d c t i d c t 已成为运动图像毯缩标 准( m p e 秭和静止图像压缩标准( j p e g ) 等的重要组成部分。 国1 - 1 捂述了d c t t d c t 在j p e g 编码和解码过程中所起髂重要 警埽, 图l ,2 描述的是d c t i d c t 在m p e g - 2 中所越的重要作用,豳l 一3 描述了 i d c t 在m p e g - 4 4 瓷频簿妈遗程中酶鬟要 乍糟。表1 - 1 1 5 说瓣了m p e g 一4 解码器的最集中计算过程是i d c t 计算。广泛臌用的s i g m ad e s i g n s 公司的 d v d 簿玛芯黄就是壶a r m 棱与i d c t 棱形成主娃瑾器掬耱处理器为竣心豹 视频解硝结构的,如图1 - 4 6 1 。 编码 瑟一蝴h 溅h 蕞翼“h 裟卜黧履 勰鹨 鬓曩后 至至三 1 重薹薹j 薹至至三) _ 日蓁篓魏据 图1 1j p e g 编码,解码框图 琶囊窿壅蠢囊亟圭酝窒垒黧壤鲨塞戴錾 重憩( 解码) 帧 图i - 2 典型d v d 系统的m p e g - 2 槿髑 v 脚o 雌“h y e rs h a p e 胬i - 3 筒他的m j ? e g 4 视频解硝过程 酉藏室照盎耋塑土迥窒生燮焦逢塞 舅g 夏 表1 - 1m p e g - 4 解码过程各模块的特征信息 模块名称模块占用的时间 i d c t5 9 v o p 重建 1 4 反向量化、反向扫撼祁反赶预测 1 2 运动补偿 1 0 数搌分析呵可变k 解码5 = _ i d c t a r m 窘,。c t 图1 - 4s i g m ad e s i g n s 公司的d v d 解码芯片核心结构 涟麓多藻 奉技术与数字通信技术翡不断发鼹,圈豫帮裁颡簇缩与瓣压缩 不断应用到以电池供电这类有限电源的系统中,例如手机、个人数字助理 ( p d a ) 、便携式电箍等,有羧豹瞧源搜这些建爝中功耗戏为一个主要鹃溯素, 且对图黎质量的要求也不断提商。因此研究d c t i d c t 算法及其v l s i 实现 懿缝位匿趋重赘,茏冀楚毫注熊盈糕功耗缓熬簿法及冀v l s i 突臻结稳。蔼 设计一个专用的二维 d c t 的v l s l 实现结构魑设计m p e g 视频解码:海片的 霞要部兮,奉设计嚣掭辕跫设诗一令低功耗、蘸瞧憩、舔狡合蘧酌二缝i d c t 的v l s i 实现结构。 1 2 课题完成的工作 谍蹶主要完成以下几方面的t 作: l ,刽藏的逻辑篱他方法建手嶷杂缝台逻辏讫楚与瀵豫逻辑毙衾豹 方法,这是一种结构化的方法,可以得到小面积、高性能的结构。 2 。 楚化设跨y 求4 输入交爨走毅懿乘加缝糖使是上述方法,透过壤 写的优化程序的辅助,对求4 输入变量内积乘加结构进行了深入优化。得 亘彦童适态堂亟逊窒塞燮焦迨塞 萋嚣 到的乘加结构继果表明在不增加延迟的情况下其实现门数比出乘法器实现 的乘加结构减少4 0 ,陇由查找表乘法器实现的乘加结构减少2 5 。 3 分布式快速直接2 d i d c t 算法一本设计采用快速直接2 d m c t 算 法丽不怒传统的行殉分解的算法,并在快速直接2 d ,i d c t 算法中引入了分 布式计冀f o a ) 方法,有效的减少算法实现的面积和不规则结构,形成一个低 功耗算法缀的设计。编写算法城程亭与m a t l a b 中的d c 譬变换缩果避行对眈 对算法进行验证,结果证明是正确的。 4 + 分布式快速直接2 d i d c t 算法礤核该l p 核采霜分布式浃速直 接2 d i d c t 低功耗算法,其计算内积的乘加结构的分布式计辫实现不是传 统翡基于r o m 焱我表( l o o k - u pt a b l e l 韵d a ,褥是基予经过深入饶纯瀚缀合 逻辑的d a 。对i p 核进行了深入的r t l 代码级优化,并经过严格的门级时 序仿囊,缩采谣鞠萁寄器畦量,诋功耗,夺瑟穰,毫鞴凄。该王p 孩其有激 下特性: 努凌 式f d a ) 快速鼗缓2 d - i d c t 算法 低功耗算法级设计 基予d a 鹣并行黎鞠曩畜强懿工偻毫压帮枣瀚门数 执彳子8 8 的二维离敝余弦邋变换 不瀑要筑上逛霹媲绽 兼容i e e e1 18 0 1 9 9 0 数字精度标准 4 象索每霹镑翅赘瓣吞吐羹 数据流风格的核接口和控制 使鼹单一时镑鼹全隧步设计 完全可综合 基予d a 篡骞宽范壤蛇辕入数据宽度 可选的为d a 设计的带1 2 位输入的取通道并行到串行转换器 其支持j p e g ,m p e g ( m p e g l ,m p e g 2 帮m p e g 4 ) 数字图像视频撂准, 支持h2 6 1 和h 2 6 3 视频会议标准。可应用于数字照褶机、视频播放机、高 清晰电视、打印机、桌萄的视频编辑器和各种先避图像健输系统象电话会议、 远程医疗诊断、安傈系统等。 酉煎童逗叁蹩亟嫩窒生誊焦丝塞 筻垒夏 1 3 论文麴组织结构 淦文荚分7 牵,荬蠹容缓缫翔下: 第一章,绪论,阐述课题的背景、意义和目标,以及完成的工作。 第二章,分毒式袄遽直接2 d - i d c t 算法溪究,绘赛分毒式浃遮囊接 2 d 1 d c t 算法的推导过程。 第三章,分蠢式快速襄接2 d i d c t 算法辨菝弱a s i c 设量 分褥,耀述 a s i c 的设计方法和开发流程,及本设计所要实现的功能和实现该功能所选 择裁缝梭懿a s i c 系绞没诗。 第四章,分布式快遮直接2 d i d c t 算法婵核模块设计,本章对分布式 快速壹接2 1 ) 。i d c t 棱模块设计馋出说暖。 第五章,优化设计,就本设汁中采用的优化设计方法做出说明,主臻是 低功耗後他设计黥方法靼提出葶孛薪的逻辑篾他方法。 第六章,鏊于f p g a 的综合与仿真,阐述从使用v e r i l o g 描述的r t l 级 代码到f 1 级电路实现的综台,以及通过仿真测试赝设计的系统是否工作正确 的方法。并给磁本设计的分布式快速直接2 d i d c t 算法诤核熬于a l t e r a 的 f p g a 摩积a s i cs c l 0 5 u 工艺摩的实现结果数据。 第七章,i e e e t l 8 0 。1 9 9 0 稀准与铡试结栗,阐述i e e e i i s 0 ,1 9 9 0 标准测 试过程,给出一致性测试结果和功耗仿蠹结果。 酉隐童渣盎堂亟迥窒垒爨焦迨塞 麓z 夏 第2 章分布式快速宣攘2 d i d c t 算法研究 2 d ,d c t ,i i ) c t 算法可分为三类:一种是采用矩阵行列分解的间接方法 【7 1 0 】;另一种是直接法实理二二维d c t f l d c t 变换【1i - 1 3 】;第三三秘是袋爆快 速博里叶变换,快速哈特莱变换等间接算法( 1 4 】。传统的行列分解的斡法具 肖规则的结构便于v l s i 实理,因此大多鼗公司和研究祝构都以此算法来没 计芯片。但对于有限的电源系统功耗成为一个j 三要的限制因素。行列分解的 算法计冀复杂度大于鸯接法,丽计算羹是低功耗算法级设计主要考虑的因 素。且行列分解的算法实现时需要中间转置存储器,存储器在蒋片中怒消耗 颟积的照要部分,而直接法不需要转置存储器。但是直接法的不规则和并行 结构往蕻v l s i 实现蠲难且门数较多硅片萄积大。为此,我在赢接法中s 入 分布式计算( d a ) 方法,有效的减少面积_ 靼不规则结构,形成一个低功耗的设 计。本章先作快速直接2 d - d c t 算法和分布式计算方法酌说明,再佟缭合了 两者优点的分布式快速囊接2 d 。i d c t 算法的说明。 2 1 快速直接2 d - d c t 算法 由于是正交变换,当不考艨尺度因素时2 d - d c t 与2 d i d c t 只是输入 与输毒耀反,霞就可釜扶2 d - d c t 雄导爨2 d - t d c t 。兹健惩多壤式交撩豁浃 速2 d d c t 算法中按照计算复杂度评测c h o 和l e e 的直接2 d d c t 算法 1 3 】 还最好瓣。它爨畜与其它好豹舞法穰戳麓掇法数簧,纛慧夺讫鬃洼翁数量。 相较于传统的行列分解法,它的乘法数目减少5 0 【1 5 】。我的2 d 1 d c t 算 法壹c h o 霹l e e 豹2 d 耠c 算法导童。 2 1 。1c h o 蠢l e e 戆2 1 ) - i ) c t 竣速篝法麓遴 n 点的二维骧始数握 :,j = 建l ,一l ;豹2 d - d c t 变换定 义如下: 亘逝窒遵盎堂亟丛宣圭黧焦丝塞 嚣羔坠 小号a 懒) n 荟qn 善- i 铲警一警万刚 ,、| 下1 ,玎:0 f ( “) = 压“ l1 ,其它 其中 k :玑v = o ,l ,一1 ) 是变换的输出。公式中的斋c ( ) c ( v ) 为尺 度因子。在图像视频编解鹃中,可在_ 量纯或逆羹仡、z i g z a g 或邋z i g z a g 扫描 等处理过程中执行。因此算法研究时不考虑尺度因子。由此定义e ,为 耻n 萎- i n 丢1 s 警s 警厅 ( 2 :) 封公式 ( 2 5 b ) f 2 6 a ) 2 + 6 奄 由此将二缳的输入数据分缀为n 个不同的数据予集,这些予集满怒( 26 ) 亘遗窒逗杰堂亟土鲢窒垒鲎鱼迨巍 麓! 夏 式的关系,其中满足( 2 6a ) 蛇表示为j ( p :抒) ,满足( 2 。6 南) 的歹表示为 ,( p :6 ) 。通j 窭变换e 。交换为: z 。= 三1 等l 等f x ,、+ 乳) c o s f 型! ! 生! 翌! 帮 i | 豫嘲+ 秘兰等等鲨帮 + 芝( 弓。嘲+ 蠢晤o s 堡垒兰2 1 n 篓二照石l ,撵为疆数 三警f 善e t ,c 黾。,一x ,。,。j t ! ! ! :芝凳掣嚣2 7 + 鬈( - d 蛳( 豫删一豫,) c o s 垦兰鼍等= 垃万 露为惫数 + 蛳( 豫删一豫,:酚型二蛩 型万 露为惫数 n y - t ( * 。+ x 。、) c 。s ! 兰! 三2 垒! ! 翌霈 善( 舯s 婴焉二翌霈 和善n - 1 ( 芏。,。,+ x 。,。,) c o s l ;! 二:! ; ;3 ;二二望硝 冒定义 厶= 黔矿强加) ) c 。s 堡警舻 厶= ( x 蜘) + r 科) ) c o s 鼍专等舻 出式( 2 7 ) 中的, 艺i 1 2( 33 ) 蝶形运算模块为一个多级流水线结构,每一级蝶形运算是对对应元素进 行加减运算,然后把运算结果保存起来作为下一级蝶形运算的输入,最后输 出到1 d i d c t 模块。 输出m u x 将8 路并行的1 d i d c t 运算的结果多路选择后输出。该m u x 为g r a y 编码的多路选择器。 钳位模块是一个可选的模块,使2 d 。i d c t 核的输出可为满精度或满足 i e e e1 1 8 0 1 9 9 0 的9 位输出。 控制模块产生控制信号,对整个运算进行时序控制,产生握手信号和外 界联系,采用有限状态机( f s m ) 实现。 亘童毫湮盔堂亟鲢窒生堂继迨塞 蔓超夏 3 。2 。2 。2 d q d c t 结桴 建统兹分毒式诗算7 i 法 2 s l 是鏊予r o m i b 4 m 憝查找表终稳。在 r o m r a m 中存储预先计算的乘法结果,以输入作为地址线,赢找所需的乘 法蕊。鞭姥对令埝入嚣要2 ”x m u l t i p l i c a t i o n p r e c i s i o n 寝r o m r a m ,鸯 此将消耗较多的硅片面积,且需要上电初始化。本设计采用基于组合逻辑类 袋子数字滤波憨方式竞残乘法运冀。恣1 d - i d c t 中需蘩诗算: c ;c :qc 4 c 2 一巴一g g g qg g c 4 一c 3c :一c l a l 蔓 4 互 其中c 。,c :,g ,c 4 分别为1 4 位定参数。对该结构使用我的逻辑化简方法 ( 见5 3 :露) 进行深度优化,与其它实现方法的比较见表3 0 。 袭3 - 2 莱加结构实现方式比较 实现方式 l 、1 数( g a t e s )关键路径( n s ) l 基于r a m 韵l u t 2 9 72 5 5 i 乘法器9 6 5 6 6 9 l u t 乘法器 7 6 23 6 9 i 本设计的基于缎台逻辑5 6 53 1 5 表中数据便厢m e m o rg r a p h i c s , 的l e o n a r d o s p e c t r u ml e v e l3 对编写的 v e r i l o g 代码编译综合,工艺库为l e o n a r d o s p e c t r u ml e v e l3 提供的a s i c 的 s c l 0 5 u 得至8 。宙表;弘可以看到率设计采甭的蘩了缀台逻辑酌方法优予其它 的实现方式。本设计的桀加结构为一个两级子模块串逸的结构,两级子模块 豹r t l 缀电路潮觅圈3 - 5 。哥戴这静结构面积小且性镌较好。 图3 - 5 两级予模块的r t l 级电路图 以这样的乘加结构构造的1 d i d c t 结构为图3 - 6 。 ;1 d i d c t 萱笙塾一,一、 控制逻辑j 图3 - 61 d i d c t 结构 串行输入通过组合逻辑乘加网络后作移位累加操作再作蝶形运算得到位 亘童窒适盔堂亟盟窒圭堂焦迨窒篁:i 夏 并行的输出。 3 3 小结 本章首先从项目管理和质量管理的方面阐述系统设计方法和思想,然后 对a s i c 的设计流程进行的说明。最后描述了本设计所要实现的功能和实现 该功能所选择的结构的a s i c 系统设计。 一一 亘宣窒适盎堂亟堡窭圭堂焦逭塞复堑亟 第4 章分布式快速直接2 d i d c t 算法的i p 核模块 设计 上章描述了系统设计方法与思想,本章将这些方法与思想融入具体的设 计中。采用t o p d o w n 的方法将整个系统划分为子系统,再将子系统划分为 更小系统直到可管理性、可设计性高的单个模块。本章首先描述了本i p 核 系统的模块划分,然后对顶层模块作详细说明。 4 1 模块划分 本设计采用t o p d o w n 的方法按照功能将整个系统划分为7 1 个不同的模 块,其中分布式快速直接2 d i d c t 核共有5 9 个模块,p s 转换模块共1 1 个 子模块。实际设计的模块远不至这7 1 个模块,每个模块都有两到三种不同 的模块描述,这些模块的实现的面积、功耗、延迟不同,需要在这些性能之 间做出仔细的选择。 包括并串转换的分布式快速直接2 d i d c t 顶层模块分为两个部分,分别 为分布式快速直接2 d i d c t 核( t w o dr d c t ) 和双通道并串转换缓冲模块 ( b u sb u f ) ,如图。_input4-1 图4 - 1 分布式快速直接2 d i d c t 顶层模块( 包括并串转换) 划分 分布式快速直接2 d i d c t 核分为4 个子系统模块,如图4 2 ,分j :;l j 为 图4 2 分布式快速直接2 d - i d c t 核子系统划分 t w o d _ i d c t _ b u f 、t w o d _ i d c t _ b u t t e r f l y _ t o p 、 t w o di d c t _ m u l t i p l y a d d _ m u xb u t t e r f l y 和c l i p 模块。 t w o di d c tb u f 模块为分布式快速直接2 d 。i d c 核输入缓冲模块,同步 输入信号。 t w o dd c t _ b u t t e r f l y _ t o p 模块为分布式快速直接2 d i d c t 蝶形运算子系 统顶层模块。该子系统又划分为t w o di d c tj ) u t t e r f l yc o n t r o l 、 t w o d _ i d c tb u t t 盯f l y s t a g e l 、t w o d _ i d c t _ b u t t e r f l y _ s t a g e 2 、 t w o d _ i d c t _ b u t t e r f l y _ s t a g e 3 、t w o d _ i d c t _ b u t t e r f l y _ s t a g e 4 这5 个下级子系 统,如图4 3 。 图4 - 3t w o d _ i d c t _ b u t t e r f l y _ t o p 子系统模块的下级子系统划分 t w o d _ l d c t _ m u l t i p l y a d d _ m u xb u t t e r f l y 模块为包含8 路并行的分布式 d - i d c t 的t w o d _ i d c tm u l t i p l y a d d下 级 子系 统 和 t w o d _ i d c t _ m u x _ b u t t e r f l y 多路输出下级子系统的子系统顶层模块,如图 4 4 。 圈4 4 t w o d _ l d c t _ m u l t i p l y a d d _ m u x _ b u t t e r f l y 子系统模块的下级子系统划分 c l i p 模块为钳位模块,为可选模块,使输出可在满精度和满足i e e e 11 8 0 1 9 9 0 的9 位输出之间选择。 分布式快速直接2 d i d c t 核各子系统间连线图如图4 - 5 。 图4 - 5 分布式快速直接2 d i d c t 核各子系统间连线图 双通道并串转换缓冲b u si n p u t _ b u f 模块划分为5 个子系统模块,如图 4 - 6 ,分别为:p i ni n p u t _ b u r , g e n e r a t e _ a d d r e s s 、b u si n p u t _ b u fs l i c ec o n t r o l 、 b u s _ i n p u t _ _ b u f _ s l i c e 、m u l t i p t y _ s q r _ _ 2 模块。 p i n _ l n p u t _ b u f 模块为双通道并串转换缓冲模块的输入缓冲器模块。 g e n e r a t ea d d r e s s 模块为双通道并串转换缓冲模块的读写地址产生器子系 统。 b u s _ i n p u t _ b u f s l i c e c o n t r o l 模块为产生对并串转换缓冲的两个通道控制 图4 - 6 双通道并串转换缓冲b u s _ i n p u t _ b u f 的子系统模块划分 信号的子系统模块。 b u s _ i n p u t _ b u f _ s l i c e 模块为双通道并串转换缓冲模块的并串转换单元模 块。 m u l t i p l y _ s q r _ 2 模块为采用( 3 3 ) 式计算乘以i 的乘法模块。 双通道并串转换缓冲b u s _ i n p u t _ b u f 模块各子系统连线图如图4 7 。 = ; i l # d 气鲫 “ l 怍 亨 ;i | l ? l 搠 一# + ;h h - 婶诅,:二 兰。- l q 备m 五一一 “ 一尸 1 _ l i 1 i f i叫 , l 雠j 。鳓 = 辅 行壬聿 偬盲一1 蜷“;盎重 ! l 。 鞋:1 蜂鼙 戢 l l ,:n “母1 l ;_ j h t m m l t。,i 。g 黜 = 嚣:_ = 叠 :。r 引 h 图4 _ 7 b u s _ i n p u t _ b u f 模块各子系统连线图 这些子系统模块划分为更小的模块构成整个设计。篇幅所限不作进一步 酉蜜窒运盎堂亟堑窒圭堂焦逢塞蔓2 q 夏 的详述。 4 2 顶层模块说明 4 2 1 顶层模块框图 c o e l f _ i n 6 3 o 】 :警警搿 b i o c k _ o 叱c 1 n e w c o e f f i n b l o c k _ o u t _ r , i 2 d ) c t b l o c ko u ta v t 、v ”di d c tc l k :i d c t _ r , t - d r e s e t 图4 - 8 分布式快速直接2 d i d c t 框图 图4 - 9 带p s 转换器的分布式快速直接2 d - i d c t 框图 图4 - 8 描述_ r 分布式快速直接2 d i d c t 核框图。图4 - 9 描述了带双通道 并串转换器( 其具有4 路1 2 位总线输入) 的分布式快速直接2 d - i d c t 框图。 查魔奎道塞堂亟邈窒圭堂僮迨塞 璺! 夏 4 2 2 鳓遮丑浚骥 4 。2 。2 1 分枣式快速誊绥2 d - i i c t 核接口 l 。c o e f fi n 输入端e lc 灯e f fi n 将数据流串行的输入到分布式快速直接2 d i d c t 核。 矮户需要将输入系鼗转捩为6 4 个位率撑懿数攥。c o e f fi n 靛最 豪位对疲8 。8 采样块的第一个系数,c o e f fi i 3 的最商位对应8 8 采样块的最末一个系数。 当信号i d c t _ r f d 为蠢逛平量n e w _ c o e f f _ i n 信譬鸯赛奄乎时输入数据 将被读取。如蹰4 1 0 。 m 。u d c u m 几几九n 九门八九n 二_ 叫每三二一 r e s e t y c 筻羹凌兹x 琰题x 泓弛 n e w _ c o e f f 1 n 1 d c 聃d 图4 。1 0 分布式快速崴接2 d 。i d c t 核接收数据接e 时序 2 n e wc o e f f _ i n n e wc o e f fi n 控涮信譬标示在c o e f fi n 端疆有一个有效的输入数据。 当高电平信号1 d c t _ r f d 有效时,使商电平有效信号n e wc o e f f _ i n 有效, 在c o e f fi n 灞口的数据被采样。本孩工 乍在对钟酌上升边因此 n e wc o e f fi n 和c o e f fi n 信号需鼹在每一个时钟的上升边之前稳定以 避免任何的竞争条件。 3 i d c tr f d 寄电平有效输蛊信号t d c t 豁示分带式快速藏接2 蛰核准鍪rfd i d c t 西南交通大学硕士研究生学位论文第3 2 页 好接受凝埝入数据。当i d c tr f d 蠢效时n e wc o e f fi n 可被键毙。 i d c tr f d 信号在t w o d _ i d c tc l k 时钟信号的上升边前一个时钟周期使能。 4 + b l o c ko u t _ a ,b l o c k - o u tb , b l o c k o u tc ,b l o c k o u t d 输出端口b l o c ko u tab l o c ko u tb ,b l o c ko u tc ,b l o c ko u td 提供 2 d - i d c t 变换结果输出。这4 个并幸亍输出端c l 同时分别输出4 个变换结果。 b l o c ko u t 丸b l o c ko u tb ,b l o c ko u tc ,b l o c ko u td 寇8 8 输涵象素块中位 置是按下标顺序的。b l o c ko u t 气b l o c ko u tb ,b l o c ko u tc ,b l o c ko u td 的 位宽由r e s u l tw i d t h 参数( 觅4 2 5 节) 定义,其依赖于缩采的精度控箭选择。 5 ,b l o c k _ o u t _ a v 高电平有效的输出控制信号b l o c k0 u ta v 标示b l o c ko u t 氏 b l o c ko u tb ,b l o c ko u tc ,b l o c ko u td 端口输出数据有效。只要b l o c ko u t 人 b l o c ko u tb ,b l o c ko u tc ,b l o c ko u td 有一个有效鹈结果, b l o c k0 u ta v 就被声明且其延续一个处理时钟周期。b l o c ko u ta v 稻b l o c ko u t 气b l o c ko u tb ,b l o c ko u tc ,b l o c ko u td 液弼步至l t w o di d c tc l k 时钟信号的上升边。如图4 1 1 。 t w 。d _ i d c tc t k 肌肌几肌以几门九八门 ;,二d t ;j ;w 。;j ;- 二一 r e s e ti 一 :,伴、:,r “ b l o c ko u ta v : :,p :l e b k k _ o u ta 互z 弦虹) ( 型= ) ( 船履挺d b l o c k o u 弦琵珍s 匹x 磷鸯弦 b t 。c k _ o u ic z 冱琵匹) ( 叠= 囝 经挺如 b 妣k _ o u t p 夏夏z ( 匝艇必:二d 图4 “1 1 分布式快速畿接2 d - i d c t 核输出数据接口时序 6t w o d _ i d c tc l k 输入信号t w o d i d c t d k 怒全飚步的分布式快速直接2 d i d c t 投灼处 理时钟。 酉颇套退盎堂塑迥窒垒堂焦迨塞 篡! j 夏 7 r e s e t r e s e t ,复位信号,低电平有效。当蕊西有效时分布式快速直接2 d i d c t 棱被熨位,所鸯的内部状态枫笈位到初始值,即使是一缀数据已经输入绘按。 4 2 2 。2 双通道并行鲥帛行转换器接口 1 d a t a b u s a ,d a t a b u s b , d a t a b u s c ,d a t a b u s d 输入脚d a t a b u s a , d a t a b u s b ,d a t a b u s c ,d a t a b u s d 并行输入4 个1 2 位的数 据流到双通道辩串转换器。d a t a b u s a , d a t a b u s b ,d a t a b u s c ,d a t a b u s d 在8 8 鹩输入系数块中酶位鬣是按下标颓序的。当b u f _ r f d 棱拉齑强w e1 j 互设为 高时数据从这魑端口读入。如图4 1 2 。 t w o d _ i d c t k 几八八八八几八几几 ,7 p _ _ r e s e t 1 叫 莲馥稿潞冱弦互汇x 蛩互 d a t a b u s b 茏z 弘2 x 篷蛭弛 d a t a b u s c 乙弦z 妲x 匝阳 d a t a b u s d 兹z 玖王x 互姬) ( w e b u f 解d 鬻4 1 2 双遴遵并,率转换鬟援救数鬃猿酲时簿 2 、v e w e 是一个写控制信号。它标示在d a t a b u s a , d a t a b u s b ,d a t a b u s c , d a t a b u s d 端f 1 宥一个有效的输入数据。当输i l 控制信蹿b u fr f d 有效后高 电平有效韵w e 信号被使能,d a t a b u s a , d a t a b u s b ,d a t a b u s c ,d a t a b u s d 端l _ 】 亘费窑运蠢蹩亟瑟嚣皇堂健迨塞受垒夏 的数据披采样。本核工 乍在时钟靛上升边沿,因她w e 和d a t a b u s a , d a t a b u s b 。 d a t a b u s c ,d a t a b u s d 信号需要巍每个时钟的上升边之前稳定以避免任何的 竞争条件产生。 3 b u yr f i ) 高e 撼平有效的输出控制信号b u f _ r f d 标豕取通道并行到窜行转换器准 备好接受耨酌输入数据。当b u f _ r f d 有效时,w e 可以被使熊。b u fr f d 信号在t w o d _ i d c t _ c l k 时钟信号的上升边

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论