（计算机应用技术专业论文）浮点除法开方算法研究与电路设计.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-14 格式：PDF 页数：76 大小：1.73MB 积分：0 举报 版权申诉

已阅读5页，还剩71页未读，继续免费阅读

（计算机应用技术专业论文）浮点除法开方算法研究与电路设计.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

华北电力大学硕士学位论文摘要木课题的任务是为 l x - 1 1 6 4处理器芯片开方浮点处理器 ( f p u )中的超高速浮点除法/ 开方运算器 ( f d i v ) o 当前评价一个处理器性能的重要指标之一就是其浮点性能的好坏，而浮点除法单元又 f p u中的重要部件。本文探讨了当前使用较多的一些浮点除法/ 开方算法，并在设计中采用了改进的牛顿迭代来计算开方、使用 g o l d s c li m i d t 算法来实现除法。在浮点处理单元的硬件实现上，采用 a s i c的全定制电路设计方法，使用先进的e d a ( 设计工具进行逻辑设计与仿真。完全支持工 e e e 7 5 4 标准。在设计上突破传统思想的约束，采用了可重构技术，用相同的硬件来实现浮点除法和升方两种运算。关键词:浮点除法/ 开方算法电路设计牛顿迭代法 g o l d s c h m i d t 算法 abs tract t h e t a s k i s t o d e v e l o p a h i g h - s p e e d u n i t o f fl o a t i n g - p o i n t d i v i s i o n a n d s q u a r e - r o o t f o r f p u w h i c h b u i l d i n l x 1 1 6 4 g e n e r a l c p u . t o d a y , a i m p o r t a n t g u i d e l i n e f o r e v a l u a t i n g a c p u s p e r f o r m a n c e i s i t s fl o a t i n g - p o i n t o p e r a t i o n c a p a b i l i t y . f l o a t i n g - p o i n t d i v i s i o n u n i t i s a m a i n c o m p o - n e n t o f f p u. t h i s p a p e r d i s c u s s e s s o me a l g o r i t h m o f d i v i s i o n a n d s q u a r e r o o t . i n m y d e s i g n , i u s e i m p r o v e d n e w t o n a l g o r i t h m f o r s q u a r e r o o t a n d g o l d s c h m i d t a l - g o r i t h m f o r d i v i s i o n . t o h a r d w a r e i m p l e m e n t a t i o n , i u s e a s i c d e s i g n me t h o d a n d u s e a d v a n c e d e d a t o o l s t o d e s i g n l o g i c a n d s i m u l a t o r . t h i s u n i t i s a b s o l u t e l y c o m p a t i b l e w i t h i e e e 7 5 4 . i n t h i s u n i t ， w e a d o p t r e c o n f i g u r i n g t e c h n o l o g y . y a n j i a n g y u ( c o m p u t e r e n g i n e e r i n g ) d i r e c t e d b y p r o f . q u j u n h u a k e y wo r d s : f l o a t i n g - p o i n t , d i v i s i o n , s q u a r e - r o o t , a l g o r i t h m , c i r c u i t d e s i g n 华北电力大学硕士学位论文摘要木课题的任务是为 l x - 1 1 6 4处理器芯片开方浮点处理器 ( f p u )中的超高速浮点除法/ 开方运算器 ( f d i v ) o 当前评价一个处理器性能的重要指标之一就是其浮点性能的好坏，而浮点除法单元又 f p u中的重要部件。本文探讨了当前使用较多的一些浮点除法/ 开方算法，并在设计中采用了改进的牛顿迭代来计算开方、使用 g o l d s c li m i d t 算法来实现除法。在浮点处理单元的硬件实现上，采用 a s i c的全定制电路设计方法，使用先进的e d a ( 设计工具进行逻辑设计与仿真。完全支持工 e e e 7 5 4 标准。在设计上突破传统思想的约束，采用了可重构技术，用相同的硬件来实现浮点除法和升方两种运算。关键词:浮点除法/ 开方算法电路设计牛顿迭代法 g o l d s c h m i d t 算法 abstract t h e t a s k i s t o d e v e l o p a h i g h - s p e e d u n i t o f fl o a t i n g - p o i n t d i v i s i o n a n d s q u a r e - r o o t f o r f p u w h i c h b u i l d i n l x 1 1 6 4 g e n e r a l c p u . t o d a y , a i m p o r t a n t g u i d e l i n e f o r e v a l u a t i n g a c p u s p e r f o r m a n c e i s i t s fl o a t i n g - p o i n t o p e r a t i o n c a p a b i l i t y . f l o a t i n g - p o i n t d i v i s i o n u n i t i s a m a i n c o m p o - n e n t o f f p u. t h i s p a p e r d i s c u s s e s s o m e a l g o r i t h m o f d i v i s i o n a n d s q u a r e r o o t . i n m y d e s i g n , i u s e i m p r o v e d n e w t o n a l g o r i t h m f o r s q u a r e r o o t a n d g o l d s c h m i d t a l - g o r i t h m f o r d i v i s i o n . t o h a r d w a r e i m p l e m e n t a t i o n , i u s e a s i c d e s i g n m e t h o d a n d u s e a d v a n c e d e d a t o o l s t o d e s i g n l o g i c a n d s i m u l a t o r . t h i s u n i t i s a b s o l u t e l y c o m p a t i b l e w i t h i e e e 7 5 4 . i n t h i s u n i t ， w e a d o p t r e c o n f i g u r i n g t e c h n o l o g y . y a n j i a n g y u ( c o m p u t e r e n g i n e e r i n g ) d i r e c t e d b y p r o f . q u j u n h u a k e y wo r d s : f l o a t i n g - p o i n t , d i v i s i o n , s q u a r e - r o o t , a l g o r i t h m , c i r c u i t d e s i g n y7 ! 3 2 3 5 二丝. o口沂口明本人郑重声明: 所呈交的学位论文，是本人在导师指导下，独立进行研究工作所取得的成果。尽我所知，除文中已经注明引用的内容外，本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体，均已在文中以明确方式标明。特此申明。、名二 1取壑一日期 : 洲华( 之 . 乙。关于学位论文使用授权的说明 1 .本人完全了解华北电力大学有关保留、使用学位论文的规定，即: 学校有权保管、并向有关部门送交学位论文的原件与复印件; 学校可以采用影印、缩印或其它复制手段复制并保存学位论文; 学校可允许学位论文被查阅或借阅; 学校可以学术交流为目的，复制赠送和交换学位论文; 同意学校可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。 ( 涉密的学位论文在解密后遵守此规定 ) 作者签名 : t ; z 导师签名: 日期 : 丫什 . ( 2 - iv 日期: 华北电力大学硕士学位论文第i 章引言随着科技的进步和社会的发展，计算机已经在我们的日常生活、工农业生产和科学研究中取得了广泛的应用。 c p u是计算机的核心， c p u的性能决定着计算机的性能、进而决定着整个系统的性能。在 c p u所处理的数据主要有两种表示方式:定点数和浮点数。其中定点数表示范围小，但其实现简单，主要包括一些文档字符处理，普通数值计算以及以及生产管理系统等。浮点数由于其表数范围大，精度高，实现复杂，最初主要应用在需要使用精确数值进行计算的科学研究领域，比如气象预报、工程计算和图像处理等。随着计算机的应用日益广泛和集成电路制造工艺的发展，浮点数据的应用范围也越来越广，不仅在科学研究，而且在工业生产和日常生活中的许多方面都需要浮点数来增强运算能力。现在很普遍的 3 d电脑游戏、多媒体播放，图像图形处理等都是浮点数在日常生活中的典型应用。因此浮点运算能力成为继频率后评价c p u性能的又一指标，浮点运算能力的高低不仅决定了该 c p u的性能，而且决定了该 c p u的应用领域。在早期的 c p u中，浮点运算单元 ( f p u)并不是集成在 c p u内部，而是作为一个单独的芯片浮点协处理器于c p u协同工作。随着v l s i 制造工艺的发展，在一块硅片上可以集成更多的电路，从8 0 4 8 6 d x c p u开始，f p u就集成到了c p u内部。目前市场中的各种通用处理器中都集成了浮点运算单元，甚至某些嵌入式处理器中也支持浮点运算。下表是目前常用的高端c p u在每个时钟周期能执行浮点运算的次数: 巨一吧pa 一卜一膘_ 一煎丁诬萨_ 画一 f 咒一 c 一一:件臀鳄竺缨竺 e npart 22 _一 i b m p o we r 4 h p q p a - r i s c h p q 灿p l a a l s 6 mi ps i n t e l i n t e l ita n u m (p e n ti u m f lo p sc : c l e 442 一i2 2 i t 一图 1 我国的通用 c p u产业目前还处子起步阶段，许多专家学者都在致力于研究自己特色的 c p u。去年，中科院计算所发布了他们研制的龙芯 2通用 c p u，主频为 s o o mh z ，性能达到了pln 的水平。北京凝思科技有限公司在总裁宫敏博士带领下研制基于安全服务器的6 4 位通用处理器l x-1 1 6 4 a凝思公司是以承担国家8 6 3 信息安全项目而设立的高新技术企业。公司的目标是设计和生产出具有完全自主知识产权的处理器和操作系统的高安全服务器系统，填补我国在信息安全关键技术领域的空白。首先让我们简要回顾一下浮点单元及浮点乘、除法器的发展历史和现状. 华北电力大学硕士学位论文 1 . 1 i n t e 1 8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 , 8 0 4 8 6 这四种算术协处理器芯片皆由美国i n t e l 公司设计生产。8 0 8 7协处理器是 1 9 7 9 年引入 8 0 8 6 / 8 0 8 8 微处理机系统。1 9 8 2 年又把 8 0 2 8 7引入 8 0 2 8 6 微机系统。三年以后，继8 0 3 8 6 3 2 位微处理机问世一年后， 8 0 3 8 7 也随之问世。上述几种c p u均采用 c i s c体系结构，且 . f p u是单独的芯片。1 9 8 9 年4 月，i n t e l 公司推出了向r i s c体系结构转型的新产品8 0 4 8 6 . 8 0 4 8 6 在c p u芯片中集成了浮点运算单元f p u ，使其浮点处理能力是 8 0 3 8 7的 3 - 5 倍。8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 及 8 0 4 8 6 都使用 8 0 位内h is 结构，实现了i e e e浮点格式，包括3 2 位单精度、 6 4 位双精度和 8 0 位扩展精度等。其中8 0 8 7 , 8 0 2 8 7 支持推荐的i e e e 7 5 4 标准; 8 0 3 8 7 支持最终的i e e e 7 5 4 标准; 8 0 4 8 6 支持i e e e 7 5 4 与8 5 4 标准。下面我们再对f p u中的乘、除法器 ( f mu l )的运算性能进行一下分析并列于表 t o 表 1 浮点单元名称浮点乘法器运算所需周期数浮点除法器运算所需周期数主频 ( mh z ) 8 0 2 8 7 8 5 一1 1 0 1 9 8 一2 2 51 6 8 0 3 8 7 2 7 一5 78 9 - 9 4 2 5 8 0 4 8 6 1 9 -2 73 9 5 0 i n t e l p e n t i u m 1 9 9 3 年3 月i n t e l 公司推出了新一代产品p e n t i u m此产品采用0 . 8 t m c mo s 工作主频6 0 - 6 6 mh z 。内含算术协处理器，支持 i e e e 7 5 4 与8 5 4 位内部结构。p e n t i u m在浮点部件上与 8 0 4 8 6相比，做了重大改进。标准，使用8 0 由于引入流水勺乙， l.艺线技术，其浮点单元f p u一般可每个周期接受一条浮点操作指令。 f p u共有 8 级流水级，包括预取指令 ( p f ) :指令译码 d 1 ) :地址生成 ( 1 3 2 ) ;读存储器和寄存器 ( e x) ;浮点执行级 1 ( x l ) ;浮点执行级 2 ( x 2 ) ;舍入和回写 ( wf ) ;报告出错及更改状态字 e r ) . 1 . 3 i n t e l 8 0 8 6 0( 1 8 6 0 ) i n t e l 8 0 8 6 0 是i n t e l 公司于8 0 年代末开发的超标量r i s c芯片。采用1 g m c mo s 工艺，工作主频 4 0 mh z 。其浮点单元 f p u主要由浮点控制部件、浮点加法部件和浮点乘法部件组成。支持i e e e 7 5 4的单精度和双精度两种数据格式，并有两种操作方式，标量方式或流水线方式。在标量方式下，需六个周期完成一个单精度浮点乘法，需九个周期完成一个双精度浮点乘法.在流水线方式下，一个时钟周期即可完华北电力大学硕士学位论文 1 . 1 i n t e 1 8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 , 8 0 4 8 6 这四种算术协处理器芯片皆由美国i n t e l 公司设计生产。8 0 8 7协处理器是 1 9 7 9 年引入 8 0 8 6 / 8 0 8 8 微处理机系统。1 9 8 2 年又把 8 0 2 8 7引入 8 0 2 8 6 微机系统。三年以后，继8 0 3 8 6 3 2 位微处理机问世一年后， 8 0 3 8 7 也随之问世。上述几种c p u均采用 c i s c体系结构，且 . f p u是单独的芯片。1 9 8 9 年4 月，i n t e l 公司推出了向r i s c体系结构转型的新产品8 0 4 8 6 . 8 0 4 8 6 在c p u芯片中集成了浮点运算单元f p u ，使其浮点处理能力是 8 0 3 8 7的 3 - 5 倍。8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 及 8 0 4 8 6 都使用 8 0 位内h is 结构，实现了i e e e浮点格式，包括3 2 位单精度、 6 4 位双精度和 8 0 位扩展精度等。其中8 0 8 7 , 8 0 2 8 7 支持推荐的i e e e 7 5 4 标准; 8 0 3 8 7 支持最终的i e e e 7 5 4 标准; 8 0 4 8 6 支持i e e e 7 5 4 与8 5 4 标准。下面我们再对f p u中的乘、除法器 ( f mu l )的运算性能进行一下分析并列于表 t o 表 1 浮点单元名称浮点乘法器运算所需周期数浮点除法器运算所需周期数主频 ( mh z ) 8 0 2 8 7 8 5 一1 1 0 1 9 8 一2 2 51 6 8 0 3 8 7 2 7 一5 78 9 - 9 4 2 5 8 0 4 8 6 1 9 -2 73 9 5 0 i n t e l p e n t i u m 1 9 9 3 年3 月i n t e l 公司推出了新一代产品p e n t i u m此产品采用0 . 8 t m c mo s 工作主频6 0 - 6 6 mh z 。内含算术协处理器，支持 i e e e 7 5 4 与8 5 4 位内部结构。p e n t i u m在浮点部件上与 8 0 4 8 6相比，做了重大改进。标准，使用8 0 由于引入流水勺乙， l.艺线技术，其浮点单元f p u一般可每个周期接受一条浮点操作指令。 f p u共有 8 级流水级，包括预取指令 ( p f ) :指令译码 d 1 ) :地址生成 ( 1 3 2 ) ;读存储器和寄存器 ( e x) ;浮点执行级 1 ( x l ) ;浮点执行级 2 ( x 2 ) ;舍入和回写 ( wf ) ;报告出错及更改状态字 e r ) . 1 . 3 i n t e l 8 0 8 6 0( 1 8 6 0 ) i n t e l 8 0 8 6 0 是i n t e l 公司于8 0 年代末开发的超标量r i s c芯片。采用1 g m c mo s 工艺，工作主频 4 0 mh z 。其浮点单元 f p u主要由浮点控制部件、浮点加法部件和浮点乘法部件组成。支持i e e e 7 5 4的单精度和双精度两种数据格式，并有两种操作方式，标量方式或流水线方式。在标量方式下，需六个周期完成一个单精度浮点乘法，需九个周期完成一个双精度浮点乘法.在流水线方式下，一个时钟周期即可完华北电力大学硕士学位论文成一个乘法运算。其六个流水级为:取指令级 ( f ) ;译码级 ( d) ;三个浮点执行级 ( el 、e 2 , e 3 )以及写回结果 ( w) 。在执行双精度乘法运算时，执行级需加倍。 1 . 4 1 . 4 . 1 p o we r p c系列处理由美国i b m, a p p l e 和m o t o r o l a 公司联合开发的微处理器芯片。 p o we r p c 6 0 1 采用。 6 p m c mo s 工艺，工作主频5 0 1 6 6 m h z o f p u采用五级流水，包括取指级 ( f i ) :译码级 ( f d ) :乘法执行级 ( f p m) :加法执行级 ( f p a ) ;规格化/ 舍入及回写级 n o r m a l iz e r , r o u n d e r , f w a ) o这样把乘法和加法作为两个流水级，可高效地完成a x + b运算，且只进行一次舍入，不仅速度快且精度高。但同样也使单独的乘法和加法运算产生了冗余。浮点乘法阶段f p m每个时钟周期完成2 7 位 x 5 3 位的计算。因为双精度乘法要求5 3 位 x 5 3 位，所以，有关双精度的乘法及加乘运算在该阶段均占用两个周期。不仅如此，双精度的乘法及加乘运算在f d和f p a阶段同样需要两个成功的周期。双精度的除法运算需要在f d , f p m和f p a阶段循环往复。也就是说，完成一个单精度浮点乘法运算需要5 个周期，完成一个双精度浮点乘法运算需要8 个周期，除法运算需要多个乘法周期。 1 . 4 . 2 p o we r p c 6 0 3 采用。 . 5 p m c m o s 工艺，工作主频8 0 m h z . p o w e r p c 6 0 3 的浮点功能与p o w e r p c 6 0 1 基本一致，只是把低能耗技术应用到了f p u上。在硬件上支持所有i e e e 7 5 4 浮点数据类型 ( 规格化、反规格化、非数 n a n,零和无穷大) ，消除了软件异常例程引发的执行时间。 1 . 5旧m r s 1 6 0 0 0 r s / 6 0 0 0 的全称是r i s c system/6000。它是i b m公司1 9 8 6 年开始实施的第二代r i s c产品系列。它实现了i e e e 7 5 4 二进制浮点标准，执行一条乘加指令共需8 个周期。华北电力大学硕士学位论文成一个乘法运算。其六个流水级为:取指令级 ( f ) ;译码级 ( d) ;三个浮点执行级 ( el 、e 2 , e 3 )以及写回结果 ( w) 。在执行双精度乘法运算时，执行级需加倍。 1 . 4 1 . 4 . 1 p o we r p c系列处理由美国i b m, a p p l e 和m o t o r o l a 公司联合开发的微处理器芯片。 p o we r p c 6 0 1 采用。 6 p m c mo s 工艺，工作主频5 0 1 6 6 m h z o f p u采用五级流水，包括取指级 ( f i ) :译码级 ( f d ) :乘法执行级 ( f p m) :加法执行级 ( f p a ) ;规格化/ 舍入及回写级 n o r m a l iz e r , r o u n d e r , f w a ) o这样把乘法和加法作为两个流水级，可高效地完成a x + b运算，且只进行一次舍入，不仅速度快且精度高。但同样也使单独的乘法和加法运算产生了冗余。浮点乘法阶段f p m每个时钟周期完成2 7 位 x 5 3 位的计算。因为双精度乘法要求5 3 位 x 5 3 位，所以，有关双精度的乘法及加乘运算在该阶段均占用两个周期。不仅如此，双精度的乘法及加乘运算在f d和f p a阶段同样需要两个成功的周期。双精度的除法运算需要在f d , f p m和f p a阶段循环往复。也就是说，完成一个单精度浮点乘法运算需要5 个周期，完成一个双精度浮点乘法运算需要8 个周期，除法运算需要多个乘法周期。 1 . 4 . 2 p o we r p c 6 0 3 采用。 . 5 p m c m o s 工艺，工作主频8 0 m h z . p o w e r p c 6 0 3 的浮点功能与p o w e r p c 6 0 1 基本一致，只是把低能耗技术应用到了f p u上。在硬件上支持所有i e e e 7 5 4 浮点数据类型 ( 规格化、反规格化、非数 n a n,零和无穷大) ，消除了软件异常例程引发的执行时间。 1 . 5旧m r s 1 6 0 0 0 r s / 6 0 0 0 的全称是r i s c system/6000。它是i b m公司1 9 8 6 年开始实施的第二代r i s c产品系列。它实现了i e e e 7 5 4 二进制浮点标准，执行一条乘加指令共需8 个周期。华北电力大学硕十学位论文 1 .6 mi p s ( m i c r o p r o c e e s s o r wit h o u t i n t e r l o c k e d p i p e d s t a g e e s ) 系列产品由美国mi p s公司设计生产的当今世界上较流行的一种r i s c处理器。 1 . 6 . 1 m i p s 8 2 0 1 0 其浮点处理器 f p a有六级流水，包括取指令 ( i f ) 、读取指令 ( r d ) 、两个浮点执行级 ( e l , e 2 ) 、处理异常 ( me m wb )和回写 ( f wb ) 。相对于 8 2 0 0 0所增加的f p a流水线工序可以在f p a与主处理器之间更好地协调异常响应。 1 . 6 . 2 mi ps 8 3 0 1 0 与8 2 0 1 0 基本相似， f p a六级流水线，取指 ( i f ) 、读数据 ( r d ) 、执行 1 ( e i ) , 执行 2 ( e 2 ) 、处理异常 ( wb ) 和回写 ( f wb ) . 8 3 0 1 0 充分利用内部操作的并行性，可允许几条f p a指令重叠执行，以提高流水线效率。 1 . 6 . 3 mi p s 8 4 0 0 0 mi p s 8 4 0 0 0 把整个浮点部件 ( f p u) 做在芯片上。 f p u支持i e f e 7 5 4 标准的单精度和双精度算术运算。一个完整的单精度乘法运算需要7 个周期，双精度乘法运算需要 8个周期。一个完整的单精度除法运算需要 2 3个周期，双精度除法运算需要 3 6 个周期。 1 . 7 s u p e r s p a r c 美国德州仪器公司 ( t i )为 s u n微系统公司生产的第四代 s p a r c ，采用超标量 r i s c体系结构。其浮点部件 ( f p u )实际上是一个流水线的浮点处理器，可对单双精度数进行操作。它包括一个浮点控制器f p c ，以及两个独立的流水线:浮点加法器 ( f a d d e r )和乘法器 ( f m u l t i p l i e r ) 。所有的浮点指令都是在这两个独立部件中的一个中执行。浮点乘法器 ( f mu l t i p l i e r )是完全流水线结构，包括以下四个流水级: ( 玲f r d :译码和读出; ( 2 ) f m:执行乘法: ( 3 ) f n / f r :规格化和舍入; ( 4 ) f wb :写回到浮点寄存器堆。 f mu l t i p l i e r执行乘法和除法运算。每个周期它可启始一次单精度或双精度华北电力大学硕十学位论文 1 .6 mi p s ( m i c r o p r o c e e s s o r wit h o u t i n t e r l o c k e d p i p e d s t a g e e s ) 系列产品由美国mi p s公司设计生产的当今世界上较流行的一种r i s c处理器。 1 . 6 . 1 m i p s 8 2 0 1 0 其浮点处理器 f p a有六级流水，包括取指令 ( i f ) 、读取指令 ( r d ) 、两个浮点执行级 ( e l , e 2 ) 、处理异常 ( me m wb )和回写 ( f wb ) 。相对于 8 2 0 0 0所增加的f p a流水线工序可以在f p a与主处理器之间更好地协调异常响应。 1 . 6 . 2 mi ps 8 3 0 1 0 与8 2 0 1 0 基本相似， f p a六级流水线，取指 ( i f ) 、读数据 ( r d ) 、执行 1 ( e i ) , 执行 2 ( e 2 ) 、处理异常 ( wb ) 和回写 ( f wb ) . 8 3 0 1 0 充分利用内部操作的并行性，可允许几条f p a指令重叠执行，以提高流水线效率。 1 . 6 . 3 mi p s 8 4 0 0 0 mi p s 8 4 0 0 0 把整个浮点部件 ( f p u) 做在芯片上。 f p u支持i e f e 7 5 4 标准的单精度和双精度算术运算。一个完整的单精度乘法运算需要7 个周期，双精度乘法运算需要 8个周期。一个完整的单精度除法运算需要 2 3个周期，双精度除法运算需要 3 6 个周期。 1 . 7 s u p e r s p a r c 美国德州仪器公司 ( t i )为 s u n微系统公司生产的第四代 s p a r c ，采用超标量 r i s c体系结构。其浮点部件 ( f p u )实际上是一个流水线的浮点处理器，可对单双精度数进行操作。它包括一个浮点控制器f p c ，以及两个独立的流水线:浮点加法器 ( f a d d e r )和乘法器 ( f m u l t i p l i e r ) 。所有的浮点指令都是在这两个独立部件中的一个中执行。浮点乘法器 ( f mu l t i p l i e r )是完全流水线结构，包括以下四个流水级: ( 玲f r d :译码和读出; ( 2 ) f m:执行乘法: ( 3 ) f n / f r :规格化和舍入; ( 4 ) f wb :写回到浮点寄存器堆。 f mu l t i p l i e r执行乘法和除法运算。每个周期它可启始一次单精度或双精度华北电力大学硕士学位论文乘法操作。除法按非流水线机制执行，占若干个乘法周期。f mu l t i p l i e r支持非规格化数，但会有多达五个周期的时间代价。乘法运算需要 3 个周期完成，单精度除法运算需要 6 个周期完成，双精度除法运算需要 9 个周期完成。从上面的介绍中，我们可以看到，目前国外一些大的计算机厂商所生产的c p u 的浮点单元的浮点乘、除法器的主要性能指标。目前我国c p u还没有形成产业，只是处在研究阶段。为了发展民族的c p u工业，许多专家学者都在致力研究有自己特色的 c p u。本人有幸在夏宏副教授的指导下参加这一工程，承担凝思公司 l x 1 1 6 4 c p u的 i u , f p u的一些功能部件的逻辑设计与仿真工作。其中一项重要工作就是研制高性能的浮点除法/ 开方运算器 ( f d i v ) o 我们所研制的f d i v ，采用0 . 1 8 p m c m o s 工艺; 工作主频4 0 0 m h z ; 硬件完全支持i e e e 7 5 4 浮点标准。单精度除法运算7 个周期完成，双精度除法运算9 个周期完成;双精度开方运算 1 2个周期完成，单精度除法运算 9个周期完成。在支持反规格化数方面不需要额外的时间代价。 f d i v将采用a s i c ( a p p l i c a t i o n s p e c i f i c i n t e g r a t e d c i r c u i t ) 的全定制电路的设计方法，使用先进的e d a ( e l e c t r o n i c d e s i g n a u t o m a t i o n ) 设计i具进行逻辑设计与仿真。华北电力大学硕士学位论文第2 章 i e e e 7 5 4浮点标准介绍我所设计的浮点除法、开方运算器是以1 9 8 5 年由i e e e ( i n s t i t u t e o f e l e c t r i c a l a n d e l e c t r o n i c s e n g i n e e r s )制定的浮点标准a n s i / i e e e s t d . 7 5 4 - 1 9 8 5( 简称i e e e 7 5 4 ) 为依据的。 i e e e 7 5 4 标准是目前使用最广泛的浮点标准，它应用于当代所有处理器和算术协处理器中。 i e e e 7 5 4 浮点标准包括浮点数的格式、算术计算精度以及异常情况处理等三个方面。 2 . 1浮点数的格式 i e e e 7 5 4 标准定义了四种浮点标准:3 2 位单精度、扩展单精度、6 4 位双精度和扩展双精度。 2 . 1 . 1 单精度格式单精度格式:即二进制浮点数的3 2 位格式，如图 2 所示。此格式由一位符号 s . 8 位的偏码指数 e以及2 3 位的原码尾数f组成。指数偏码的偏移量为 1 2 7 .单精度浮点数的值 v 有五种情形。 n 号叫移码叫原码尾数图 2 3 2 位单精度格式如果e =2 5 5 ，且f :p l- 0 ，则v =n a n ，即v是非数; 如果e = 2 5 5 ，且f = o ，则v = ( - i ) s x -，即v =1 -; 如果。 e 2 5 5 ，则v = ( - 1 ) s x 2 e - 1 2 1 x i .f ，则v 是正常的浮点数; 如果e = 0 ，且f # o ，则v = ( - 1 ) s x 2 e - 1 2 6 x o .f ，即v 是反规格化数; 如果e = 0 ，且介。，则v = ( - 1 ) s x o ，即v = 士。。为了保持高精度，以上定义中采用基数为 “ 2 ，并且尾数f的最左有效位不表示规格化数，这样可使指数场中的位数增加一位，由小数点左边的一个显示 ( 运算时 ) 或隐式( 存储时，又叫隐含位) 前导位( 0 或1 ) 与小数点右边的尾数f 组成的一个二进制数部分，叫做有效数( s i g n i f i c a n d ) 。即华北电力大学硕士学位论文第2 章 i e e e 7 5 4浮点标准介绍我所设计的浮点除法、开方运算器是以1 9 8 5 年由i e e e ( i n s t i t u t e o f e l e c t r i c a l a n d e l e c t r o n i c s e n g i n e e r s )制定的浮点标准a n s i / i e e e s t d . 7 5 4 - 1 9 8 5( 简称i e e e 7 5 4 ) 为依据的。 i e e e 7 5 4 标准是目前使用最广泛的浮点标准，它应用于当代所有处理器和算术协处理器中。 i e e e 7 5 4 浮点标准包括浮点数的格式、算术计算精度以及异常情况处理等三个方面。 2 . 1浮点数的格式 i e e e 7 5 4 标准定义了四种浮点标准:3 2 位单精度、扩展单精度、6 4 位双精度和扩展双精度。 2 . 1 . 1 单精度格式单精度格式:即二进制浮点数的3 2 位格式，如图 2 所示。此格式由一位符号 s . 8 位的偏码指数 e以及2 3 位的原码尾数f组成。指数偏码的偏移量为 1 2 7 .单精度浮点数的值 v 有五种情形。 n 号叫移码叫原码尾数图 2 3 2 位单精度格式如果e =2 5 5 ，且f :p l- 0 ，则v =n a n ，即v是非数; 如果e = 2 5 5 ，且f = o ，则v = ( - i ) s x -，即v =1 -; 如果。 e 2 5 5 ，则v = ( - 1 ) s x 2 e - 1 2 1 x i .f ，则v 是正常的浮点数; 如果e = 0 ，且f # o ，则v = ( - 1 ) s x 2 e - 1 2 6 x o .f ，即v 是反规格化数; 如果e = 0 ，且介。，则v = ( - 1 ) s x o ，即v = 士。。为了保持高精度，以上定义中采用基数为 “ 2 ，并且尾数f的最左有效位不表示规格化数，这样可使指数场中的位数增加一位，由小数点左边的一个显示 ( 运算时 ) 或隐式( 存储时，又叫隐含位) 前导位( 0 或1 ) 与小数点右边的尾数f 组成的一个二进制数部分，叫做有效数( s i g n i f i c a n d ) 。即华北电力大学硕士学位论文第种情形说明没有数学解释的操作( 例如。 = 0 ) 将产生一个非数 n a n ( n o t - a - n u m b e r ) ; 第种情形表示正负无穷大数; 第种情形是规格化数的表示，它定义为非零的数，且其最左有效数位为 1 。如果最左有效数位是 0 ，则变成第种情形的非正常 0 .规格化不改变指数采用偏移码，并且偏移码的选择是这样的: 可以表示所有规格数的例数，而不会引起指数溢出。情形中p具有最小的指数，有效数的显式或隐式前导( 最左) 位是。 ;这个数不是一个正常零，叫做反规格化 ( d e n o m a i z e d ) 数，反规格化数是给定格式中作为下溢出的违章结果，它不是为扩充指数范围而设计的，而是牺牲一些精度来换取尽可能长的，允许进一步计算，以判定该下溢出是否将成为有意义的结果。因为最小的规格化数为t = 2 - 1 2 6 。故反规格化数就是在。 2 - 1 2 6 之间的数。反规格化数只对单精度与双精度格式定义，对于采用反规格化数表示下溢值的下溢出，叫做逐级下溢( g r a d u a l u n d e r fl o w ) . 第种情形也具有最小的指数，而且有效数为0 ，但符号位可以是正的或负的，这个数称为正常零。在 i e e e标准中由于浮点有效数采用原码表示，于是就有两个零: 十 0 与一 0 。标准中规定0 -0 =十。，而一( 。 ) = 一。。于是当x =。时，-x和0 -x 是不同的。 2 . 1 . 2 双精度格式双精度格式是二进制浮点数的6 4 位格式，如图 3 所示，此格式由一位符号位 s , 1 1 位的偏移指数e ，以及 5 2 位的尾数f 组成。指数偏码的偏移量为 1 0 2 3 。双精度浮点数的值也分五种情形: 巨一， “ 一杆一 - .- 二位 .- 一符号淤奖醚一.,_ taat., 图 3 6 4 位双精度格式如果。 = 2 0 4 7 ，且f -? ,- 0 ，则v = n a n; 如果e = 2 0 4 7 ，且f = 0 , v = ( - i ) i x -，即v =士 co 如果。 e 2 0 4 7 , v = ( - 1 ) s x 2 e - 10 2 3 x i .f ; 如果e = 0 ，且f # 0 , v = ( - 1 ) x 2 e - 1 0 2 2 x o .f ; 如果e = 0 ，且卜。， v = ( - 1 ) s x o , 双精度格式的指数是这样选择的，起 6 4 位格式的溢出。即 v = 0 . 使得 8个 3 2位的单精度数的乘积也不会引华北电力大学硕士学位论文第种情形说明没有数学解释的操作( 例如。 = 0 ) 将产生一个非数 n a n ( n o t - a - n u m b e r ) ; 第种情形表示正负无穷大数; 第种情形是规格化数的表示，它定义为非零的数，且其最左有效数位为 1 。如果最左有效数位是 0 ，则变成第种情形的非正常 0 .规格化不改变指数采用偏移码，并且偏移码的选择是这样的: 可以表示所有规格数的例数，而不会引起指数溢出。情形中p具有最小的指数，有效数的显式或隐式前导( 最左) 位是。 ;这个数不是一个正常零，叫做反规格化 ( d e n o m a i z e d ) 数，反规格化数是给定格式中作为下溢出的违章结果，它不是为扩充指数范围而设计的，而是牺牲一些精度来换取尽可能长的，允许进一步计算，以判定该下溢出是否将成为有意义的结果。因为最小的规格化数为t = 2 - 1 2 6 。故反规格化数就是在。 2 - 1 2 6 之间的数。反规格化数只对单精度与双精度格式定义，对于采用反规格化数表示下溢值的下溢出，叫做逐级下溢( g r a d u a l u n d e r fl o w ) . 第种情形也具有最小的指数，而且有效数为0 ，但符号位可以是正的或负的，这个数称为正常零。在 i e e e标准中由于浮点有效数采用原码表示，于是就有两个零: 十 0 与一 0 。标准中规定0 -0 =十。，而一( 。 ) = 一。。于是当x =。时，-x和0 -x 是不同的。 2 . 1 . 2 双精度格式双精度格式是二进制浮点数的6 4 位格式，如图 3 所示，此格式由一位符号位 s , 1 1 位的偏移指数e ，以及 5 2 位的尾数f 组成。指数偏码的偏移量为 1 0 2 3 。双精度浮点数的值也分五种情形: 巨一， “ 一杆一 - .- 二位 .- 一符号淤奖醚一.,_ taat., 图 3 6 4 位双精度格式如果。 = 2 0 4 7 ，

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）浮点除法开方算法研究与电路设计.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）浮点除法开方算法研究与电路设计.pdf

文档简介

温馨提示

最新文档

评论

相关文档