




已阅读5页,还剩71页未读, 继续免费阅读
(计算机应用技术专业论文)浮点除法开方算法研究与电路设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华北电力大学硕士学位论文 摘要 木课题的任务是为 l x - 1 1 6 4处理器芯片开方浮点处理器 ( f p u )中的超高 速浮点除法/ 开方运算器 ( f d i v ) o 当前评价一个处理器性能的重要指标之一就是其浮点性能的好坏, 而浮点 除法单元又 f p u中的重要部件。本文探讨了当前使用较多的一些浮点除法/ 开 方算法,并在设计中采用了改进的牛顿迭代来计算开方、 使用 g o l d s c li m i d t 算法 来实现除法。 在浮点处理单元的硬件实现上,采用 a s i c的全定制电路设计方法,使用 先进的e d a ( 设计工具进行逻辑设计与仿真。完全支持 工 e e e 7 5 4 标准。在设计 上突破传统思想的约束, 采用了可重构技术, 用相同的硬件来实现浮点除法和 升方两种运算。 关键词:浮点除法/ 开方 算法 电路设计 牛顿迭代法 g o l d s c h m i d t 算法 abs tract t h e t a s k i s t o d e v e l o p a h i g h - s p e e d u n i t o f fl o a t i n g - p o i n t d i v i s i o n a n d s q u a r e - r o o t f o r f p u w h i c h b u i l d i n l x 1 1 6 4 g e n e r a l c p u . t o d a y , a i m p o r t a n t g u i d e l i n e f o r e v a l u a t i n g a c p u s p e r f o r m a n c e i s i t s fl o a t i n g - p o i n t o p e r a t i o n c a p a b i l i t y . f l o a t i n g - p o i n t d i v i s i o n u n i t i s a m a i n c o m p o - n e n t o f f p u. t h i s p a p e r d i s c u s s e s s o me a l g o r i t h m o f d i v i s i o n a n d s q u a r e r o o t . i n m y d e s i g n , i u s e i m p r o v e d n e w t o n a l g o r i t h m f o r s q u a r e r o o t a n d g o l d s c h m i d t a l - g o r i t h m f o r d i v i s i o n . t o h a r d w a r e i m p l e m e n t a t i o n , i u s e a s i c d e s i g n me t h o d a n d u s e a d v a n c e d e d a t o o l s t o d e s i g n l o g i c a n d s i m u l a t o r . t h i s u n i t i s a b s o l u t e l y c o m p a t i b l e w i t h i e e e 7 5 4 . i n t h i s u n i t , w e a d o p t r e c o n f i g u r i n g t e c h n o l o g y . y a n j i a n g y u ( c o m p u t e r e n g i n e e r i n g ) d i r e c t e d b y p r o f . q u j u n h u a k e y wo r d s : f l o a t i n g - p o i n t , d i v i s i o n , s q u a r e - r o o t , a l g o r i t h m , c i r c u i t d e s i g n 华北电力大学硕士学位论文 摘要 木课题的任务是为 l x - 1 1 6 4处理器芯片开方浮点处理器 ( f p u )中的超高 速浮点除法/ 开方运算器 ( f d i v ) o 当前评价一个处理器性能的重要指标之一就是其浮点性能的好坏, 而浮点 除法单元又 f p u中的重要部件。本文探讨了当前使用较多的一些浮点除法/ 开 方算法,并在设计中采用了改进的牛顿迭代来计算开方、 使用 g o l d s c li m i d t 算法 来实现除法。 在浮点处理单元的硬件实现上,采用 a s i c的全定制电路设计方法,使用 先进的e d a ( 设计工具进行逻辑设计与仿真。完全支持 工 e e e 7 5 4 标准。在设计 上突破传统思想的约束, 采用了可重构技术, 用相同的硬件来实现浮点除法和 升方两种运算。 关键词:浮点除法/ 开方 算法 电路设计 牛顿迭代法 g o l d s c h m i d t 算法 abstract t h e t a s k i s t o d e v e l o p a h i g h - s p e e d u n i t o f fl o a t i n g - p o i n t d i v i s i o n a n d s q u a r e - r o o t f o r f p u w h i c h b u i l d i n l x 1 1 6 4 g e n e r a l c p u . t o d a y , a i m p o r t a n t g u i d e l i n e f o r e v a l u a t i n g a c p u s p e r f o r m a n c e i s i t s fl o a t i n g - p o i n t o p e r a t i o n c a p a b i l i t y . f l o a t i n g - p o i n t d i v i s i o n u n i t i s a m a i n c o m p o - n e n t o f f p u. t h i s p a p e r d i s c u s s e s s o m e a l g o r i t h m o f d i v i s i o n a n d s q u a r e r o o t . i n m y d e s i g n , i u s e i m p r o v e d n e w t o n a l g o r i t h m f o r s q u a r e r o o t a n d g o l d s c h m i d t a l - g o r i t h m f o r d i v i s i o n . t o h a r d w a r e i m p l e m e n t a t i o n , i u s e a s i c d e s i g n m e t h o d a n d u s e a d v a n c e d e d a t o o l s t o d e s i g n l o g i c a n d s i m u l a t o r . t h i s u n i t i s a b s o l u t e l y c o m p a t i b l e w i t h i e e e 7 5 4 . i n t h i s u n i t , w e a d o p t r e c o n f i g u r i n g t e c h n o l o g y . y a n j i a n g y u ( c o m p u t e r e n g i n e e r i n g ) d i r e c t e d b y p r o f . q u j u n h u a k e y wo r d s : f l o a t i n g - p o i n t , d i v i s i o n , s q u a r e - r o o t , a l g o r i t h m , c i r c u i t d e s i g n y7 ! 3 2 3 5 二丝. o口 沂 口明 本人郑重声明: 所呈交的学位论文, 是本人在导师指导下, 独立进行研究工作所取 得的成果。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含任 何他人享有著作权的内容。 对本论文所涉及的研究工作做出贡献的其他个人和集体, 均 已在文中以明确方式标明。 特此 申明。 、 名 二 1取壑 一 日 期 : 洲 华( 之 . 乙 。 关于学位论文使用授权的说明 1 .本人完全了解华北电力大学有关保留、使用学位论文的规定,即: 学校有权保管、并向 有关部门 送交学位论文的原件与复印 件; 学校可以 采用影印、 缩印或其它复制手段复制并 保 存学位论文; 学校可允许学位论文被查阅或借阅; 学校可以 学术交流为目 的 , 复制赠送和交 换学位论文; 同意学校可以用不同方式在不同媒体上发表、 传播学位论文的全部或部分内 容。 ( 涉密的学位论文在解密后遵守此规定 ) 作 者 签 名 : t ; z 导师签名: 日期 : 丫什 . ( 2 - iv 日期: 华北电力大学硕士学位论文 第i 章引言 随着科技的进步和社会的发展,计算机已经在我们的日常生活、工农业生产和 科学研究中取得了广泛的应用。 c p u是计算机的核心, c p u的性能决定着计算机的 性能、 进而决定着整个系统的性能。 在 c p u所处理的数据主要有两种表示方式:定 点数和浮点数。其中定点数表示范围小,但其实现简单,主要包括一些文档字符处 理,普通数值计算以及以及生产管理系统等。浮点数由于其表数范围大,精度高, 实现复杂,最初主要应用在需要使用精确数值进行计算的科学研究领域,比如气象 预报、工程计算和图像处理等。随着计算机的应用日益广泛和集成电路制造工艺的 发展,浮点数据的应用范围也越来越广,不仅在科学研究,而且在工业生产和日常 生活中的许多方面都需要浮点数来增强运算能力。现在很普遍的 3 d电脑游戏、多 媒体播放,图像图形处理等都是浮点数在日常生活中的典型应用。 因此浮点运算能力成为继频率后评价c p u性能的又一指标, 浮点运算能力的高 低不仅决定了该 c p u的性能,而且决定了该 c p u的应用领域。在早期的 c p u中, 浮点运算单元 ( f p u)并不是集成在 c p u内部,而是作为一个单独的芯片浮点协处 理器于c p u协同工作。随着v l s i 制造工艺的发展, 在一块硅片上可以集成更多的 电路,从8 0 4 8 6 d x c p u开始,f p u就集成到了c p u内部。目 前市场中的各种通用 处理器中都集成了浮点运算单元,甚至某些嵌入式处理器中也支持浮点运算。下表 是目前常用的高端c p u在每个时钟周期能执行浮点运算的次数: 巨 一 吧pa 一卜一 膘_ 一煎 丁 诬 萨_ 画 一 f 咒 一 c 一 一:件 臀 鳄竺 缨 竺 e npart 22 _一 i b m p o we r 4 h p q p a - r i s c h p q 灿p l a a l s 6 mi ps i n t e l i n t e l ita n u m (p e n ti u m f lo p sc : c l e 442 一i2 2 i t 一 图 1 我国的通用 c p u产业目 前还处子起步阶段, 许多专家学者都在致力于研究自己 特色的 c p u。去年,中科院计算所发布了他们研制的龙芯 2通用 c p u,主频为 s o o mh z , 性能达到了pln 的水平。 北京凝思科技有限公司在总裁宫敏博士带领下研 制基于安全服务器的6 4 位通用处理器l x-1 1 6 4 a凝思公司是以承担国家8 6 3 信息 安全项目而设立的高新技术企业。公司的目标是设计和生产出具有完全自主知识产 权的处理器和操作系统的高安全服务器系统,填补我国在信息安全关键技术领域的 空白。 首先让我们简要回顾一下浮点单元及浮点乘、除法器的发展历史和现状. 华北电力大学硕士学位论文 1 . 1 i n t e 1 8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 , 8 0 4 8 6 这四种算术协处理器芯片皆由美国i n t e l 公司设计生产。8 0 8 7协处理器是 1 9 7 9 年引入 8 0 8 6 / 8 0 8 8 微处理机系统。1 9 8 2 年又把 8 0 2 8 7引入 8 0 2 8 6 微机系统。三年以 后, 继8 0 3 8 6 3 2 位微处理机问世一年后, 8 0 3 8 7 也随之问世。 上述几种c p u均采用 c i s c体系结构,且 . f p u是单独的芯片。1 9 8 9 年4 月,i n t e l 公司推出了向r i s c体 系结构转型的新产品8 0 4 8 6 . 8 0 4 8 6 在c p u芯片中集成了浮点运算单元f p u ,使其 浮点处理能力是 8 0 3 8 7的 3 - 5 倍。8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 及 8 0 4 8 6 都使用 8 0 位内h is 结构,实现了i e e e浮点格式, 包括3 2 位单精度、 6 4 位双精度和 8 0 位扩展精度等。 其中8 0 8 7 , 8 0 2 8 7 支持推荐的i e e e 7 5 4 标准; 8 0 3 8 7 支持最终的i e e e 7 5 4 标准; 8 0 4 8 6 支持i e e e 7 5 4 与8 5 4 标准。下面我们再对f p u中的乘、除法器 ( f mu l )的运算性 能进行一下分析并列于表 t o 表 1 浮点单元名称浮点乘法器运算所需周期数 浮点除法器运算所需周期数主频 ( mh z ) 8 0 2 8 7 8 5 一1 1 0 1 9 8 一2 2 51 6 8 0 3 8 7 2 7 一5 78 9 - 9 4 2 5 8 0 4 8 6 1 9 -2 73 9 5 0 i n t e l p e n t i u m 1 9 9 3 年3 月i n t e l 公司推出了新一代产品p e n t i u m此产品采用0 . 8 t m c mo s 工作主频6 0 - 6 6 mh z 。内含算术协处理器,支持 i e e e 7 5 4 与8 5 4 位内部结构。p e n t i u m在浮点部件上与 8 0 4 8 6相比,做了重大改进。 标准,使用8 0 由于引入流水 勺乙, l.艺 线技术, 其浮点单元f p u一般可每个周期接受一条浮点操作指令。 f p u共有 8 级流 水级,包括预取指令 ( p f ) :指令译码 d 1 ) :地址生成 ( 1 3 2 ) ;读存储器和寄存器 ( e x) ;浮点执行级 1 ( x l ) ;浮点执行级 2 ( x 2 ) ;舍入和回写 ( wf ) ;报告出错 及更改状态字 e r ) . 1 . 3 i n t e l 8 0 8 6 0( 1 8 6 0 ) i n t e l 8 0 8 6 0 是i n t e l 公司于8 0 年代末开发的超标量r i s c芯片。 采用1 g m c mo s 工艺,工作主频 4 0 mh z 。其浮点单元 f p u主要由浮点控制部件、浮点加法部件和 浮点乘法部件组成。支持i e e e 7 5 4的单精度和双精度两种数据格式,并有两种操作 方式,标量方式或流水线方式。在标量方式下,需六个周期完成一个单精度浮点乘 法,需九个周期完成一个双精度浮点乘法.在流水线方式下,一个时钟周期即可完 华北电力大学硕士学位论文 1 . 1 i n t e 1 8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 , 8 0 4 8 6 这四种算术协处理器芯片皆由美国i n t e l 公司设计生产。8 0 8 7协处理器是 1 9 7 9 年引入 8 0 8 6 / 8 0 8 8 微处理机系统。1 9 8 2 年又把 8 0 2 8 7引入 8 0 2 8 6 微机系统。三年以 后, 继8 0 3 8 6 3 2 位微处理机问世一年后, 8 0 3 8 7 也随之问世。 上述几种c p u均采用 c i s c体系结构,且 . f p u是单独的芯片。1 9 8 9 年4 月,i n t e l 公司推出了向r i s c体 系结构转型的新产品8 0 4 8 6 . 8 0 4 8 6 在c p u芯片中集成了浮点运算单元f p u ,使其 浮点处理能力是 8 0 3 8 7的 3 - 5 倍。8 0 8 7 , 8 0 2 8 7 , 8 0 3 8 7 及 8 0 4 8 6 都使用 8 0 位内h is 结构,实现了i e e e浮点格式, 包括3 2 位单精度、 6 4 位双精度和 8 0 位扩展精度等。 其中8 0 8 7 , 8 0 2 8 7 支持推荐的i e e e 7 5 4 标准; 8 0 3 8 7 支持最终的i e e e 7 5 4 标准; 8 0 4 8 6 支持i e e e 7 5 4 与8 5 4 标准。下面我们再对f p u中的乘、除法器 ( f mu l )的运算性 能进行一下分析并列于表 t o 表 1 浮点单元名称浮点乘法器运算所需周期数 浮点除法器运算所需周期数主频 ( mh z ) 8 0 2 8 7 8 5 一1 1 0 1 9 8 一2 2 51 6 8 0 3 8 7 2 7 一5 78 9 - 9 4 2 5 8 0 4 8 6 1 9 -2 73 9 5 0 i n t e l p e n t i u m 1 9 9 3 年3 月i n t e l 公司推出了新一代产品p e n t i u m此产品采用0 . 8 t m c mo s 工作主频6 0 - 6 6 mh z 。内含算术协处理器,支持 i e e e 7 5 4 与8 5 4 位内部结构。p e n t i u m在浮点部件上与 8 0 4 8 6相比,做了重大改进。 标准,使用8 0 由于引入流水 勺乙, l.艺 线技术, 其浮点单元f p u一般可每个周期接受一条浮点操作指令。 f p u共有 8 级流 水级,包括预取指令 ( p f ) :指令译码 d 1 ) :地址生成 ( 1 3 2 ) ;读存储器和寄存器 ( e x) ;浮点执行级 1 ( x l ) ;浮点执行级 2 ( x 2 ) ;舍入和回写 ( wf ) ;报告出错 及更改状态字 e r ) . 1 . 3 i n t e l 8 0 8 6 0( 1 8 6 0 ) i n t e l 8 0 8 6 0 是i n t e l 公司于8 0 年代末开发的超标量r i s c芯片。 采用1 g m c mo s 工艺,工作主频 4 0 mh z 。其浮点单元 f p u主要由浮点控制部件、浮点加法部件和 浮点乘法部件组成。支持i e e e 7 5 4的单精度和双精度两种数据格式,并有两种操作 方式,标量方式或流水线方式。在标量方式下,需六个周期完成一个单精度浮点乘 法,需九个周期完成一个双精度浮点乘法.在流水线方式下,一个时钟周期即可完 华北电力大学硕士学位论文 成一个乘法运算。其六个流水级为:取指令级 ( f ) ;译码级 ( d) ;三个浮点执行级 ( el 、e 2 , e 3 )以及写回结果 ( w) 。在执行双精度乘法运算时,执行级需加倍。 1 . 4 1 . 4 . 1 p o we r p c系列处理 由 美国i b m, a p p l e 和m o t o r o l a 公司联合开发的微处理器芯片。 p o we r p c 6 0 1 采用。 6 p m c mo s 工艺,工作主频5 0 1 6 6 m h z o f p u采用五级流水,包括取指 级 ( f i ) :译码级 ( f d ) :乘法执行级 ( f p m) :加法执行级 ( f p a ) ;规格化/ 舍入 及回写级 n o r m a l iz e r , r o u n d e r , f w a ) o这样把乘 法和加法作为两 个流水级,可高效 地完成a x + b运算,且只进行一次舍入,不仅速度快且精度高。但同样也使单独的 乘法和加法运算产生了冗余。浮点乘法阶段f p m每个时钟周期完成2 7 位 x 5 3 位 的计算。因为双精度乘法要求5 3 位 x 5 3 位,所以,有关双精度的乘法及加乘运算 在该阶段均占用两个周期。不仅如此,双精度的乘法及加乘运算在f d和f p a阶段 同样需要两个成功的周期。双精度的除法运算需要在f d , f p m和f p a阶段循环往 复。也就是说,完成一个单精度浮点乘法运算需要5 个周期,完成一个双精度浮点 乘法运算需要8 个周期,除法运算需要多个乘法周期。 1 . 4 . 2 p o we r p c 6 0 3 采用。 . 5 p m c m o s 工艺, 工作主频8 0 m h z . p o w e r p c 6 0 3 的浮点功能与p o w e r p c 6 0 1 基本一致, 只是把低能耗技术应用到了f p u上。 在硬件上支持所有i e e e 7 5 4 浮 点数据类型 ( 规格化、反规格化、非数 n a n,零和无穷大) ,消除了软件异常例程 引发的执行时间。 1 . 5旧m r s 1 6 0 0 0 r s / 6 0 0 0 的全称是r i s c system/6000。它是i b m公司1 9 8 6 年开始实 施的第二 代r i s c产品系列。它实现了i e e e 7 5 4 二进制浮点标准,执行一条乘加指令共需8 个周期。 华北电力大学硕士学位论文 成一个乘法运算。其六个流水级为:取指令级 ( f ) ;译码级 ( d) ;三个浮点执行级 ( el 、e 2 , e 3 )以及写回结果 ( w) 。在执行双精度乘法运算时,执行级需加倍。 1 . 4 1 . 4 . 1 p o we r p c系列处理 由 美国i b m, a p p l e 和m o t o r o l a 公司联合开发的微处理器芯片。 p o we r p c 6 0 1 采用。 6 p m c mo s 工艺,工作主频5 0 1 6 6 m h z o f p u采用五级流水,包括取指 级 ( f i ) :译码级 ( f d ) :乘法执行级 ( f p m) :加法执行级 ( f p a ) ;规格化/ 舍入 及回写级 n o r m a l iz e r , r o u n d e r , f w a ) o这样把乘 法和加法作为两 个流水级,可高效 地完成a x + b运算,且只进行一次舍入,不仅速度快且精度高。但同样也使单独的 乘法和加法运算产生了冗余。浮点乘法阶段f p m每个时钟周期完成2 7 位 x 5 3 位 的计算。因为双精度乘法要求5 3 位 x 5 3 位,所以,有关双精度的乘法及加乘运算 在该阶段均占用两个周期。不仅如此,双精度的乘法及加乘运算在f d和f p a阶段 同样需要两个成功的周期。双精度的除法运算需要在f d , f p m和f p a阶段循环往 复。也就是说,完成一个单精度浮点乘法运算需要5 个周期,完成一个双精度浮点 乘法运算需要8 个周期,除法运算需要多个乘法周期。 1 . 4 . 2 p o we r p c 6 0 3 采用。 . 5 p m c m o s 工艺, 工作主频8 0 m h z . p o w e r p c 6 0 3 的浮点功能与p o w e r p c 6 0 1 基本一致, 只是把低能耗技术应用到了f p u上。 在硬件上支持所有i e e e 7 5 4 浮 点数据类型 ( 规格化、反规格化、非数 n a n,零和无穷大) ,消除了软件异常例程 引发的执行时间。 1 . 5旧m r s 1 6 0 0 0 r s / 6 0 0 0 的全称是r i s c system/6000。它是i b m公司1 9 8 6 年开始实 施的第二 代r i s c产品系列。它实现了i e e e 7 5 4 二进制浮点标准,执行一条乘加指令共需8 个周期。 华北电力大学硕十学位论文 1 .6 mi p s ( m i c r o p r o c e e s s o r wit h o u t i n t e r l o c k e d p i p e d s t a g e e s ) 系列产品 由美国mi p s公司设计生产的当今世界上较流行的一种r i s c处理器。 1 . 6 . 1 m i p s 8 2 0 1 0 其浮点处理器 f p a有六级流水,包括取指令 ( i f ) 、读取指令 ( r d ) 、两个浮 点执行级 ( e l , e 2 ) 、处理异常 ( me m wb )和回写 ( f wb ) 。相对于 8 2 0 0 0所增 加的f p a流水线工序可以 在f p a与主处理器之间更好地协调异常响应。 1 . 6 . 2 mi ps 8 3 0 1 0 与8 2 0 1 0 基本相似, f p a六级流水线, 取指 ( i f ) 、 读数据 ( r d ) 、 执行 1 ( e i ) , 执行 2 ( e 2 ) 、处理异常 ( wb ) 和回写 ( f wb ) . 8 3 0 1 0 充分利用内部操作的并行性, 可允许几条f p a指令重叠执行,以提高流水线效率。 1 . 6 . 3 mi p s 8 4 0 0 0 mi p s 8 4 0 0 0 把整个浮点部件 ( f p u) 做在芯片上。 f p u支持i e f e 7 5 4 标准的单 精度和双精度算术运算。一个完整的单精度乘法运算需要7 个周期,双精度乘法运 算需要 8个周期。一个完整的单精度除法运算需要 2 3个周期,双精度除法运算需 要 3 6 个周期。 1 . 7 s u p e r s p a r c 美国德州仪器公司 ( t i )为 s u n微系统公司生产的第四代 s p a r c ,采用超标 量 r i s c体系结构。其浮点部件 ( f p u )实际上是一个流水线的浮点处理器,可对 单双精度数进行操作。它包括一个浮点控制器f p c ,以及两个独立的流水线:浮点 加法器 ( f a d d e r )和乘法器 ( f m u l t i p l i e r ) 。所有的浮点指令都是在这两个独 立部件中的一个中执行。 浮点乘法器 ( f mu l t i p l i e r )是完全流水线结构,包括以 下四个流水级: ( 玲f r d :译码和读出; ( 2 ) f m:执行乘法: ( 3 ) f n / f r :规格化和舍入; ( 4 ) f wb :写回到浮点寄存器堆。 f mu l t i p l i e r执行乘法和除法运算。每个周期它可启始一次单精度或双精度 华北电力大学硕十学位论文 1 .6 mi p s ( m i c r o p r o c e e s s o r wit h o u t i n t e r l o c k e d p i p e d s t a g e e s ) 系列产品 由美国mi p s公司设计生产的当今世界上较流行的一种r i s c处理器。 1 . 6 . 1 m i p s 8 2 0 1 0 其浮点处理器 f p a有六级流水,包括取指令 ( i f ) 、读取指令 ( r d ) 、两个浮 点执行级 ( e l , e 2 ) 、处理异常 ( me m wb )和回写 ( f wb ) 。相对于 8 2 0 0 0所增 加的f p a流水线工序可以 在f p a与主处理器之间更好地协调异常响应。 1 . 6 . 2 mi ps 8 3 0 1 0 与8 2 0 1 0 基本相似, f p a六级流水线, 取指 ( i f ) 、 读数据 ( r d ) 、 执行 1 ( e i ) , 执行 2 ( e 2 ) 、处理异常 ( wb ) 和回写 ( f wb ) . 8 3 0 1 0 充分利用内部操作的并行性, 可允许几条f p a指令重叠执行,以提高流水线效率。 1 . 6 . 3 mi p s 8 4 0 0 0 mi p s 8 4 0 0 0 把整个浮点部件 ( f p u) 做在芯片上。 f p u支持i e f e 7 5 4 标准的单 精度和双精度算术运算。一个完整的单精度乘法运算需要7 个周期,双精度乘法运 算需要 8个周期。一个完整的单精度除法运算需要 2 3个周期,双精度除法运算需 要 3 6 个周期。 1 . 7 s u p e r s p a r c 美国德州仪器公司 ( t i )为 s u n微系统公司生产的第四代 s p a r c ,采用超标 量 r i s c体系结构。其浮点部件 ( f p u )实际上是一个流水线的浮点处理器,可对 单双精度数进行操作。它包括一个浮点控制器f p c ,以及两个独立的流水线:浮点 加法器 ( f a d d e r )和乘法器 ( f m u l t i p l i e r ) 。所有的浮点指令都是在这两个独 立部件中的一个中执行。 浮点乘法器 ( f mu l t i p l i e r )是完全流水线结构,包括以 下四个流水级: ( 玲f r d :译码和读出; ( 2 ) f m:执行乘法: ( 3 ) f n / f r :规格化和舍入; ( 4 ) f wb :写回到浮点寄存器堆。 f mu l t i p l i e r执行乘法和除法运算。每个周期它可启始一次单精度或双精度 华北电力大学硕士学位论文 乘法操作。除法按非流水线机制执行,占若干个乘法周期。f mu l t i p l i e r支持非 规格化数,但会有多达五个周期的时间代价。乘法运算需要 3 个周期完成,单精度 除法运算需要 6 个周期完成,双精度除法运算需要 9 个周期完成。 从上面的介绍中,我们可以看到,目前国外一些大的计算机厂商所生产的c p u 的浮点单元的浮点乘、 除法器的主要性能指标。目 前我国c p u还没有形成产业, 只 是处在研究阶段。 为了发展民族的c p u工业, 许多专家学者都在致力研究有自己特 色的 c p u。本人有幸在夏宏副教授的指导下参加这一工程,承担凝思公司 l x 1 1 6 4 c p u的 i u , f p u的一些功能部件的逻辑设计与仿真工作。其中一项重要工作就是 研制高性能的浮点除法/ 开方运算器 ( f d i v ) o 我们所研制的f d i v , 采用0 . 1 8 p m c m o s 工艺; 工作主频4 0 0 m h z ; 硬件完全 支持i e e e 7 5 4 浮点标准。 单精度除法运算7 个周期完成, 双精度除法运算9 个周期 完成;双精度开方运算 1 2个周期完成,单精度除法运算 9个周期完成。在支持反 规格化数方面不需要额外的时间代价。 f d i v将采用a s i c ( a p p l i c a t i o n s p e c i f i c i n t e g r a t e d c i r c u i t ) 的全定制电 路的设计 方法,使用先进的e d a ( e l e c t r o n i c d e s i g n a u t o m a t i o n ) 设计i具进行逻辑设计与仿 真。 华北电力大学硕士学位论文 第2 章 i e e e 7 5 4浮点标准介绍 我所设计的浮点除法、 开方运算器是以1 9 8 5 年由i e e e ( i n s t i t u t e o f e l e c t r i c a l a n d e l e c t r o n i c s e n g i n e e r s )制定的浮点标准a n s i / i e e e s t d . 7 5 4 - 1 9 8 5( 简称i e e e 7 5 4 ) 为依据的。 i e e e 7 5 4 标准是目前使用最广泛的浮点标准,它应用于当代所有处理器 和算术协处理器中。 i e e e 7 5 4 浮点标准包括浮点数的格式、 算术计算精度以及异常情况处理等三个 方面。 2 . 1浮点数的格式 i e e e 7 5 4 标准定义了四种浮点标准:3 2 位单精度、扩展单精度、6 4 位双精度 和扩展双精度。 2 . 1 . 1 单精度格式 单精度格式:即二进制浮点数的3 2 位格式, 如图 2 所示。 此格式由一 位符号 s . 8 位的偏码指数 e以及2 3 位的原码尾数f组成。指数偏码的偏移量为 1 2 7 .单 精度浮点数的值 v 有五种情形。 n 号 叫移 码 叫原 码 尾 数 图 2 3 2 位单精度格式 如果e =2 5 5 ,且f :p l- 0 ,则v =n a n ,即v是非数; 如果e = 2 5 5 , 且f = o , 则v = ( - i ) s x -,即v =1 -; 如 果。 e 2 5 5 , 则v = ( - 1 ) s x 2 e - 1 2 1 x i .f , 则v 是正 常的 浮点 数; 如果e = 0 , 且f # o , 则v = ( - 1 ) s x 2 e - 1 2 6 x o .f ,即v 是反规格 化数; 如果e = 0 , 且介 。 , 则v = ( - 1 ) s x o , 即v = 士 。 。 为了保持高精度,以上定义中采用基数为 “ 2 ,并且尾数f的最左有效位不表 示规格化数,这样可使指数场中的位数增加一位,由小数点左边的一个显示 ( 运算 时 ) 或隐 式( 存储时, 又叫隐 含位) 前导位( 0 或1 ) 与小数点右边的尾数f 组成的一个二 进制数部分,叫做有效数( s i g n i f i c a n d ) 。即 华北电力大学硕士学位论文 第2 章 i e e e 7 5 4浮点标准介绍 我所设计的浮点除法、 开方运算器是以1 9 8 5 年由i e e e ( i n s t i t u t e o f e l e c t r i c a l a n d e l e c t r o n i c s e n g i n e e r s )制定的浮点标准a n s i / i e e e s t d . 7 5 4 - 1 9 8 5( 简称i e e e 7 5 4 ) 为依据的。 i e e e 7 5 4 标准是目前使用最广泛的浮点标准,它应用于当代所有处理器 和算术协处理器中。 i e e e 7 5 4 浮点标准包括浮点数的格式、 算术计算精度以及异常情况处理等三个 方面。 2 . 1浮点数的格式 i e e e 7 5 4 标准定义了四种浮点标准:3 2 位单精度、扩展单精度、6 4 位双精度 和扩展双精度。 2 . 1 . 1 单精度格式 单精度格式:即二进制浮点数的3 2 位格式, 如图 2 所示。 此格式由一 位符号 s . 8 位的偏码指数 e以及2 3 位的原码尾数f组成。指数偏码的偏移量为 1 2 7 .单 精度浮点数的值 v 有五种情形。 n 号 叫移 码 叫原 码 尾 数 图 2 3 2 位单精度格式 如果e =2 5 5 ,且f :p l- 0 ,则v =n a n ,即v是非数; 如果e = 2 5 5 , 且f = o , 则v = ( - i ) s x -,即v =1 -; 如 果。 e 2 5 5 , 则v = ( - 1 ) s x 2 e - 1 2 1 x i .f , 则v 是正 常的 浮点 数; 如果e = 0 , 且f # o , 则v = ( - 1 ) s x 2 e - 1 2 6 x o .f ,即v 是反规格 化数; 如果e = 0 , 且介 。 , 则v = ( - 1 ) s x o , 即v = 士 。 。 为了保持高精度,以上定义中采用基数为 “ 2 ,并且尾数f的最左有效位不表 示规格化数,这样可使指数场中的位数增加一位,由小数点左边的一个显示 ( 运算 时 ) 或隐 式( 存储时, 又叫隐 含位) 前导位( 0 或1 ) 与小数点右边的尾数f 组成的一个二 进制数部分,叫做有效数( s i g n i f i c a n d ) 。即 华北电力大学硕士学位论文 第种情形说明没有数学解释的操作( 例如 。 = 0 ) 将产生一个非数 n a n ( n o t - a - n u m b e r ) ; 第种情形表示正负无穷大数; 第种情形是规格化数的表示, 它定义为非零的数,且其最左有效数位为 1 。如果最左有效数位是 0 ,则变成第 种情形的非正常 0 .规格化不改变指数采用偏移码,并且偏移码的选择是这样的: 可以表示所有规格数的例数,而不会引起指数溢出。情形中p具有最小的指数, 有效数的显式或隐式前导( 最左) 位是 。 ;这个数不是一个正常零,叫做反规格化 ( d e n o m a i z e d ) 数,反规格化数是给定格式中作为下溢出的违章结果,它不是为扩充 指数范围而设计的,而是牺牲一些精度来换取尽可能长的,允许进一步计算,以判 定该下溢出是否将成为有意义的结果。 因为最小的规格化数为t = 2 - 1 2 6 。 故反规格化 数就是在 。 2 - 1 2 6 之间的数。反规格化数只对单精度与双精度格式定义,对于采用 反规格化数表示下溢值的下溢出,叫做逐级下溢( g r a d u a l u n d e r fl o w ) . 第种情形也具有最小的指数, 而且有效数为0 , 但符号位可以是正的或负的, 这个数称为正常零。在 i e e e标准中由于浮点有效数采用原码表示,于是就有两个 零: 十 0 与一 0 。 标准中规定0 -0 =十。 , 而一( 。 ) = 一。 。 于是当x =。 时,-x和0 -x 是不同的。 2 . 1 . 2 双精度格式 双精度格式是二进制浮点数的6 4 位格式,如图 3 所示,此格式由一位符号位 s , 1 1 位的偏移指数e ,以及 5 2 位的尾数f 组成。指数偏码的偏移量为 1 0 2 3 。双精 度浮点数的值也分五种情形: 巨 一 , “ 一杆一 - .- 二 位 .- 一 符号淤 奖醚一.,_ taat., 图 3 6 4 位双精度格式 如果。 = 2 0 4 7 ,且f -? ,- 0 ,则v = n a n; 如果e = 2 0 4 7 , 且f = 0 , v = ( - i ) i x -,即v =士 co 如果。 e 2 0 4 7 , v = ( - 1 ) s x 2 e - 10 2 3 x i .f ; 如果e = 0 , 且f # 0 , v = ( - 1 ) x 2 e - 1 0 2 2 x o .f ; 如果e = 0 , 且卜 。 , v = ( - 1 ) s x o , 双精度格式的指数是这样选择的, 起 6 4 位格式的溢出。 即 v = 0 . 使得 8个 3 2位的单精度数的乘积也不会引 华北电力大学硕士学位论文 第种情形说明没有数学解释的操作( 例如 。 = 0 ) 将产生一个非数 n a n ( n o t - a - n u m b e r ) ; 第种情形表示正负无穷大数; 第种情形是规格化数的表示, 它定义为非零的数,且其最左有效数位为 1 。如果最左有效数位是 0 ,则变成第 种情形的非正常 0 .规格化不改变指数采用偏移码,并且偏移码的选择是这样的: 可以表示所有规格数的例数,而不会引起指数溢出。情形中p具有最小的指数, 有效数的显式或隐式前导( 最左) 位是 。 ;这个数不是一个正常零,叫做反规格化 ( d e n o m a i z e d ) 数,反规格化数是给定格式中作为下溢出的违章结果,它不是为扩充 指数范围而设计的,而是牺牲一些精度来换取尽可能长的,允许进一步计算,以判 定该下溢出是否将成为有意义的结果。 因为最小的规格化数为t = 2 - 1 2 6 。 故反规格化 数就是在 。 2 - 1 2 6 之间的数。反规格化数只对单精度与双精度格式定义,对于采用 反规格化数表示下溢值的下溢出,叫做逐级下溢( g r a d u a l u n d e r fl o w ) . 第种情形也具有最小的指数, 而且有效数为0 , 但符号位可以是正的或负的, 这个数称为正常零。在 i e e e标准中由于浮点有效数采用原码表示,于是就有两个 零: 十 0 与一 0 。 标准中规定0 -0 =十。 , 而一( 。 ) = 一。 。 于是当x =。 时,-x和0 -x 是不同的。 2 . 1 . 2 双精度格式 双精度格式是二进制浮点数的6 4 位格式,如图 3 所示,此格式由一位符号位 s , 1 1 位的偏移指数e ,以及 5 2 位的尾数f 组成。指数偏码的偏移量为 1 0 2 3 。双精 度浮点数的值也分五种情形: 巨 一 , “ 一杆一 - .- 二 位 .- 一 符号淤 奖醚一.,_ taat., 图 3 6 4 位双精度格式 如果。 = 2 0 4 7 ,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电力系统运行值班员专业技能测试题库
- 申报课件教学课件
- 甲骨文的演变
- 甲状腺癌护士课件
- 游戏主题活动方案设计
- 《教学相长》课件
- 甲午中日战争课件简短
- 急性肾功能衰竭透析指征护理查房
- 2025年英语四级阅读理解专项训练试卷 阅读理解词汇训练
- 2025年秋季会计职称考试 税法与财务会计实务历2025年真题试卷
- 沥青购销合同范本2024年
- 《孩子来了:如何度过最艰难的育儿时刻》记录
- 餐饮与单位用餐协议书模板
- 百融云创风险决策引擎V5产品操作手册
- 市政道路及设施零星养护服务技术方案(技术标)
- TB 10009-2016 铁路电力牵引供电设计规范
- 提高CSSD手术器械的清洗率医院护理品管圈QCC成果汇报课件(完整版本易修改)
- 2024停车场停车协议书
- DZ∕T 0033-2020 固体矿产地质勘查报告编写规范(正式版)
- 苏教版小学综合实践活动五年级上册教案
- NY-T 3213-2023 植保无人驾驶航空器 质量评价技术规范
评论
0/150
提交评论