电子科技大学-彭启琮-DSP视频配套PPT-2.ppt_第1页
电子科技大学-彭启琮-DSP视频配套PPT-2.ppt_第2页
电子科技大学-彭启琮-DSP视频配套PPT-2.ppt_第3页
电子科技大学-彭启琮-DSP视频配套PPT-2.ppt_第4页
电子科技大学-彭启琮-DSP视频配套PPT-2.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章DSP的硬件结构 DSP的硬件结构 DSP的硬件结构 大体上与通用的微处理器相类似 由CPU 存储器 总线 外设 接口 时钟等部分组成 但又有其鲜明的特点 VonNeuman结构与Harvard结构 Harvard结构 程序与数据存储空间分开 各有独立的地址总线和数据总线 取指和读数可以同时进行 从而提高速度 目前的水平已达到90亿次浮点运算 秒 9000MFLOPS MIPS MillionInstructionPerSecondMFLOPS MillionFloatingOperationPerSecond 流水操作 pipeline 独立的硬件乘法器 在卷积 数字滤波 FFT 相关 矩阵运算等算法中 都有 A k B n k 一类的运算 大量重复乘法和累加通用计算机的乘法用软件实现 用若干个机器周期 DSP有硬件乘法器 用MAC指令 取数 乘法 累加 在单周期内完成 独立的DMA总线和控制器 有一组或多组独立的DMA总线 与CPU的程序 数据总线并行工作 在不影响CPU工作的条件下 DMA速度目前已达800Mbyte s CPU 通用微处理器的CPU由ALU和CU组成 其算术运算和逻辑运算通过软件来实现 如加法需要10个机器周期 乘法是一系列的移位和加法 需要数十个机器周期 DSP的CPU设置硬件乘法器 可以在单周期内完成乘法和累加 TMS320C2xx的CPU 部分 硬件乘法器 CALU 中心算术逻辑单元 移位 通用微处理器的移位 每调用一次移位指令移动1 bitDSP可以在一个机器周期内左移或右移多个bit 可以用来对数字定标 使之放大或缩小 以保证精度和防止溢出 还可以用来作定点数和浮点数之间的转换 溢出 通用CPU中 溢出发生后 设置溢出标志 不带符号位时回绕 带符号位时反相 带来很大的误差DSP把移位输出的最高位 MSB 存放在一个位检测状态寄存器中 检测到MSB 1时 就通知下一次会发生溢出 可以采取措施防止 数据地址发生器 DAG 在通用CPU中 数据地址的产生和数据的处理都由ALU来完成在DSP中 设置了专门的数据地址发生器 实际上是专门的ALU 来产生所需要的数据地址 节省公共ALU的时间 TMS320C2xx的片内存储器及总线 外设 peripherals 时钟发生器 振荡器与PLL 定时器 Timer 软件可编程等待状态发生器通用I O同步串口 SSP 与异步串口 ASP JTAG扫描逻辑电路 IEEE1149 1标准 便于对DSP作片上的在线仿真和多DSP条件下的调试 ALU ArithmeticLogicUnit ALU 16 bitimmediatevalue16 bitwordfromdatamemory16 bitvalueinthetemporaryregister TTwo16 bitwordsfromdatamemory32 bitwordfromdatamemory40 bitwordfromeitheraccumulator Multiplier Adder Compare Select andStoreUnit CSSU ADSP2100 MOTOROLADSP56002 LucentDSP1628 LucentDSP1600core 特点 在数字蜂房电话等应用中 其位操作单元支持很高的编码效率 纠错协处理器支持信道均衡与编码 片内可编程锁相环 PLL 时钟合成器 2 7V电压工作 19 2ns及12 5ns指令周期 片内6KW双口RAM 48KWROM 定点DSP与浮点DSP 浮点格式用指数形式表示 其动态范围比用小数形式表示的定点格式要大得多 定点DSP中经常要考虑的溢出问题 在浮点DSP中基本上可以不考虑为了保证底数的精度 浮点DSP基本上作成32 bit的 其总线 寄存器 存储器等的宽度也相应是32 bit的浮点DSP的速度更快 尤其是作浮点运算浮点DSP的价格高 开发难度也更大 多处理器接口 TMS320C40有6个8 bit的接口 使多个处理器可以很方便的并行或串行工作 ADI公司的ADSP21160也有类似的接口 ADSP 21160的通信口 TMS320C30 60ns单周期指令执行时间33 3MFLOPS16 7MIPS片内4Kx32bit单周期内可访问两次的ROM两个1Kx32bit单周期内可访问两次的RAM64x32bit指令Cache TMS320C30 指令及数据字长32bit 地址宽度24bit 16M寻址空间 40 32bit浮点 整数乘法器及ALU8个以40bit扩展精度寄存器为基础的Acc32bit桶形移位器2个地址发生器 8个辅助寄存器和2个辅助寄存器计算单元片内DMA控制器 使I O与CPU并行工作 TMS320C30 单周期内并行的ALU及乘法指令零开销循环 单周期分支两个外部接口两个串口支持8 16 32bit数据传输两个32bit定时器封装 181脚PGA工艺 1 mCMOS LucentDSP32C 100MHz 10ns指令周期峰值600MFLOPS 连续400MFLOPS4Mbit片内双口SRAM 由核处理器 主机或DMA独立访问DMA控制器支持 14个零开销DMA通道 64bit后台DMA传输 与全速运行的处理器并行 特点 特点 700Mbytes sIO速率4GW片外寻址能力6个连接口 作多处理器应用2个50Mb s串口支持独立的发送与接收 并支持T1与E1接口 TMS320C6701 TMS320C6xCPU LUnit Logic 32 40 bitfixedpointarithmeticandcompareoperations32 64 bitfloatingpointarithmeticandcompareoperations IEEEsingleanddoubleprecision 32 bitfixedpointlogicaloperationsFixed floatingpointconversions64to32 bitfloatingpointconversions TMS320C6xCPU SUnit Shifting 32 bitfixedpointarithmeticoperations32 40 bitshiftsand32 bitbit fieldoperationsBranchingandconstantgeneration32 64 bitfloatingpointreciprocal absolutevalue compares and1 sqrtoperations32to64 bitfloatingpointconversions TMS320C6xCPU MUnit Multiply 16x16 bitfixedpointmultiplies24x24 bitfixedpointmultiplies32x32 bitfixedpointmultiplies32x32 bitsingleprecisionfloatingpointmultiplies64x64 bitdoubleprecisionfloatingpointmultiplies TMS320C6xCPU DUnit Dataaddressoperation 32 bitad

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论