




免费预览已结束,剩余9页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
14 14DSP控制器汇编语言程序设计摘 要:在当今的数字化时代背景下,DSP控制器在数字信号处理中起着重要的作用。本论文概括介绍了TMS320C6XDSP的硬件结构,并对TMS320C6XDSP的汇编语言指令系统做了重点说明。在具备以上知识的基础上,详细介绍了基于DSP的高速数据采集和IIR数字滤波器在DSP上的实现,通过这两个应用实例了解DSP汇编语言程序开发的方法。关键字: TMS320C6X DSP 汇编语言 IIR数字滤波器 高速数据采集Abstract:In digitized time ,DSP plays an important role in the digital signal processing. This paper summarily describes the hardware structure of the TMS320C6XDSP,and It introduced in detail the assembly language introductions.On the basis of having all above knowledge, a high speed data acquisition system based on DSP and using DSP to IIR Digital filter design was introduced,in order to understand the DSP assembly language program development method.Keyword: TMS320C6X DSP the assembly language IIR Digital filter design a high speed data acquisition system前言数字信号处理是一种将现实世界中的连续信号转换为计算机能够处理的信息的过程。比如人们说话的声音,这就是一个连续信号,除此之外,现实生活中还有很多这样的信号,比如光、压力、温度等等。这些信号通过一个模拟向数字的转换过程(称之为AD),变成数字信号送给处理器,进行数字计算,处理结束后,再把结果通过数字向模拟的转换过程重新变成连续信号(称之为DA)。用一般的通用微处理器可以完成这些工作,但是面临的问题是满足如此高的计算速度,就很难保证耗电量很低,更难保证价格足够便宜。因此,另一种微处理器应运而生:数字信号处理器,简称DSP。在当今的数字化时代,DSP已成为通信、计算机、消费类电子产品等领域的基础器件,被誉为信息社会革命的旗手。未来10年,全球DSP产品将向着高性能、低功耗、加强融合和拓展多种应用的趋势发展,DSP芯片将越来越多地渗透到各种电子产品当中,成为各种电子产品尤其是通信类电子产品的技术核心,将会越来越受到业界的青睐。因此,开发应用DSP及其软件是当今科学和社会发展的需要。而DSP芯片的最大优越性在于其具有可重复编程的能力。将各种不同应用的数字信号处理技术以及软件的形式下载到DSP芯片中,可以实现相应的通信和控制功能。DSP的发展和应用使得软件开发和硬件设计变得相对独立,DSP是数字信号处理的核心, DSP硬件系统具有灵活的可编程性。对于DSP的程序员来说,主要的DSP应用程序都是用汇编语言写的(至少部分是汇编语言优化的)。这里有两个理由:首先,大多数广泛使用的高级语言,例如C,并不适合于描述典型的DSP算法。其次,DSP结构的复杂性,如多存储器空间、多总线、不规则的指令集、高度专门化的硬件等,使得难于为其编写高效率的编译器。因此,汇编语言程序设计是DSP应用软件设计的基础。汇编语言是一种利用DSP处理器所有硬件特性并能直接控制硬件的程序设计语言,是被实践证明了的开发硬件系统最优秀的语言。采用汇编语言开发,可合理地应用芯片提供的硬件资源,其代码效率高、占用资源少、程序执行速度快。诸多优点,使汇编语言受到广大专业硬件程序设计人员的青睐。汇编语言直接描述机器指令,比机器指令容易记忆和理解。通过学习和使用汇编语言,能够感知、体会、理解机器的逻辑功能,向上为理解各种软件系统的原理,打下技术理论基础;向下为掌握硬件系统的原理,打下实践应用基础。学习汇编语言是我们理解整个DSP处理器的最佳起点和最有效途径。因此DSP控制器汇编语言程序设计是当今软件设计领域中系统编程人员密切关注的研究课题之一。1 DSP简介和结构特点DSP芯片,也称数字信号处理器,是一种具有特殊结构的微处理器。DSP芯片的内部采用程序和数据分开的哈佛结构,具有专门的硬件乘法器,广泛采用流水线操作,提供特殊的DSP 指令,可以用来快速地实现各种数字信号处理算法。TMS320C6x核心CPU由32个32比特字长的通用寄存器和8 个功能单元组成(2个乘法器和6个算术逻辑单元),故而可以在一个时钟周期中完成8条指令。它支持8/16/32比特的数据格式,并为声音合成或其它增强运算提供了对40比特数据算术运算的支持。TMS320C6x拥有大容量的片内RAM(64KB的数据存储器的64KB的程序存储器),并通过32比特的EMIF支持SDRAM、SBSRAM、SRAM以及其它的非同步存储器。此外TMS320C6x还提供了多通道的DMA操作,用以相对CPU进行后台的数据存取,DMA的辅助通道还提供了对主机端口界面(HPI)的支持,主机可以通过HPI异步地访问TMS320C6x内外存储器及外围设备。C6x还为通信提供两个多通道、多缓冲的串行口。此外,TMS320C6x也和一般的DSP一样具备较完善的中断处理机制、定时器结构,并可以以不同的方式启动系统。 2 DSP的硬件结构和片内外设TMS320C6000 的CPU有两个数据通道A和B,每个通道有16个32位字长的寄存器(A0A15,B0B15),四个功能单元(L,S,M,D),每个功能单元负责完成一定的算术或者逻辑运行。A、B两通道的寄存器并不是完全共享,只能通过TM320C6000提供的两个交换通道1X、2X,才能实现处理单元从不同通道的寄存器堆那里获取32位字长的操作数。TMS320C6x 系列DSP 内部集成的外围设备也非常丰富:具有4 个独立通道的DMA 控制器,外部存储器接口(EMIF),主机接口(HPI),扩展总线(XBUS),多通道缓冲串口(MCBSP),定时器等。3 DSP汇编语言程序设计3.1 DSP系统设计在DSP系统设计中,应当先进行系统的总体设计。首先采用高级语言或Matlab等对算法进行仿真,确定最佳算法并初步确定参数。对系统中的哪些功能用软件实现,哪些功能用硬件实现进行初步的分工。完成总体设计以后,就可以进入软硬件设计阶段。这里介绍软件设计的过程,如图所示。TMS320C6x宏库十六进制转换公用程序EPROM编程器交叉引用列表器器宏源文件文档管理器C汇编器C源文件汇编源文件汇编器COFF目标格式链接器目标文件库文档管理器可执行的COFF文件调试工具运行支持库线形汇编汇编优化文件汇编优化器建库工具3.2 DSP汇编语言的特点汇编语言(Assembly Language)是面向机器、功能很强的程序设计语言,也是利用DSP处理器所有硬件特性并能直接控制硬件的语言。汇编语言的主要优点是占用资源少、程序执行效率高。在对速度有极高要求的场合(如DSP处理器的高速图像采集和图像解压缩),目前主要还要用汇编写程序。汇编语言正是以其“体积”小和效率高而受到专业硬件程序设计人员的青睐,是被实践证明了的开发硬件系统最优秀的语言。3.3 DSP指令系统3.3.1 寻址方式C6000指令的寻址模式比较单一,只有间接寻址模式,即以通用寄存器作为基址,而且偏移地址可以为通用寄存器或常数。在存储器地址计算时,可以采取两种方式:一种是线性寻址,即偏移量经过1、2、4、8(分别对应字节、半字、字和双字寻址)处理后直接加到基址上;另一种是循环寻址,即偏移量在经过1、2、4、8(分别对应字节、半字、字和双字寻址)处理后,还要以循环缓冲区的长度取模数后加到基址上。由AMR寄存器选择是线性寻址还是循环寻址,并指定循环缓冲区的长度。3.3.2句法格式C6000汇编代码的基本形式为:标号 : 并行符号 条件 指令 功能单元 操作数 ;注释3.3.3 延迟间隙C6000指令的执行具有延迟间隙(Delay Slots)。延迟间隙在数量上等于指令的源操作数被读取直到执行的结果可以被访问所需要的指令周期数。延迟间隙等于一个指令的执行或结果获得的潜在周期。所有TMS320C62X系列和TMS320C67X系列DSPs指令都有一个功能单元潜在周期,这意味着每个周期均可有一条新指令在功能单元中开始。3.3.4 指令分类汇编代码的指令包括伪指令和命令助记符。一 汇编器伪指令是汇编语言程序的一个重要内容,它给程序提供数据并控制汇编过程。汇编器伪指令可完成以下工作:将代码和数据汇编进指定的段;在存储器中为未初始化的变量保留空间;控制是否产生清单文件;初始化存储器;汇编条件代码块;声明全局变量;为汇编器指定从中可以获得宏的库;考察符号调试信息。下面对一些常用的伪指令的使用方法进行分类说明。(1)定义段的伪指令这些伪指令指定汇编语言程序的段,包括以下几种:.bss .data.sect.text(2)初始化常数的伪指令以下一些伪指令为当前的段中保留指定的位数:.byte,.char.field.float.half, . half, .int ,.uint, .short, .ushort , .word .uword(3)对准段程序计数器的伪指令.align伪指令将段程序计数器对准1字到128字的边界。(4)引用其他文件的伪指令,包括:.copy.include.def.global.ref二 命令助记符是真正的处理器命令,它执行实际的程序操作。它包括算术操作指令、逻辑操作指令、程序控制指令和加载存储指令四大类,详细的指令形式和执行操作分别介绍如下:a 、算术操作指令C6X的算术指令很丰富,而且运算功能强大。包括取绝对值指令、加法指令、减法指令、乘法指令、比较类指令以及特殊应用指令。(1)取绝对值类指令ABS src2,dst ;ABS(src2)dst,取src的绝对值放入dst中。(2)加/减法类指令这里只对加法类指令详细介绍:不带饱和的有符号或者无符号的整数加法指令ADDUADDU src1, src2,dst ;src2被加到src1上,结果保存到dst中。使用寻址模式的整数加法指令ADDAB/ADDAH/ADDAWADDAB/ADDAH/ADDAW src2, src1,dst ;src1分别按字节(1,B)、半字(2,H)或字(4,W)寻址模式与src2相加,结果放到dst中。如果src2为A4A7或B4B7,src1还可以按循环寻址模式(ARM指定)与src2相加。(3)乘法类指令MPY两个低16位的有符号或无符号整数相乘指令MPYMPYU/US/SU src1,src2,dst 源操作数src1和src2相乘,结果放在目标寄存器dst中。默认情况下,源操作数为无符号数。后缀U表示两个无符号数相乘,US表示src1是无符号而src2是有符号数,SU反之。一个高16位和一个低16位的有符号或无符号整数相乘指令 MPYHLU/ MPYHULS/MPYHSLU src1,src2,dst两个高16位的有符号或无符号整数相乘指令MPYH(U/US/SU)src1,src2,dst一个低16位和一个高16位的有符号或无符号整数相乘指令MPYLH(U)/MPYLUHS/MPYLSHU src1,src2,dstb、 逻辑操作指令逻辑运算指令包括与或异或、移位指令,分别叙述如下。(1)位与指令ANDAND src1, src2,dst ;将操作数src1和src2进行位与运算,结果保存到dst中。(2)位清零指令CLRCLR src2,csta,cstb,dst或者CLR src2,src1,dstsrc2操作数中,由csta和cstb指定的字段被清零。csta和cstb可以是常数,也可以由scr1寄存器的低10位说明,0位4位代表cstb的值,5位9位代表csta的值。csta指明src2要清零的最低位,cstb指明src2要清零的最高位。换句话说,csta和cstb分别代表 src2中要清零字段的起始和结束位置。(3)移位类指令 向左移位指令SHLSHL src2,src1,dst源操作数src2向左移位,移位的个数为源操作数src1中的值,结果保存在目标寄存器dst中。向右移位指令SHRSHR src2,src1,dst 源操作数src2向右移位,移位的个数为源操作数src1中的值,结果进行符号扩展保存在目标寄存器dst中。逻辑右移位指令 SHRU SHRU src2,src1,dst 源操作数src2向右移位,移位的个数为源操作数src1中的值,结果进行零扩展保存在目标寄存器dst中。c、 程序控制指令程序控制指令包括跳转指令、中断返回指令和空操作指令,分别叙述如下。(1)跳转类指令使用位移跳转指令BB label一个21位的常数左移2位,与包含跳转指令的取指包中第一条指令的地址相加,结果保存在程序取指包计数器(PFC)中。编译器和连接器会根据下列公式自动地计算cst的值:cst=(label-PCE1)2使用寄存器跳转指令BB src2Src2在PFC寄存器中。从中断返回的指令B IRP ;IRPPFC,PGIEGIE,从可屏蔽中断返回B NRP ;NRPPFC,1NMIE,从不可屏蔽中断返回(2)空操作类指令空操作指令NOPNOP .count源操作数src被编码为count-1。在src+1个指令周期中,CPU没有任何操作。其中count的最大值是9。多个空操作指令IDLEIDLE指令执行无限多个NOP,直到遇到中断服务或者一个跳转指令发生时才停止空操作。d、 加载存储指令 加载存储指令是把源操作数从源存储器送到目的操作数的存储器中。包括从存储器取数指令、向存储器存数据指令和转移类指令等。(1)从存储器取数指令LDBU/LDHU/LDWLDB/LDH/LDW 间接寻址,dstLDBU/LDHU/LDW指令可以从存储器读取有符号或无符号数,其中地址偏移量可以是5位无符号数、寄存器偏移或者15位无符号数。(2)向存储器存数据指令STB/STH/STW与取数据指令类似,向存储器存数据指令的偏移量也可以是5位无符号数、寄存器偏移或者15位无符号数。STB/STH/STW src, *+baseRoffsetR或STB/STH/STW src, *+B14/B15ucst15(3)转移类指令将数据从一个寄存器转移到另一个寄存器指令 MVMV src,dst将数据在控制寄存器和通用寄存器之间转移指令MVCMVC src2,dst注意:使用MVC指令向ISR或ICR寄存器中写入数据时会有一个延迟间隙。将一个16位有符号数转移到通用寄存器并且进行符号扩展指令MVKMVK cst,dst将一个16位常量进行符号扩展,结果保存到目标寄存器中。将一个16位常量转移到通用寄存器的高16位指令MVKH/MVKLHMVKH/MVKLH cst,dst使用MVKH可以将一个32位常量的高16位装载到目标寄存器中。使用MVKLH可以将一个32位常量的低16位装载到目标寄存器中。将一个16位常量进行符号扩展转移到通用寄存器指令MVKLMVKL cst,dst 4 应用程序设计4.1应用程序一:高速数据采集系统设计4.1.1概述本系统设计的要求:实现对信号频率在30MHz以下的模拟信号的采样,并分析信号的频谱,将频谱结果通过 USB 接口传送到计算机保存和显示。由于本案例采用的是高速模数转换器,为了使处理器的速度跟上AD的速度,DSP每处理一批数据,在处理数据的时间内,停止对数据的采样,DSP 处理完该批数据后,然后启动 AD,开始下一批数据的采样。并且在处理数据之前将这些数据保存到FIFO中。此外,信号处理的算法编成程序保存到外部的Flash中,供DSP上电读程序到其内部RAM单元,全速运行程序。系统的基本框图由 AD、FIFO、DSP 以及 USB 接口组成,其框图如图所示。4.1.2器件的选择对于 AD 转换器,选取的标准主要决定于采样频率和位数,以及价格、供货周期、应用情况等其他因数。根据对各种 AD 芯片的查阅,选择 TI 公司的 AD 转换芯片 ADS5422。根据AD和DSP的接口,可选择美国IDT公司的FIFO芯片IDT72V2113,由于有1M多的数据量,而且IDT72V2113只有512K9bit的数据单元,所以必须做字长和字深扩展。根据数据的处理时间,选择TMS320C6203B型号的DSP。USB选择CY7C68031。Flash称为闪速存储器,是一种高速的、电擦除、电改写的非易失性的存储器。选择128K8bit的闪速存储器SST29LE010。4.1.3 接口设计使用TMS320C6203B的32bit外部扩展总线接口连接AD;使用TMS320C6203B的定时器输出信号TOUT0提供精确稳定的时钟给AD,控制AD的采样频率,并且该时钟可以根据定时器参数由软件设置,增加AD采样频率的灵活性。在DSP内部寄存器中,将多通道缓冲串口(MBSP)的引脚配置成通用的I/O引脚,使用DR0 、DR1以及DX0引脚读入或写入AD的控制信号OVR、DV以及OE。 FIFO与TMS320C6203B的外部扩展总线的XCE3空间,数据通过DMA方式从FIFO传送到TMS320C6203B的片内ROM。FLASH的地址和数据总线连接到TMS320C6203B的EMIF接口总线上,Flash的片选信号连接到DSP的CE1引脚,配置成DSP的CE1空间,此外FLASH读写信号分别连接到EMIF接口的读写信号引脚上。TMS320C6203B通过EMIF接口的CE2空间对USB进行读写操作。4.1.4 程序部分上电后,TMS320C6203B进行初始化,外部扩展总线的/XCE3空间设置为同步FIFO读模式,DMA通道0配置为每次传输含8帧,每帧128BYTE,同步事件设置为外部中断4,触发极性为高电平;手动启动DMA通道0。设置DX0为低电平;随着数据不断写入FIFO,当FIFO中的数据量大于128Byte时,FIFO的确将错就错空白标志 信号 (/PAE)由低电平变为高电平,使得TDS320C6203B的外部中断信号有效,从而触发DMA传输;TMS320C6203B的DMA通道0开始通过外部扩展总线读取8*128BYTE的数据,存储于内部RAM中,然后向TMS320C6203B发送中断,通知TMS320C6203B处理数据;TMS320C6203B处理完数据以后,重新启动DMA通道0,进行下一次DMA传输;如此循环,直到处理完所有的数据。程序流程图如下:YNNY开始初始化启动采样采样结束?打开FIFO读入数据外部中断信号到?从FIFO读数据DSP处理数据输出数据到USB输出结果结束结束?4.2应用程序二:IIR数字滤波器的DSP实现4.2.1 数字滤波器的基本介绍滤波器可广义的理解为一个信号选择系统,它让某些信号成分通过又阻止或衰减另一些成分。滤波器可分为三种:模拟滤波器、采样滤波器和数字滤波器。而从网络结构或者单位脉冲响应分类,可以分为无限脉冲响应(IIR)和有限脉冲响应(FIR)滤波器。 这里将介绍的就是无限脉冲响应(IIR)低通数字滤波器,它属于一个离散系统,主要采用递归结构。数字滤波器的传递函数:对IIR数字滤波器的差分方程的一般形式:两边同时进行双边z变换得:得IIR数字滤波器的传递函数:由上式可推得:4.2.2 IIR数字滤波器DSP程序的设计经常用来设计IIR滤波器的方法是借助于模拟器的设计方法进行。其设计步骤是:先将给定的数字滤波器的指标转换成模拟低通原型滤波器的指标,并得到满足这些指标要求的模拟低通原型滤波器的传递函数Ha(s),然后将Ha(s)按某种方法转换成数字滤波器的系统函数H(z),最后将数字低通原型滤波器转换成所要求的数字滤波器。本程序完成的是一个三阶切比雪夫型低通数字滤波器的滤波功能,为了简化汇编语言的汇编过程,程序中需要滤波的输入信号数据是由Matlab生成的,此输入信号是个双正弦信号,频率分别是62.5Hz和250Hz。程序中的参数b0、b1、b2、b3和a1、a2、a3也是将滤波器性能指标输入Matlab,然后调用Matlab中的切比雪夫型函数生成的。滤波后,输入信号为250Hz的频率成分会被削弱。关于Matlab如何得到这两部分数据并不是研究的内容,在此不多做解释。运用直接型结构,IIR滤波器的系统函数表示为:对应的差分方程为:假如M=N,则由此差分方程可得到如下图所示的信号流程图:-a1-a2-aN-1aN-aNz-1z-1z-1z-1y(n)b0b1b2z-1z-1z-1z-1x(n)根据差分方程的信号流程图进行编程,由于现在的参数和输入数据,所以在程序一开始就将输入数据和参数放在定义好的存储空间里,程序的主体就是进行乘加运算。程序流程图如图所示。开 始将A0清零寄存器A2指向inputdata:寄存器A3指向filterdata;寄存器B4指向 b4; 寄存器B3指向b3寄存器B2指向b2; 寄存器B1指向b1;寄存器B7指向a3; 寄存器B6指向a2;寄存器B5指向a1; 滤波个数保存到寄存器B0输入4个源数据依次到A4、A5、A6、A7,并
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物流公司运输安全管理办法及案例
- 容器化应用加速技术-洞察及研究
- 三年级数学(上)计算题专项练习附答案集锦
- (2025年标准)不要二胎协议书
- (2025年标准)宝钢合作协议书
- (2025年标准)安装电信赔偿协议书
- (2025年标准)2000教师合同协议书
- (2025年标准)购房服务协议书
- (2025年标准)短期拆迁协议书
- (2025年标准)铺位装修安全协议书
- 围手术期的ERAS营养护理管理
- 高处作业非标吊篮专项施工方案
- 2024至2030年中国品牌战略咨询服务市场现状研究分析与发展前景预测报告
- 2022版新《物理》义务教育课程标准教师培训测试题附答案
- 辽宁省丹东市2023-2024学年八年级下学期期末数学试卷(含答案)
- TSG+11-2020锅炉安全技术规程
- 从高考改卷谈对物理教学的几点启示
- DB32-T 4757-2024 连栋塑料薄膜温室建造技术规范
- 个人征信查询授权书范本
- 2024新版实习律师协议
- 县乡教师选调进城考试《教育心理学》题库含完整答案【全优】
评论
0/150
提交评论