嵌入式系统设计与开发课件-第3章_第1页
嵌入式系统设计与开发课件-第3章_第2页
嵌入式系统设计与开发课件-第3章_第3页
嵌入式系统设计与开发课件-第3章_第4页
嵌入式系统设计与开发课件-第3章_第5页
已阅读5页,还剩170页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.1ARM微处理器的体系结构3.2指令系统3.3基于ARM体系的汇编语言程序设计练习题第3章ARM体系结构及指令系统

3.1ARM微处理器的体系结构

3.1.1ARM指令集体系结构的版本及变种

迄今为止,ARM指令体系架构发展并定义了6种不同的版本,版本号从v1到v6。ARM体系的指令集功能不断扩大,不同系列的ARM微处理器,性能差别很大,应用范围和对象也不尽相同,但是,如果是相同的ARM指令体系结构,则基于它们的应用软件是兼容的。

1.v1版本

v1版本的指令架构包括基本的数据处理指令,基于字节、字和多字的Load/Store指令,转移指令以及软件终端指令。它支持的地址空间是26位,对应寻址空间为64MB。v1版本只在ARM1上出现过,没有实现商品化,目前的版本中已不再使用。

2.v2版本

与v1版本相比,v2版本增加了如下一些指令:乘法指令和乘加法指令;支持协处理器的指令;对于FIQ模式,提供了额外的两个备份寄存器;SWP指令和SWPB指令。该版本的处理器仍然是26位的地址空间,目前已经不再使用。

3.v3版本

v3版本对以前的ARM体系结构进行了较大的改动,地址空间扩展到32位,不过,该版本向前兼容,也支持26位地址空间。在指令上,v3版本增加了当前程序状态寄存器(CurrentProgramStatusRegister,CPSR)和备份程序状态寄存器(SavedProgramStatusRegister,SPSR);增加了两种处理器模式,使操作系统代码可以方便地使用数据访问中止异常、指令预取中止异常和未定义指令异常,修改了原来的从异常中返回的指令。

4.v4版本

v4版本增加了半字的读取和写入指令;读取带符号的字节和半字数据的指令;增加了T变种,可以使处理器状态切换到指令集为16位的Thumb指令集的Thumb状态;增加了处理器的特权模式,可使用用户寄存器操作,并明确了哪些指令会引起未定义指令异常;不要求与以前的26位地址空间兼容。目前常用的ARM7、ARM8、ARM9都采用了v4版本结构。

5.v5版本

与v4版本相比,v5版本的ARM处理器提升了ARM和Thumb两种指令的交互工作能力,同时有了DSP指令-v5E结构、Java指令-v5J结构的支持,还增加或者修改了下列指令:带有连接和交换的转移BLX指令、前导零计数(CountLeadingZeros,CLZ)指令、软件断点指令和为协处理器增加了更多可选择的指令。目前ARM10和Intel格式的XScale系列微处理器都采用了v5版本结构。

6.v6版本

v6版本是2001年发布的,该版本首先在ARM11处理器中使用。在v6版本中包含了ARM体系结构中的4种特殊指令集:Thumb指令(T)、DSP指令(E)、Java指令(J)和Media指令。

在ARM体系中增加的某些特定功能称为ARM体系的某种变种(variant)。各版本中均有一些变种,比如支持Thumb指令集称为T变种。ARM体系的变种主要有以下几种。

1) Thumb指令集(T变种)

Thumb指令集是将ARM指令集的一个子集重新编码而形成的一个指令集。ARM指令长度为32位,Thumb指令长度为16位。这样,使用Thumb指令集可以得到密度高的代码,这对于需要严格控制产品成本的设计是非常有意义的。

2)长乘法指令(M变种)

M变种增加了两条用于进行长乘法操作的ARM指令。

3)增强型DSP指令(E变种)

E变种包含了一些附加的指令,这些指令用于增强处理器对一些典型的DSP算法的处理性能。

4) Java加速器Jazelle(J变种)

ARM的Jazelle技术将Java的优势和先进的32位RISC芯片完美地结合在一起。Jazelle技术提供了Java的加速功能,可以得到比普通Java虚拟机高得多的性能。

5) ARM媒体功能扩展(SIMD变种)

ARM媒体功能扩展为嵌入式媒体应用系统提供了高性能的音频/视频处理指令。

ARM微处理器内核后缀命名的含义如表3-1所示。3.1.2ARM微处理器系列产品分类及性能

当前应用较为广泛的ARM微处理器核有ARM7系列、ARM9系列、ARM9E系列、ARM10E系列、ARM11系列、SecurCore系列、Intel的Xscale系列及StrongARM系列等,每个系列都提供了一套特定的性能来满足设计者对功耗、性能和体积的需求。这些处理器广泛应用于以下领域:

(1)开放应用平台:包括无线系统、消费产品以及成像设备等。

(2)实时嵌入式应用:包括存储设备、汽车、工业和网络设备。

(3)安全系统:包括信用卡和SIM卡等。

下面对这些处理器的性能进行简单介绍。

1. ARM7系列

ARM7系列微处理器是低功耗的32位RISC处理器,适用于对功耗和成本要求比较高的消费类产品。

ARM7系列包括ARM7TDMI、ARM7TDMI-S、ARM710T/20T、ARM740TH和ARM7EJ-S5种类型。使用最广泛的是基于ARM7TDMI核的ARM处理器,比如Samsung的S3c4510B、S3c44b0x等。

ARM7系列微处理器主要用于工业控制、Internet设备、网络和调制解调器设备、移动电话等多种多媒体和嵌入式应用等场合。

ARM7系列微处理器具有如下特点:

(1)最高主频可达130MHz;

(2)功耗很低,大约100mW,适合开发便携式产品和手持式产品,如个人音频设备、无线设备、数字照相机、PDA等;

(3)指令系统与ARM9、ARM9E、ARM10E系列兼容,便于客户的产品升级换代;

(4)得到广泛的操作系统支持,包括WindowsCE、PalmOS、Linux以及业界领先的实时操作系统等;

(5)三级流水线结构,兼容16位的微处理器,能够提供0.9MIPS/MHz的性能;

(6) EDA仿真模型,具有嵌入式ICE-RT逻辑,调试方便。

(7)提供0.25μm、0.18μm及0.13μm的生产工艺。

2. ARM9系列

ARM9系列微处理器是支持32位ARM指令集和16位Thumb指令集的32位RISC处理器,指令执行效率较ARM7有很大的提高。

ARM9系列包括ARM920T、ARM922T和ARM940T3种类型。

ARM9系列微处理器主要用于无线设备、仪器仪表、安全系统、机顶盒、高端打印机、数字照相机和数字摄像机等场合。

ARM9系列微处理器具有如下特点:

(1)五级整数流水线;

(2)单一的32位AMBA总线接口;

(3) MMU(MemoryManagementUnit)支持WindowsCE、PalmOS、SymbianOS、Linux等操作系统,MPU(MicroProcessorUnit)支持实时操作系统(如VxWorks);

(4)支持指令Cache和数据Cache,具有更高的指令和数据处理能力;

(5)提供0.18μm、0.15μm及0.13μm的生产工艺。

3. ARM9E系列

ARM9E系列微处理器是支持32位ARM指令集和16位Thumb指令集的32位RISC处理器,使用单一的处理器内核提供了微控制器、DSP、Java应用系统的解决方案,从而极大地减小了芯片的大小以及复杂程度,降低了功耗,缩短了产品面世的时间。

ARM9E系列包括ARM926EJ-S、ARM946E-S和ARM966E-S3种类型。

ARM9E系列微处理器主要用于下一代无线设备、成像设备、工业控制、存储设备和数字消费品等场合。

ARM9E系列微处理器与ARM9系列微处理器相比具有如下特点:

(1)包括了DSP指令集;

(2)集成的实时跟踪和调试功能;

(3)在典型的0.13μm工艺下,主频可达300MHz;

(4)可选的VFP9浮点处理协处理器;

(5)高性能的AHB系统;

(6)在实时控制和三维图像处理时,主频可达215MHz。

4. ARM10E系列

ARM10E系列微处理器具有高性能和低功耗的特点,它所采用的新体系使其具有较高的MIPS/MHz指标。

ARM10E系列包括ARM1020E、ARM1022E和ARM1026EJ-S3种类型。

ARM10E系列微处理器主要用于下一代无线设备、成像设备、工业控制、存储设备和数字消费品等场合。

ARM10E系列微处理器与ARM9E系列微处理器相比具有如下特点:

(1)六级整数流水线;

(2)在典型的0.13μm工艺下,主频可达400MHz;

(3)可选的VFP10浮点处理协处理器;

(4)在实时控制和三维图像处理时,主频可达650MHz;

(5)并行读取/写入(load/store)部件。

5. ARM11系列

ARM11系列微处理器是目前ARM家族中性能最好的一个系列,尤其是在多媒体处理能力方面,在先进的0.13μm工艺下,主频可达750MHz;ARM11核包含一个64位端口、4种状态的跳转目的地址缓存,支持SIMD指令,可使某些算法的运算速度提高2~3倍。

ARM11系列包括ARM1136J(F)-S、ARM1156T2(F)-S和ARM1176JZ(F)-S3种类型。

ARM11的媒体处理能力和低功耗特点特别适用于无线和消费类电子产品;其高数据吞吐量和高性能的结合非常适合网络处理应用;在实时性能和浮点处理等方面,ARM11可以满足汽车电子应用的需求。可以预言,基于AMRv6体系结构的ARM11系列微处理器将在上述领域发挥巨大的作用。

ARM11通过以下几点来增强处理器的性能:

(1)多媒体处理扩展,使MPEG-4编码/解码速度加快一倍,音频处理速度加快一倍;

(2)增强的Cache结构,实地址Cache,减少Cache的刷新和重载,减少上下文切换的开销;

(3)增强的异常和中断处理,使实时任务的处理更加迅速;

(4)支持Unaligned和Mixed-endian数据访问,使数据共享、软件移植更简单,也有利于节省存储器空间。3.1.3ARM微处理器体系结构

1. ARM处理器模式

ARM处理器共有7种运行模式,如表3-2所示。

除了用户模式之外的其他几种处理器模式称为特权模式(PrivilegedModes)。在这些模式下,程序可以访问所有的系统资源,也可以任意地进行处理器模式的切换。其中,除了系统模式外,其他5种特权模式又称为异常模式。处理器模式可以通过软件控制进行切换,也可以通过外部中断或异常处理过程进行切换。大多数的用户程序运行在用户模式下。这时,应用程序不能够访问一些受操作系统保护的系统资源。应用程序也不能直接进行处理器模式的切换。当需要进行处理器模式切换时,应用程序可以产生异常处理,在异常处理过程中进行处理器模式的切换。这种体系结构可以使操作系统控制整个系统的资源。当应用程序发生异常中断时,处理器进行相应的异常模式。在每一种异常模式中都有一组寄存器,供相应的异常处理程序使用,这样就可以保证在进入异常模式时,用户模式下的寄存器(保存了程序运行状态)不被破坏。

系统模式并不是通过异常过程进入的,它和用户模式具有完全一样的寄存器。但是系统模式属于特权模式,可以访问所有的系统资源,也可以直接进行处理器模式的切换。它主要供操作系统任务使用。通常操作系统的任务需要访问所有的系统资源,同时该任务仍然使用用户模式的寄存器组,而不是使用异常模式下相应的寄存器组,这样可以保证当异常中断发生时任务状态不被破坏。

2. ARM体系的存储系统

目前在应用中的ARM指令体系支持32位地址空间,大小为232B,即4GB。这些字节单元的地址是一个无符号的32位数值,其取值范围为0~232-1。

在ARM体系中,每个字单元中包含4个字节或者2个半字单元:1个半字单元中包含2个字节单元。但是在字单元中,4个字节哪个是高位字节哪个是低位字节则有big-endian和little-endian两种不同的格式。在big-endian格式中,地址为A的字单元包括字节单元A、A+1、A+2及A+3,其中字节单元由高位到低位的字节顺序为A、A+1、A+2、A+3;地址为A的字单元包括半字单元A、A+2,其中半字单元由高位到低位的字节顺序为A、A+2;地址为A的半字单元包括字节单元A、A+1,其中字节单元由高位到低位的字节顺序为A、A+1。这种存储器格式如图3-1所示。图3-1big-endian格式在little-endian格式中,地址为A的字单元包括字节单元A、A+1、A+2及A+3,其中字节单元由高位到低位的字节顺序为A+3、A+2、A+1、A;地址为A的字单元包括半字单元A、A+2,其中半字单元由高位到低位的字节顺序为A+2、A;地址为A的半字单元包括字节单元A、A+1,其中字节单元由高位到低位的字节顺序为A+1、A。这种存储器格式如图3-2所示。图3-2little-endian格式

3. ARM寄存器

ARM处理器共有37个寄存器,其中包括:

(1) 31个通用寄存器,包括程序计数器(PC)在内,这些寄存器都是32位寄存器;

(2) 6个状态寄存器,这些寄存器都是32位寄存器,但目前只使用了其中的12位。

ARM处理器共有7种不同的处理器模式,在每一种处理器模式中有一组相应的寄存器组。任意时刻(也就是任意的处理器模式下),可见的寄存器包括15个通用寄存器(R0~R14)、一个或两个状态寄存器及程序计数器(PC)。在所有的寄存器中,有些是各模式共用的同一个物理寄存器;有些寄存器是各模式自己拥有的独立的物理寄存器。表3-3列出了各种处理器模式下可见的寄存器情况。

1)通用寄存器

通用寄存器分为未备份寄存器(Theunbankedregisters)、备份寄存器(Thebankedregisters)和程序计数器(PC)3种。

(1)未备份寄存器。未备份寄存器包括R0~R7。对于每个未备份寄存器来说,在所有的处理器模式下指的是同一个物理寄存器。在异常中断造成处理器模式切换时,由于不同的处理器模式使用相同的物理寄存器,可能会造成寄存器中数据被破坏。未备份寄存器没有被系统用于特别的用途,任何可采用通用寄存器的应用场合都可以使用未备份寄存器。

(2)备份寄存器。对于备份寄存器R8~R12来说,每个寄存器对应两个不同的物理寄存器。例如,当使用快速中断模式下的寄存器时,寄存器R8和寄存器R9分别记作R8_irq和R9_irq;当使用用户模式下的寄存器时,寄存器R8和寄存器R9分别记作R8_usr和R9_usr。在这两种情况下使用的是不同的物理寄存器。当中断仅仅使用R8~R14寄存器时,FIQ处理程序可以不必保存和恢复中断现场,使中断处理过程非常迅速。对于备份寄存器R13和R14来说,每个寄存器对应6个不同的物理寄存器,其中的一个是用户模式和系统模式共用的;另外的5个则对应其他5种处理器模式。采用下标的形式来区分不同的物理寄存器,如R13_<mode>,其中<mode>可以是usr、svc、abt、und、irq及fiq几种模式之一。

寄存器R13在ARM中常用作栈指针。在ARM指令集中,这只是一种习惯的用法,并没有任何指令强制性地使用R13作为栈指针,用户也可以使用其他的寄存器作为栈指针;而在Thumb指令集中,有一些指令强制性地使用R13作为栈指针。每一种异常模式拥有自己物理的R13。应用程序应当初始化该R13,使其指向该异常模式专用的栈地址,这样就使异常处理程序不会破坏被其中断的程序现场。

寄存器R14又被称为连接寄存器(LinkRegister,LR)。每种处理器模式私有的物理R14中,存放当前子程序的返回地址。BL或BLX指令调用子程序时,R14被设置成该子程序的返回地址。在子程序中,把R14的值复制到程序计数器PC中时,子程序即返回。

当异常中断发生时,该异常模式特定的物理R14被设置成该异常模式将要返回的地址,对于有些异常模式,R14的值可能与将返回的地址有一个常数的偏移量。具体的返回方式与上面的子程序返回方式基本相同。当然,R14也可以作为通用寄存器使用。

(3)程序计数器(PC)。程序计数器R15又被记作PC。它虽然可以作为一般的通用寄存器使用,但是有一些指令在使用R15时有一些特殊限制。当违反了这些限制时,该指令执行的结果将不可预料。

在程序的正常执行过程中,每执行一条ARM指令,PC的值加4个字节。由于ARM采用了流水线机制,因此处于取指阶段的指令的地址与执行阶段的指令的地址相差8个字节。需要注意的是,当使用指令STR/STM保存R15时,保存的可能是当前指令地址值加8字节,也可能保存的是当前指令地址加12字节。到底是哪种方式,取决于芯片厂商采用了几级流水线设计方式。因此,对于用户来说,应尽量避免或谨慎使用STR/STM指令来保存R15的值。当无法避免这种使用方式时,可以先通过一些代码来确定芯片使用的是哪种实现方式。假设R0指向可用的一个内存字,下面的代码可以在R0指向的内存字中返回该芯片所采用的地址偏移量。

SUBR1,PC,#4 ;R1中存放下面STR指令的地址

STRPC,[R0]

;将PC=STR地址+offset保存到R0中

LDRR0,[R0]

SUBR0,R0,R1 ;offset=PC-STR地址

在上面的讨论中,都是针对指令返回的值。该值并非是在指令读取期间出现在数据总线上的值。在指令读取期间出现在数据总线上的值取决于芯片的具体实现方式。当成功地向R15写入一个地址数值时,程序将跳转到该地址执行。由于ARM指令是字对齐的,因此写入R15的地址值总是满足bits[1:0]=0b00,其具体要求因ARM各版本的不同而不同:

对于ARMv3版本以及更低的版本,写入R15的地址值的bits[1:0]被忽略,即写入R15的地址值将与0xFFFFFFFC做与操作。

对于ARMv4版本以及更高的版本,程序必须写入R15寄存器的地址值的bits[1:0]为0b00,否则将会产生不可预知的结果。对于Thumb指令集来说,指令是半字对齐的,处理器将忽略bits[0],即写入R15的地址值首先与0xFFFFFFFE做与操作,再写入R15中。

还有一些指令对于R15的用法有一些特殊的要求。比如,指令BX利用bits[0]来确定是ARM指令还是Thumb指令。

这种读取PC值和写入PC值的不对称的操作需要特别注意。这一点在以后的章节中还会介绍。如:指令“MOVPC,PC”将程序跳转到当前指令下面第2条指令处执行,因为指令中第2个PC寄存器读出的值为当前指令的地址值加8,这样对ARM指令而言,写入PC寄存器的是当前指令下面第2条指令的地址。类似的指令还有ADDPC,PC,#0。

2)程序状态寄存器

寄存器R16用作CPSR(CurrentRrogramStatusRegister,当前程序状态寄存器),CPSR可以在任何运行模式下被访问,它包括条件标志位、中断禁止位、当前处理器标志位以及其他一些相关的控制和状态位。每种处理器模式下都有一个专用的物理状态寄存器,称之为SPSR(备份程序状态寄存器)。当特定的异常中断发生时,这个寄存器用于存放当前程序状态寄存器的内容。在异常中断程序退出时,可以用SPSR中保存的值来恢复CPSR。

由于用户模式和系统模式不是异常中断模式,因此它们没有SPSR。若在用户模式或系统模式中访问SPSR,则会产生不可预知的结果。

CPSR的格式如下:

SPSR格式与CPSR格式相同。

(1)条件标志位。N(Negative)、Z(Zero)、C(Carry)及V(oVerflow)统称为标志位。大部分的ARM指令可以根据CPSR中的这些条件标志位来选择性地执行。CPSR中各条件标志位的具体含义如表3-4所示。

(2) Q标志位。在ARMv5的E系列处理器中,CPSR的bit[27]称为Q标志位,主要用于指示增强的DSP指令是否发生了溢出。同样地,SPSR中的bit[27]也称为Q标志位,用于在异常中断发生时保存和恢复CPSR中的Q标志位。

在ARMv5以前的版本以及ARMv5的非E系列的处理器中,Q标志位没有被定义。

(3)控制位。CPSR的低8位E、F、T及M[4:0]统称为控制位。当异常中断发生时,这些位发生变化。在特权级的处理器模式下,软件可以修改这些控制位。CPSR中各控制位的具体含义如表3-5所示。3.1.4ARM体系的异常中断

1. ARM体系中的异常中断种类

ARM体系中的异常中断种类如表3-6所示。

各种异常中断具有各自的备份寄存器组,在前面已经进行了比较详细的介绍。

当多个异常中断同时发生时,可以根据各异常中断的优先级选择响应优先级最高的异常中断。

2. ARM处理器对异常中断的响应过程

ARM处理器对异常中断的响应过程是首先将下一条指令的地址存入相应连接寄存器(LR),以便程序在处理异常返回时能从正确的位置重新开始执行,然后保存处理器当前状态、中断屏蔽位以及各条件标志位。这是通过将当前程序状态寄存器的内容保存到将要执行的异常中断对应的SPSR寄存器中实现的。各异常中断有自己的物理SPSR寄存器。接下来,就要根据异常类型强制设置CPSR的运行模式位,即设置当前程序状态寄存器中相应的位,包括设置CPSR中的位,使处理器进入相应的执行模式;设置CPSR中的位,禁止IRQ中断,当进入FIQ模式时,禁止FIQ中断;将寄存器lr_mode设置成返回地址。最后,强制程序计数器PC从相关的异常向量地址取下一条指令执行,从而跳转到相应的异常处理程序处。上述处理器对异常中断的响应过程可以用如下伪代码描述:

R14_<exception_mode>=returnlink

SPSR_<exception_mode>=CPSR

CPSR[4:0]=exceptionmodenumber

/*当运行于ARM状态时*/

CPSR[5]=0

/*当响应FIQ异常中断时,禁止新的FIQ中断*/

If<exception_mode>==ResetorFIQthen

CPSR[6]=1

/*禁止新的IRQ中断*/

CPSR[7]=1

PC=exceptionvectoraddress

3.从异常中断处理程序中返回

从异常中断处理程序中返回包括以下两个基本操作:

(1)恢复被中断的程序的处理器状态,即将SPSR_mode寄存器内容复制到CPSR中;

(2)返回到发生异常中断的指令的下一条指令处执行,即将lr_mode寄存器的内容复制到程序计数器PC中。

实际上,当异常中断发生时,程序计数器PC所指的位置对于各种不同的异常中断是不同的。同样,返回地址对于各种不同的异常中断也是不同的。

4.异常中断服务程序入口

异常中断服务程序入口矢量表如下:

3.2指令系统

3.2.1ARM指令编码格式与条件码

本节介绍ARM指令的一些基本概念,包括ARM指令的一般编码格式以及ARM指令中的条件码等。

1.ARM指令的一般编码格式

ARM指令字长为固定的32位。一条典型的ARM指令编码格式如下:一条典型的ARM指令语法格式如下:

<opcode>{<cond>}{S}<Rd>,<Rn>,<shifter_operand>

其中:

<opcode>是指令助记符,如ADD表示算术加操作指令;

{<cond>}表示指令执行的条件;

{S}决定指令的操作是否影响CPSR的值;

<Rd>表示目标寄存器;

<Rn>表示包含第1个操作数的寄存器;

<shifter_operand>表示第2个操作数。

2.ARM指令中的条件码

大多数ARM指令都可以按条件执行,也就是根据CPSR中的条件标志位决定是否执行该指令。当条件满足时,执行该指令;当条件不满足时,该指令被当作一条NOP指令,然后转向下一条指令。

在ARMv5之前的版本中,所有的指令都是条件执行的,从ARMv5版本开始引入一些无条件执行指令。

条件码共有16个,各条件码的含义和助记符如表3-7所示。各条件执行的指令可以在其助记符的扩展域上加条件码助记符,从而在特定的条件下执行。3.2.2ARM指令集的寻址方式

寻址方式是指处理器根据指令编码信息获得指令操作数的方式。寻址方式有立即数寻址、寄存器寻址、寄存器移位寻址、寄存器间接寻址、基址变址寻址、相对寻址、基址加寄存器移位间接寻址、多寄存器寻址和堆栈寻址等。

1.立即数寻址

ARM指令的立即数寻址是一种特殊的寻址方式,操作数就在指令码中给出,只要取出指令也就得到了操作数,这个操作数被称为立即数,数值可以是0~0xFF范围内的任意值。例如:

MOVR3,#0x3a;将十六进制数3a放到寄存器R3中

在上面的指令中,第2个源操作数即为立即数,实际使用时以“#”符号作为前缀。为了方便用户,ARM建立了若干伪指令,其中实现立即数对寄存器的赋值可用如下伪指令:

LDRR3,=0xff00

LDRR1,=0xf003000e ;特别适合特殊功能寄存器用立即数初始化赋值

LDRR0,=DIS_BUF+5 ;DIS_BUF的地址加5复制给R0

2.寄存器寻址

寄存器寻址就是利用寄存器中的数值作为操作数,这种寻址方式是各类微处理器经常采用的一种方式,也是一种执行效率较高的寻址方式。如下面的指令:

MOVR3,R2 ;将R2的数值放到R3中

ADDR0,R1,R2 ;将R1和R2中的数值相加,然后赋值给R0

3.寄存器移位寻址

寄存器移位寻址的操作数为寄存器的数值做相应的移位(或者循环移位)而得到。具体的移位有下面几种:

ASR算术右移:

MOVR0,R1,ASR#3 ;R0=有符号数R1/(23)

LSL逻辑左移:

MOVR0,R1,LSL#3 ;R0=R1*(23)

4.寄存器间接寻址

寄存器间接寻址就是以寄存器中的值作为操作数的地址,而操作数本身存放在存储器中。如下面的指令:

LDRBR0,[R1] ;在以R1为地址的内存单元,取一个字节给R0,高24位置0

ADDR0,R1,[R2] ;以寄存器R2的内容作为操作数的地址,该地址内存中的数值

;与R1相加,结果存入寄存器R0中

5.基址变址寻址

基址变址寻址就是将寄存器(该寄存器一般称为基址寄存器)的内容与指令中给出的地址偏移量相加,从而得到一个操作数的有效地址。如下面的指令:

LDRR0,[R1,#0x0A] ;将寄存器R1的内容加上0x0A形成操作数的有效地址,将该地址处的操作数送入寄存器R0中

LDRR0,[R1,#0x0A]! ;将寄存器R1的内容加上0x0A形成操作数的有效地址,从而取得操作数存入寄存器R0中,然后R1的内容自增0x0A个字节

6.相对寻址

与基址变址寻址方式类似,相对寻址以程序计数器PC的当前值为基地址,指令中的地址标号作为偏移量,将两者相加后得到操作数的有效地址。比如下面的程序段完成子程序的调用和返回,跳转指令BL采用了相对寻址方式。

BLNEXT ;跳转到子程序NEXT处执行

NEXT

MOVPC,LR ;从子程序返回

7.基址加寄存器移位间接寻址

基址加寄存器移位间接寻址就是由通用寄存器的数值做移位操作,生成一个地址偏移量,基址寄存器可以加/减这个地址偏移量。例如:

LDRR1,=DIS_BUF ;内存单元地址为DIS_BUF

LDRR0,[R1,-R2,LSL#1] ;在以R1为基址,减去偏移量R2*2的内存单元中,取一个字给R0

8.多寄存器寻址

多寄存器寻址就是一次可以传送几个寄存器的值,允许一条指令传送16个寄存器的任何子集(或所有16个寄存器)。例如:

LDMIAR1,{R0,R2,R5} ;R1为基址的内存单元中的内容传送给R0;

;R1为基址,加上偏移量4后的内存单元中的内容传送给R2;

;R1为基址,加上偏移量8后的内存单元中的内容传送给R5,均为32位字对齐

9.堆栈寻址

堆栈是一种数据结构,按先进后出(FirstInLastOut,FILO)的方式工作,使用一个称为堆栈指针的专用寄存器指示当前的操作位置,堆栈指针总是指向栈顶。

根据堆栈的生成方式,堆栈又可以分为递增堆栈(AscendingStack)和递减堆栈(DecendingStack)。当堆栈由低地址向高地址生成时,称为递增堆栈;当堆栈由高地址向低地址生成时,称为递减堆栈。

ARM微处理器支持以下4种类型的堆栈工作方式。

(1)满递增堆栈:堆栈指针指向最后压入的数据,且由低地址向高地址生成。

(2)满递减堆栈:堆栈指针指向最后压入的数据,且由高地址向低地址生成。

(3)空递增堆栈:堆栈指针指向下一个将要放入数据的空位置,且由低地址向高地址生成。

(4)空递减堆栈:堆栈指针指向下一个将要放入数据的空位置,且由高地址向低地址生成。3.2.3ARM指令系统的分类

ARM指令集可以分为6类,即跳转指令、数据处理指令、程序状态寄存器(PSR)传输指令、Load/Store指令、协处理器指令和异常中断指令。

1.跳转指令

在ARM中有两种方式可以实现程序的跳转:一种是跳转指令;另一种是直接向PC寄存器(R15)中写入目标地址值。

通过直接向PC寄存器中写入目标地址值可以实现在4GB地址空间中的任意跳转,这种跳转指令又称为长跳转。如果在长跳转指令之前使用MOVLR、PC等指令,可以保存将来返回的地址值,就实现了在4GB地址空间中的子程序调用。在ARMv5及以上的版本中,可实现ARM指令集和Thumb指令集的混合使用。指令使用目标地址值的bit[0]来确定目标程序的类型。bit[0]值为1时,目标程序为Thumb指令;bit[0]值为0时,目标程序为ARM指令。

在ARMv5以前的版本中,传送到PC寄存器中的目标地址值的低两位bit[1:0]被忽略,跳转指令只能在ARM指令集中执行,即程序不能从ARM状态切换到Thumb状态。

非T系列版本5的ARM体系不含Thumb指令,当程序试图切换到Thumb状态时,将产生未定义指令异常中断。

ARM指令集的跳转指令可以从当前指令向前或向后的32MB的地址空间跳转。这类跳转指令有如下4种:B跳转指令、BL带返回的跳转指令、BX带状态切换的跳转指令以及BLX带返回和状态切换的跳转指令。ARM指令集的跳转指令说明如表3-8所示。

2.数据处理指令

数据处理指令可大致分为3类:数据传送指令、算术逻辑运算指令和比较指令。

(1)数据传送指令用于向寄存器传入一个常数。该指令包括一个目标寄存器和一个源操作数,如MOV指令。

(2)算术逻辑运算指令通常包括一个目标寄存器和两个源操作数。其中一个源操作数为寄存器的值。算术逻辑运算指令将运算结果存入目标寄存器,同时更新CPSR中相应的条件标志位,如ADD、SUB和AND等指令。

(3)比较指令不保存运算结果,只更新CPSR中相应的条件标志位。

ARM指令集的数据处理指令说明如表3-9所示。

3.程序状态寄存器(PSR)传输指令

状态寄存器中有些位是当前没有使用的,但是在ARM将来的版本中有可能使用这些位,因此用户程序不要使用这些位。

程序不能通过直接修改CPSR中的T控制位直接将程序状态切换到Thumb状态,必须通过BX等指令完成程序状态的切换。

通常修改状态寄存器是通过“读取-修改-写回”的操作序列来实现的。

状态寄存器访问指令包括以下两条:MRS状态寄存器到通用寄存器的传送指令和MSR通用寄存器到状态寄存器的传送指令。指令说明如表3-10所示。

4. Load/Store指令

Load指令用于从内存中读取数据放入寄存器中;Store指令用于将寄存器中的数据保存到内存。ARM有两大类的Load/Store指令:一类用于操作32位的字类型数据以及8位无符号的字节类型数据;另一类用于操作16位半字类型的数据以及8位有符号字节类型的数据。

Load/Store内存访问指令的一个操作数放在寄存器中,另一个操作数的寻址方式可以有多种形式。此外,批量Load内存访问指令可以一次从连续的内存单元中读取数据,传送到指令内存列表的各个寄存器中。批量Store内存访问指令可以将指令寄存器列表的各个寄存器值写入到内存中,内存的地址由指令中的寻址模式确定。

批量Load/Store内存访问指令有如下几种:LDM(1)批量内存字数据读取指令、LDM(2)用户模式的批量内存字数据读取指令、LDM(3)带状态寄存器的批量内存字数据读取指令、STM(1)批量内存字数据写入指令和STM(2)用户模式的批量内存字数据写入指令。数据交换指令用于在存储器和寄存器之间交换数据。它包括两种,即SWP字数据交换和SWPB字节数据交换。

用于操作32位的字类型数据以及8位无符号的字节类型数据的Load/Store指令以及批量Load/Store指令说明如表3-11所示。

5.协处理器指令

ARM支持16个协处理器。在程序执行过程中,每个协处理器忽略属于ARM处理器和其他协处理器的指令。当一个协处理器硬件不能执行属于它的协处理器指令时,将产生未定义指令异常中断,在该异常中断处理程序中,可以通过软件模拟该硬件操作。比如,若系统中不包含向量浮点运算器,则可以选择浮点运算软件模拟包来支持向量浮点运算。

ARM协处理器可以部分地执行一条指令,然后产生异常中断,如像除法运算除数为0的情况。这些所有操作均由ARM协处理器决定,ARM处理器并不参与这些操作。同样,ARM协处理器指令中的协处理器的寄存器标识符以及操作类型助记符也由各种不同的实现定义,程序员可以通过宏定义这些指令的语法格式。

ARM协处理器指令包括以下3类:

(1)用于ARM处理器初始化ARM协处理器的数据处理操作;

(2)用于ARM处理器的寄存器和ARM协处理器的寄存器间的数据传送操作;

(3)用于在ARM协处理器的寄存器和内存单元之间传送数据。

协处理器指令说明如表3-12所示。

6.异常中断指令

ARM有两条异常中断产生指令:软中断指令SWI(用于产生SWI异常中断,ARM通过这种机制实现在用户模式对操作系统中特权模式的程序的调用)和断点中断指令BKPT(在ARMv5及以上的版本中引入,主要用于产生软件断点,供调试程序使用)。当系统使用硬件调试部件时可忽略该中断。

异常中断指令说明如表3-13所示。3.2.4Thumb指令

作为32位的嵌入式处理器,ARM具有32位数据总线宽度,但是为了兼容数据总线宽度为16位的应用系统,ARM体系结构除了支持32位ARM指令集以外,同时支持16位的Thumb指令集。Thumb指令集是ARM指令集的一个子集,允许指令编码为16位的长度。与等价的32位代码相比较,Thumb指令集在保留32位代码优势的同时,大大节省了系统的存储空间。所有的Thumb指令都有对应的ARM指令,而且Thumb的编程模型也对应于ARM的编程模型,在应用程序的编写过程中,只要遵循一定调用的规则,Thumb子程序和ARM子程序就可以互相调用。当处理器在执行ARM程序段时,称ARM处理器处于ARM工作状态;当处理器在执行Thumb程序段时,称ARM处理器处于Thumb工作状态。

与ARM指令集相比较,Thumb指令集中的数据处理指令的操作数仍然是32位,指令地址也为32位,但Thumb指令集为实现16位的指令长度,舍弃了ARM指令集的一些特性,如大多数的Thumb指令是无条件执行的,而几乎所有的ARM指令都是有条件执行的;大多数的Thumb数据处理指令的目的寄存器与其中一个源寄存器相同。由于Thumb指令的长度为16位,即只用ARM指令一半的位数来实现同样的功能,因此,要实现特定的程序功能,所需的Thumb指令的条数较ARM指令多。在一般的情况下,Thumb指令与ARM指令的时间效率和空间效率的关系如下:

(1) Thumb代码所需的存储空间约为ARM代码的60%~70%;

(2) Thumb代码使用的指令数比ARM代码多30%~40%;

(3)若使用32位的存储器,ARM代码比Thumb代码快约40%;

(4)若使用16位的存储器,Thumb代码比ARM代码快40%~50%;

(5)与ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%。显然,ARM指令集和Thumb指令集各有其优点,若对系统的性能有较高要求,则应使用32位的存储系统和ARM指令集;若对系统的成本及功耗有较高要求,则应使用16位的存储系统和Thumb指令集。当然,若两者结合使用,充分发挥其各自的优点,会取得更好的效果。

3.3基于ARM体系的汇编语言程序设计

ARM汇编语言程序中语句由指令、伪操作和宏指令组成。在ARM中,伪操作称为derective(这里为保持和国内在IBMPC汇编语言中对名词解释的一致性,derective称为伪操作);宏指令称为pseudo-instruction,宏指令也是通过伪操作定义的。伪操作不像机器指令那样在计算机运行期间由机器执行,它是在汇编程序对源程序汇编期间由汇编程序处理的。宏是一段独立的程序代码,在程序中通过宏指令调用该宏。当程序被汇编时,汇编程序将对每个宏调用作展开,用宏定义体取代源程序中的宏指令。3.3.1ARM汇编器所支持的伪指令

在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,它们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成了。

ARM的汇编程序中有符号定义(SymbolDefinition)伪指令、数据定义(DataDefinition)伪指令和汇编控制(AssemblyControl)伪指令等。

1.符号定义伪指令

符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别

名等操作。常见的符号定义伪指令有如下几种:

(1)用于定义全局变量的GBLA、GBLL和GBLS;

(2)用于定义局部变量的LCLA、LCLL和LCLS;

(3)用于对变量赋值的SETA、SETL、SETS;

(4)为通用寄存器列表定义名称的RLIST。

2.数据定义伪指令

数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。常见的数据定义伪指令有如下几种:

(1)用于分配一片连续的字节存储单元并用指定的数据初始化的DCB;

(2)用于分配一片连续的半字存储单元并用指定的数据初始化的DCW(DCWU);

(3)用于分配一片连续的字存储单元并用指定的数据初始化的DCD(DCDU);

(4)用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化的DCFD(DCFDU);

(5)用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化的DCFS(DCFSU);

(6)用于分配一片以8字节为单位的连续的存储单元并用指定的数据初始化的DCQ(DCQU);

(7)用于分配一片连续的存储单元的SPACE;

(8)用于定义一个结构化的内存表首地址的MAP;

(9)用于定义一个结构化的内存表的数据域的FIELD。

3.汇编控制伪指令

汇编控制伪指令用于控制汇编程序的执行流程。常用的汇编控制伪指令包括以下几条。

(1) IF、ELSE、ENDIF,其语法格式如下:

IF逻辑表达式

指令序列1

ELSE

指令序列2

ENDIF

IF、ELSE、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。当IF后面的逻辑表达式为真时,则执行指令序列1,否则执行指令序列2。其中,ELSE及指令序列2可以没有,此时,当IF后面的逻辑表达式为真时,则执行指令序列1,否则继续执行后面的指令。

(2) WHILE、WEND,其语法格式如下:

WHILE逻辑表达式

指令序列

WEND

WHILE、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。当WHILE后面的逻辑表达式为真时,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真,则继续执行,一直到逻辑表达式的值为假。

(3) MACRO、MEND,其语法格式如下:

$标号宏名$参数1,$参数2,…

指令序列

MEND

MACRO、MEND伪指令可以将一段代码定义为一个整体,称为宏指令,然后就可以在程序中通过宏指令多次调用该段代码。其中,$标号在宏指令被展开时,标号会被替换为用户定义的符号。宏指令可以使用一个或多个参数,当宏指令被展开时,这些参数被相应的值替换。

宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场,从而增加了系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。包含在MACRO和MEND之间的指令序列称为宏定义体,在宏定义体的第一行应声明宏的原型(包含宏名、所需的参数),然后就可以在汇编程序中通过宏名来调用该指令序列。在源程序被编译时,汇编器将宏调用展开,用宏定义中的指令序列代替程序中的宏调用,并将实际参数的值传递给宏定义中的形式参数。

MACRO、MEND伪指令可以嵌套使用。

(4) MEXIT,其语法格式如下:

MEXIT

MEXIT用于从宏定义中跳转出去。3.3.2汇编语言的语句格式

ARM(Thumb)汇编语言的语句格式如下:

{标号}{指令或伪指令}{;注释}

在汇编语言程序设计中,每一条指令的助记符可以全部用大写或全部用小写表示,但不允许在一条指令中大、小写混用。

同时,如果一条语句太长,可将该长语句分为若干行来书写,在行的末尾用“\”表示下一行与本行为同一条语句。

1.汇编语言程序中常用的符号

汇编语言程序设计中经常使用各种符号代替地址、变量和常量等,以增加程序的可读性。尽管符号的命名由编程者决定,但并不是任意的,必须遵循以下约定:

(1)符号区分大、小写,同名的大、小写符号会被编译器认为是两个不同的符号;

(2)符号在其作用范围内必须唯一;

(3)自定义的符号名不能与系统的保留字相同;

(4)符号名不应与指令或伪指令同名。

1)程序中的变量

程序中的变量是指其值在程序的运行过程中可以改变的量。ARM(Thumb)汇编程序所支持的变量有数字变量、逻辑变量和字符串变量。

(1)数字变量用于在程序的运行中保存数字值,但注意数字值的大小不应超出数字变量所能表示的范围。

(2)逻辑变量用于在程序的运行中保存逻辑值,逻辑值只有两种取值情况:真或假。

(3)字符串变量用于在程序的运行中保存一个字符串,但注意字符串的长度不应超出字符串变量所能表示的范围。在ARM(Thumb)汇编语言程序设计中,可使用GBLA、GBLL、GBLS伪指令声明全局变量,使用LCLA、LCLL、LCLS伪指令声明局部变量,并可使用SETA、SETL和SETS对其进行初始化。

2)程序中的常量

程序中的常量是指其值在程序的运行过程中不能被改变的量。ARM(Thumb)汇编程序所支持的常量有数字常量、逻辑常量和字符串常量。

(1)数字常量一般为32位的整数。当作为无符号数时,其取值范围为0~232-1;当作为有符号数时,其取值范围为-231~231-1。

(2)逻辑常量只有两种取值情况:真或假。

(3)字符串常量为一个固定的字符串,一般用于程序运行时的信息提示。

3)程序中的变量代换

程序中的变量可通过代换操作取得一个常量,代换操作符为“$”。

如果在数字变量前面有一个代换操作符“$”,则编译器会将该数字变量的值转换为十六进制的字符串,并将该十六进制的字符串代换“$”后的数字变量。

如果在逻辑变量前面有一个代换操作符“$”,则编译器会将该逻辑变量代换为它的取值(真或假)。

如果在字符串变量前面有一个代换操作符“$”,则编译器会将该字符串变量的值代换“$”后的字符串变量。例如:

LCLSS1 ;定义局部字符串变量S1和S2

LCLSS2

S1SETS“Test!”

S2SETS"Thisisa$S1" ;字符串变量S2的值为“ThisisaTest!”

2.汇编语言程序中的表达式和运算符

汇编语言程序设计中会经常使用各种表达式,表达式一般由变量、常量、运算符和括号构成。常用的表达式有数字表达式、逻辑表达式和字符串表达式,其运算次序遵循如下的优先级:

(1)优先级相同的双目运算符的运算顺序为从左到右;

(2)相邻的单目运算符的运算顺序为从右到左,且单目运算符的优先级高于其他运算符的优先级;

(3)括号运算符的优先级最高。

1)数字表达式及运算符

数字表达式一般由数字常量、数字变量、数字运算符和括号构成。与数字表达式相关的运算符如下:

(1)“+”、“-”、“×”、“/”及“MOD”算术运算符;

(2)“ROL”、“ROR”、“SHL”及“SHR”移位运算符;

(3)“AND”、“OR”、“NOT”及“EOR”按位逻辑运算符。

2)逻辑表达式及运算符

逻辑表达式一般由逻辑量、逻辑运算符和括号构成,其表达式的运算结果为真或假。与逻辑表达式相关的运算符如下:

(1)“=”、“>”、“<”、“>=”、“<=”、“/=”、“<>”运算符;

(2)“LAND”、“LOR”、“LNOT”及“LEOR”运算符。

3)字符串表达式及运算符

字符串表达式一般由字符串常量、字符串变量、运算符和括号构成。编译器所支持的字符串最大长度为512字节。常用的与字符串表达式相关的运算符如下:

LEN运算符、CHR运算符、STR运算符、LEFT运算符、RIGHT运算符、CC运算符。

4)与寄存器和程序计数器(PC)相关的表达式及运算符

常用的与寄存器和程序计数器(PC)相关的表达式及运算符如下:

(1) BASE运算符,用于返回基于寄存器的表达式中寄存器的编号;

(2) INDEX运算符,用于返回基于寄存器的表达式中相对于其基址寄存器的偏移量。

5)其他常用运算符

其他常用运算符如下:

(1)?运算符,用于返回某代码行所生成的可执行代码的长度;

(2) DEF运算符,用于判断是否定义某个符号。3.3.3汇编语言的程序结构及子程序调用

1.汇编语言的程序结构

在ARM(Thumb)汇编语言程序中,以程序段为单位组织代码。段是相对独立的指令或数据序列,具有特定的名称。段可以分为代码段和数据段。代码段的内容为执行代码;数据段存放代码运行时需要用到的数据。一个汇编程序至少应该有一个代码段,当程序较长时,可以分割为多个代码段和数据段,多个段在程序编译链接时最终形成一个可执行的映像文件。可执行映像文件通常由以下几部分构成:

(1)一个或多个代码段,代码段的属性为只读;

(2)零个或多个包含初始化数据的数据段,数据段的属性为可读写;

(3)零个或多个不包含初始化数据的数据段,数据段的属性为可读写。

链接器根据系统默认或用户设定的规则,将各个段安排在存储器中的相应位置。因此,源程序中段之间的相对位置与可执行的映像文件中段的相对位置一般不会相同。以下是一个汇编语言源程序的基本结构示例:

AREAInit,CODE,READONLY

ENTRY

Start

LDRR0,=0x3FF5000

LDRR1,0xFF

STRR1,[R0]

LDRR0,=0x3FF5008

LDRR1,0x01

STRR1,[R0]

END在汇编语言程序中,用AREA伪指令定义一个段,并说明所定义段的相关属性,本例定义一个名为Init的代码段,属性为只读;ENTRY伪指令标识程序的入口点;接下来为指令序列;程序的末尾为END伪指令,该伪指令告诉编译器源文件的结束。每一个汇编程序段都必须有一条END伪指令,指示代码段的结束。

2.汇编语言的子程序调用

在ARM汇编语言程序中,子程序的调用一般是通过BL指令来实现的。在程序中,使用指令“BL子程序名”即可完成子程序的调用。

该指令在执行时完成如下操作:将子程序的返回地址存放在连接寄存器LR中,同时将程序计数器(PC)指向子程序的入口点,当子程序执行完毕需要返回调用处时,只需要将存放在LR中的返回地址重新拷贝给程序计数器(PC)即可。在调用子程序的同时,也可以完成参数的传递和从子程序返回运算的结果,通常可以使用寄存器R0~R3完成。以下是使用BL指令调用子程序的汇编语言源程序的基本结构示例:

AREAInit,CODE,READONLY

ENTRY

Start

LDRR0,=0x3FF5000

LDRR1,0xFF

STRR1,[R0]

LDRR0,=0x3FF5008

LDRR1,0x01

STRR1,[R0]

BLPRINT_TEXT

PRINT_TEXT

MOVPC,BL

END

3.汇编语言程序示例

以下是一个基于S3C4510B的串行通信程序,在此仅向读者说明一个完整汇编语言程序的基本结构。***********************************************

InstituteofAutomation,ChineseAcademyofSciences

Description:ThisexampleshowstheUARTcommunication!

Author:JuGuang,Lee

Date:

************************************************

UARTLCON0EQU0x3FFD000

UARTCONT0EQU0x3FFD004

UARTSTAT0EQU0x3FFD008

UTXBUF0EQU0x3FFD00C

UARTBRD0EQU0x3FFD014AREAInit,CODE,READONLY

ENTRY

**************************************************

LEDDisplay

**************************************************

LDRR1,=0x3FF5000

LDRR0,=&ff

STRR0,[R1]

LDRR1,=0x3FF5008

LDRR0,=&ff

STRR0,[R1]*************************************************

UART0linecontrolregister

*************************************************

LDRR1,=UARTLCON0

LDRR0,=0x03

STRR0,[R1]

**************************************************

UART0controlregiser

**************************************************

LDRR1,=UARTCONT0

LDRR0,=0x9

STRR0,[R1]**************************************************

UART0baudratedivisorregiser

Baudrate=19200,对应于50MHz的系统工作频率

***************************************************

LDRR1,=UARTBRD0

LDRR0,=0x500

STRR0,[R1]

***************************************************

Printthemessages!

***************************************************

LOOP

LDRR0,=Line1BLPrintLine

LDRR0,=Line2

BLPrintLine

LDRR0,=Line3

BLPrintLine

LDRR0,=Line4

BLPrintLine

LDRR1,=0x7FFFFF

LOOP1

SUBSR1,R1,#1

BNELOOP1

BLOOP***************************************************

Printline

***************************************************

PrintLine

MOVR4,LR

MOVR5,R0

Line

LDRBR1,[R5],#1

ANDR0,R1,#&FF

TSTR0,#&FF

MOVEQPC,R4

BLPutByteBLine

PutByte

LDRR3,=UARTSTAT0

LDRR2,[R3]

TSTR2,#&40

BEQPutByte

LDRR3,=UTXBUF0

STRR0,[R3]

MOVPC,LRLine1DCB&A,&D,"********************************************************",0

Line2DCB&A,&D,"ChineseAcademyofSciences,InstituteofAutomation,ComplexSystemLab.",0

Line3DCB&A,&D,"ARMDevelopmentBoardBasedonSamsungARMS3C4510B.",0

Line4DCB&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,0

END

4.汇编语言与C/C++的混合编程

在应用系统的程序设计中,若所有的编程任务均用汇编语言来完成,其工作量是可想而知的,同时,不利于系统升级或应用软件移植,事实上,ARM体系结构支持C/C++以及与汇编语言的混合编程,在一个完整的程序设计中,除了初始化部分用汇编语言完成以外,其主要的编程任务一般都用C/C++完成。汇编语言与C/C++的混合编程通常有以下几种方式:

(1)在C/C++代码中嵌入汇编指令;

(2)在汇编程序和C/C++的程序之间进行变量的互访;

(3)汇编程序、C/C++程序间的相互调用。在以上几种混合编程技术中,必须遵守一定的调用规则,如物理寄存器的使用、参数的传递等,这对于初学者来说,无疑显得过于烦琐。在实际的编程应用中,使用较多的方式是:程序的初始化部分用汇编语言完成,然后用C/C++完成主要的编程任务,程序在执行时首先完成初始化过程,然后跳转到C/C++程序代码中,汇编程序和C/C++程序之间一般没有参数的传递,也没有频繁的相互调用,因此,整个程序的结构显得相对简单,容易理解。以下是一个这种结构程序的基本示例:**************************************************

InstituteofAutomation,ChineseAcademyofSciences

FileName:Init.s

Description:

Author:JuGuang,Lee

Date:

**************************************************

IMPORTMain ;通知编译器该标号为一个外部标号

AREAInit,CODE,READONLY ;定义一个代码段ENTRY ;定义程序的入口点

LDRR0,=0x3FF0000 ;初始化系统配置寄存器,具体内容可参考第5章和第6章

LDRR1,=0xE7FFFF80

STRR1,[R0]

LDRSP,=0x3FE1000 ;初始化用户堆栈,具体内容可参考第5章和第6章

BLMain ;跳转到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论