ARM 汇编语言基础

avatar
作者
筋斗云
阅读量:0

目录

汇编指令代码框架

汇编指令语法格式

数据处理指令

数据搬移指令 mov

示例

立即数的本质

立即数的特点

立即数的使用

算术运算指令

指令格式

add 普通的加法指令

adc 带进位的加法指令

跳转指令

Load/Store指令

状态寄存器指令


基础概念

  1. C 语言与汇编指令的关系

    • 语句:带有分号 (;) 的 C 语言语句可以被编译成汇编指令。
    • 预处理指令:以井号 (#) 开头的行称为预处理指令,它们告诉编译器如何处理源代码。
  2. 汇编语言的整体分类

    • 指令:编译后生成一条机器码,存储在内存中供 CPU 执行。
    • 伪操作:不生成机器码也不占用内存,用于控制汇编过程。

      (相当于c中的’#‘的内容)告诉编译器怎么编译)

    • 伪指令:在编译时被替换为一系列等效的指令,用于实现某些高级功能。

      (如:cpu中没有乘法器,对应没有乘法指令,3*3 ---》用加法器实现3+3+3,替换实现)

  3. 注释

    • 单行注释:使用 @ 符号开始。
    • 多行注释:使用 /**/ 包围。
  4. 指令分类

    • 数据处理指令:对数据进行逻辑和算术运算。
    • 跳转指令:改变程序流程,即修改程序计数器 PC。
    • Load/Store 指令:读取和写入内存。
    • 状态寄存器传送指令:读写 CPSR(当前程序状态寄存器)。
    • 异常中断产生指令:触发软件中断(SWI),用于系统调用。
    • 协处理器指令:操作协处理器,比如浮点运算单元 FPU。

汇编指令代码框架

.text .global _start _start:     ; 汇编代码段 .end

汇编指令语法格式

<opcode><code>{s} Rd, Rn, operand2
  • opcode:指令名称。
  • code:条件码,可选,默认无条件执行。
  • s:是否更新 CPSR 的标志位。
  • Rd:目标寄存器。
  • Rn:第一个操作寄存器。
  • operand2:第二个操作数,可以是寄存器或立即数。
  • 注:指令的名字,条件码,s连到一起写,指令名和目标寄存器之间使用空格,寄存器和数据之间使用逗号隔开,指令中的字符不区分大小写

数据处理指令

数据搬移指令 mov

  • 格式<opcode><code>{s} Rd, operand2
  • 立即数形式mov{<code>}{s} Rd, #immediate
示例

在这个示例中,我们首先声明了一个 .text 段,然后定义了一个全局符号 _start,这是程序的入口点。接下来我们初始化寄存器 R00x1234,然后将 R0 的值复制给 R1。最后,通过 bx lr 返回到调用者

.text .global _start  _start:     ; 初始化寄存器 R0 为 0x1234     mov r0, #0x1234     ; 将 R0 的值移动到 R1     mov r1, r0     ; 结束程序     bx lr  .end
  • 1》数据搬移指令 mov
  • @ 格式:<opcode><code>{s} Rd, oprand2
  • 如果是立即数,前边必须加#

PC寄存器详细讲解:

指令的执行三步:取,译码,执行(PC永远指向当前正在取指指令的地址)。

立即数在 ARM 汇编语言中是一个重要的概念。立即数是直接编码在指令中的数值,它与普通变量不同,后者通常存储在内存中。下面是关于立即数的一些详细说明和优化后的格式:

立即数的本质

立即数是直接嵌入在指令中的数据,作为指令的一部分。这意味着当指令被加载到处理器中时,立即数也会同时被加载。

立即数的特点

  • 优点
    • 快速访问:因为立即数是与指令一同加载的,所以不需要额外的时间去内存中获取。
    • 节省空间:如果立即数足够小,那么可以减少对寄存器的需求,从而节省空间。
  • 缺点
    • 数量有限:立即数的大小受到指令格式的限制,ARM 架构中立即数通常被限制在一定范围内。
    • 表达能力受限:由于立即数大小的限制,有时候无法直接表示较大的数值。

立即数的使用

在 ARM 汇编语言中,立即数通常用于简单的数值操作,例如赋值或者与寄存器进行逻辑运算。立即数只能是某些特定的值,并且这些值通常被限制为可以由指令直接处理的形式。

如:MOV ,#0x12345678 @报错,不合法

对于 mov 指令而言,立即数必须是一个可以通过位移得到的 8 位值。这意味着立即数必须是 2 的幂次方的倍数,并且最大不超过 255。例如, 0x1234 是一个有效的立即数,因为它可以通过位移得到。但是 0x12345678 则不是一个有效的立即数,因为它超过了 8 位的限制,并且不能通过简单的位移得到。

注:使用mov 给寄存器里面存放值的时候,#号后面需是有效数(1:立即数,2:取反之后是立即数),如果不是立即数需要用ldr指令进行存放。

算术运算指令

常见的算术运算指令包括:

  • add:加法
  • adc:带进位的加法
  • sub:减法
  • sbc:带借位的减法
  • mul:乘法

指令格式

算术运算指令的一般格式如下:

<opcode>{<code>}{s} Rd, Rn, operand2

其中:

  • <opcode> 是指令名称。
  • <code> 是条件码,可选。
  • {s} 表示是否更新 CPSR 的标志位。
  • Rd 是目标寄存器。
  • Rn 是第一个操作寄存器。
  • operand2 是第二个操作数,可以是寄存器或立即数。
add 普通的加法指令

adc 带进位的加法指令

假设2个64位的数相加

  • 第一个64位的数,R0存放低32位,R1存放高32位,
  • 第二个64位的数,R2存放低32位,R3存放高32位
  • 结果R4存放低32位,R5存放高32位

add和ADC的区别,例如是64位的字符,如果低位大小满足进1的话用ADD只会显示在C进1,但是存储的地址并不进1,ADC的话则会将存储的地址进1

注意:mul r2, r0, #0x4 @ 错误

乘法指令的第二个操作数只能是一个寄存器

mul r2, r1,r0

跳转指令

1》修改PC,不建议使用,因为需要查询指令的地址

2》 b bl :指令跳转

  • 格式:b/bl Label
  • Label: 指令
  • 相当C语言的函数调用
  • B指令(不带返回的跳转)

不保存返回地址的跳转(返回地址不保存到lr中)

  • BL指令(带返回的跳转指令),将LR的值修改成跳转指令下一条指令的地址,再将PC的值修改成跳转标识符下指令的地址

补充了解:

RM指令条件码表:可跟的判断条件成立跳转(NZCV在用于判断两者之间关系使用比较多)

如:c代码如下:

练习:     实现以下逻辑 		unsigned int r1 = 9; 		unsigned int r2 = 15; 		while(1) 		{ 		        if(r1 == r2) 				goto stop; 			if(r1 > r2) 		            	r1 = r1 - r2; 		        if(r1 < r2) 		         	r2 = r2 - r1; 		} 	stop: 		        while(1);  汇编指令练习答案如下:     mov r1,#9     mov r2,#15 loop:       cmp r1,r2  @cmp 比较指令       beq  stop       subhi r1,r1,r2       subcc r2,r2,r1       b loop stop:     b stop

Load/Store指令

对内存的读写操作//如 a++ 读a的值,将运算结果从cpu写道内存

可用地址查找:(我们不用查找,脚本文件中配置了内存空间的分配) 查看内存中内容:

1>单寄存器操作指令 ldr/str

  1. 格式:ldr/str Rm, [Rn]
  2. Rm: 存储是数据

Rn:存储的数据,地址

将CPU中r1寄存器中的数据存储到内存中r0地址的空间中

  • 将r0指向的地址空间中的内容,读到r2寄存器中
  • ldr r2, [r0]

  • 将r1中的值存储到r0+4指向的地址空间中,R0中的值不变
  • str r1, [r0, #4];

  • 将r2中的值存储到r0指向的地址空间中,r0 = r0 + 4
  • str r2, [r0], #4

  • 将R3中的值存储到R0+4指向的地址空间中,并且r0 = r0 + 4
  • str r3, [r0, #4]!

  • 2>多寄存器操作指令 stm ldm
  • 将r1到r4中的值存储到r0指向地址空间中,连续16个字节的地址空间
  • stm r0, {r1-r4}

  • 将r0指向的地址空间中,连续的16个字节的数据,读到r5-r8寄存器中
  • ldm r0, {r5-r8}

  • 如果寄存器列表中的寄存器编号既有连续又有不连续,连续的使用“-”隔开,不连续的使用“,”
  • stm r0, {r1-r3,r4}

  • 2. 不管寄存器列表中的寄存器编号顺序如何变化,都是小地址对应小编号的寄存器高地址对应大编号的寄存器
  • stm r0, {r4,r3,r2,r1}
  • ldm r0, {r8,r7,r6,r5}

  • 3>栈的操作指令 stmfd ldmfd
  • 栈的种类
    • 空栈(Empty)

栈指针指向的地址是空的,在栈中存储数据时,可以直接存储,存储完成之后需要将栈指针再次指向空的位置。

  • 满栈(Full)

栈指针指向的地址有数据,在栈中存储数据时,需要先将栈指针,指向一个空的位置,然后在存储数据。

  • 增栈(Ascending)

栈指针向高地址方向移动

  • 减栈(Descending)

栈指针向低地址方向移动

操作栈的方式有四种

  • 满增栈 满减栈 空增栈 空减栈
  • FA:Full Ascending 满增(FA)
  • FD:Full Descending 满减(FD)
  • EA:Empty Ascending 空增(EA)
  • ED:空减
  • ARM默认采用的是满减栈

  • stmfd/ldmfd<code> sp!, {寄存器列表}
  • stmfd sp!, {r1-r5}(写) (压栈)

更新栈指针指向的地址空间

  • ldmfd sp!, {r6-r10}(读) (出栈)

特殊:

stmfd sp!, {r1-r5,lr}(写) (压栈)

ldmfd sp!, {r6-r10,pc}(读) (出栈) //r1-r5出栈给r6-r10, 将lr的值出栈给pc

状态寄存器指令

对CPSR进行读写操作//其他都不能动CPSR (SWI 指令是linux内核有,所以arm为了匹配才有的指令)(CPSR保存cpu的状态、模式、中断中断开关、运算状态,非常重要,不能任意更改,只有一类指令能操作这个寄存器)

1》读cpsr 指令mrs

2》写cpsr 指令 msr :一般情况不能修改cpsr,只能用msr命令修改,user模式下不能切换到其他模式。

注:修改CPSR的控制域(bit[7:0]),修改CPSR时必须指定修改哪个区域

USER模式下不能修改CPSR的值,防止应用程序修改CPU状态,保护操作系统

CPSR_C修改的是CPSR的低八位ctrl(控制)域,一般都只修改C域

OK,就分享到这,如果帮到你那就点个关注吧~

    广告一刻

    为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!