AT&T格式汇编学习

Linux内核代码大量使用内嵌汇编,以进行某些特定功能的实现,或对某功能进行快速实现。使用的汇编格式为AT&T,本文就该种格式的汇编和Intel格式的汇编进行讲述。网络上也有众多文章涉及到这方面,所以本文更多是归纳总结。形成自己的学习笔记。

一、 大小写

INTEL格式的指令使用大写字母,而AT&T格式的使用小写字母。

二、 操作数赋值方向

在INTEL语法中,第一个表示目的操作数,第二个表示源操作数,赋值方向从右向左。
AT&T语法第一个为源操作数,第二个为目的操作数,方向从左到右,合乎自然。
示例:
将ebx的值赋给eax:

1
INTEL:MOV EAX,EBX AT&T:movl %ebx,%eax

三、前缀

在 INTEL 语法中寄存器和立即数不需要前缀; AT&T 中寄存器需要加前缀“%” ,而立即数需要加前缀“$” 。
示例:将1赋值给eax:

1
2
INTEL:MOV EAX,1   
AT&T:movl $1,%eax

符号常数直接引用,不需要加前缀,如:movl value , %ebx语句中value为一常数。在符号前加前缀$表示引用符号地址,如:movl $value, %ebx是将value的地址放到 ebx中。
总线锁定前缀“lock” :总线锁定操作。 “lock”前缀在Linux 核心代码中使用很多,特别是SMP代码中。当总线锁定后其它CPU不能存取锁定地址处的内存单元。
远程跳转指令和子过程调用指令的操作码使用前缀“l”,分别为 ljmp,lcall,与之相应的返回指令为lret。
示例:

1
2
3
4
INTEL                                 AT&T   
CALL FAR SECTION:OFFSET lcall $secion:$offset
JMP FAR SECTION:OFFSET ljmp $secion:$offset
RET FAR SATCK_ADJUST lret $stack_adjust

四、间接寻址语法

INTEL中基地址使用“[” 、“]” ,而在 AT&T 中使用“(”、“)” ;另外处理复杂操作数的语法也不同,INTEL 为 “Segreg:[base+index*scale+disp] ”。而在 AT&T 中为“%segreg:disp(base,index,sale)”,其中segreg,index,scale,disp都是可选的,在指定index而没有显式指定Scale的情况下使用默认值 1。scale和 disp不需要加前缀“&” 。
示例:

1
2
INTEL INSTR FOO,SEGREG:[BASE+INDEX*SCALE+DISP]  
AT&T instr %segreg:disp(base,index,scale),foo

五、 后缀

AT&T语法中大部分指令操作码的最后一个字母表示操作数大小, “b”表示 byte(一个字节),“w”表示 word(2 个字节),“l”表示 long(4 个字节)。
INTEL 中处理内存操作数时也有类似的语法,如:BYTE PTR、WORD PTR、DWORD PTR。
示例:

1
2
3
4
INTEL                                AT&T   
MOV AL, BL movb %bl,%al
MOV AX,BX movw %bx,%ax
MOV EAX, DWORD PTR[EBX] movl (%ebx), %eax

在AT&T汇编指令中,操作数扩展指令有两个后缀,一个指定源操作数的字长,另一个指定目标操作数的字长。AT&T 的符号扩展指令的为“movs” ,零扩展指令为“movz” (相应的 Intel指令为“movsx”和“movzx”) 。
因此, “movsbl %al,%edx”表示对寄存器 al 中的字节数据进行字节到长字的符号扩展,计算结果存放在寄存器edx中。下面是一些允许的操作数扩展后缀: bl: 字节->长字 bw: 字节->字 wl: 字->长字 跳转指令标号后的后缀表示跳转方向,“f” 表示向前 (forward) , “b” 表示向后 (back) 。
例:jmp 1f

1
2
3
4
xxx 
jmp 1f
1:
mov $0x8000C580, %eax

李迟2016.2.16 晚