Linux内核代码大量使用内嵌汇编,以进行某些特定功能的实现,或对某功能进行快速实现。使用的汇编格式为AT&T,本文就该种格式的汇编和Intel格式的汇编进行讲述。网络上也有众多文章涉及到这方面,所以本文更多是归纳总结。形成自己的学习笔记。
一、 大小写
INTEL格式的指令使用大写字母,而AT&T格式的使用小写字母。
二、 操作数赋值方向
在INTEL语法中,第一个表示目的操作数,第二个表示源操作数,赋值方向从右向左。
AT&T语法第一个为源操作数,第二个为目的操作数,方向从左到右,合乎自然。
示例:
将ebx的值赋给eax:
1 | INTEL:MOV EAX,EBX AT&T:movl %ebx,%eax |
三、前缀
在 INTEL 语法中寄存器和立即数不需要前缀; AT&T 中寄存器需要加前缀“%” ,而立即数需要加前缀“$” 。
示例:将1赋值给eax:
1 | INTEL:MOV EAX,1 |
符号常数直接引用,不需要加前缀,如:movl value , %ebx
语句中value为一常数。在符号前加前缀$表示引用符号地址,如:movl $value, %ebx
是将value的地址放到 ebx中。
总线锁定前缀“lock” :总线锁定操作。 “lock”前缀在Linux 核心代码中使用很多,特别是SMP代码中。当总线锁定后其它CPU不能存取锁定地址处的内存单元。
远程跳转指令和子过程调用指令的操作码使用前缀“l”,分别为 ljmp,lcall,与之相应的返回指令为lret。
示例:
1 | INTEL AT&T |
四、间接寻址语法
INTEL中基地址使用“[” 、“]” ,而在 AT&T 中使用“(”、“)” ;另外处理复杂操作数的语法也不同,INTEL 为 “Segreg:[base+index*scale+disp] ”。而在 AT&T 中为“%segreg:disp(base,index,sale)”,其中segreg,index,scale,disp都是可选的,在指定index而没有显式指定Scale的情况下使用默认值 1。scale和 disp不需要加前缀“&” 。
示例:
1 | INTEL INSTR FOO,SEGREG:[BASE+INDEX*SCALE+DISP] |
五、 后缀
AT&T语法中大部分指令操作码的最后一个字母表示操作数大小, “b”表示 byte(一个字节),“w”表示 word(2 个字节),“l”表示 long(4 个字节)。
INTEL 中处理内存操作数时也有类似的语法,如:BYTE PTR、WORD PTR、DWORD PTR。
示例:
1 | INTEL AT&T |
在AT&T汇编指令中,操作数扩展指令有两个后缀,一个指定源操作数的字长,另一个指定目标操作数的字长。AT&T 的符号扩展指令的为“movs” ,零扩展指令为“movz” (相应的 Intel指令为“movsx”和“movzx”) 。
因此, “movsbl %al,%edx”表示对寄存器 al 中的字节数据进行字节到长字的符号扩展,计算结果存放在寄存器edx中。下面是一些允许的操作数扩展后缀: bl: 字节->长字 bw: 字节->字 wl: 字->长字 跳转指令标号后的后缀表示跳转方向,“f” 表示向前 (forward) , “b” 表示向后 (back) 。
例:jmp 1f
1 | xxx |
李迟2016.2.16 晚