程序机器级表示

通过阅读汇编代码,我们能够理解编译器的优化能力,并分析出代码中潜在的低效率。

一、机器级代码

在整个编译过程中,编译器会完成大部分工作,将把C提供的相对比较抽象的执行模型表示的程序转化为处理器执行的非常基本的指令。与目标代码相比,汇编代码是可读性更好的文本格式表示。能够理解汇编代码以及它是如何与原始C代码相对应,是理解计算机如何执行程序的关键一步。

对C程序员屏蔽的处理器状态可见的

  • 程序计数器(%eip):表示将要执行下一条指令在存储器中的地址
  • 整数寄存器文件包含8个被命名的位置,分别存储32位的值。这些寄存器可以存储地址(对应于C的指针)或整数数据。有的寄存器用来记录某些重要的程序状态,其他寄存器用来保存临时数据。
  • 条件寄存器保存最近执行的算术指令状态,实现控制流中的条件变化,比如if或while
  • 浮点寄存器文件包含8个位置,用来存放浮点数据

(1)代码示例

假设我们写了一个C代码文件code.c,包含下面这样的过程定义

int accum = 0;

int sum(int x, int y)
{
    int t = x + y;
    acum += t;
    return t;
}

在命令行执行”-S“选项,看到C编译器产生的汇编代码

unix> gcc -O2 -S code.c

编译器产生一个汇编文件code.s,不做其他近一步工作
汇编代码文件包含各种声明

sum:
    pushl %ebp
    movl %esp,%ebp
    mov1 12(%ebp),%eax 
    addl 8(%ebp),%eax
    addl %eax,accum
    mov1 %ebp,%esp
    pop1 %ebp
    ret

上面代码中每个缩进去的行都对应于一条机器指令。比如pushl 指令表示应该将寄存器%ebp的内容压入栈中。

(2)访问信息

一个IA32中央处理单元(cpu)包含一组8位值的寄存器,这些寄存器用来存储整数数据和指针。下图显示了8个寄存器,以%e开头。在过程处理中,对前三个寄存器(%eax,%ecx和%edx)的保存和恢复惯例将不同于接下来的三个寄存器(%ebx,%edi,%esi),最后两个寄存器(%ebp和%esp)保存着指向栈中重要位置的指针,只有根据栈惯例的标准才能修改这两个寄存器中的值

(a)操作指示符

大多数指令都有一个或多个操作数,指示出执行一个操作中药引用的源数据值,以及放置结果的目的位置。源数据值可以以常数形式给出,或是从寄存器或存储器中读出,结果可以存放在寄存器或存储器中。

各种操作数可能被分为三种类型。

  • 立即数,也就是常数值。后面跟着一个整数,比如-577或$0x1F
  • 寄存器,某个寄存器中的内容
  • 存储器引用,根据计算出来的地址(有效地址)访问某个存储器位置。

有多种寻址模式:允许不同形式的存储器引用。立即数偏移,基址寄存器,变之或索引寄存器,伸缩因子(必需是1、2、4、8)。

(3)数据传送指令

最频繁的指令是执行数据传送指令。操作符指令能够完成许多机器中要好几条指令才能完成的功能。下图列出一些重要的数据传送指令,最常用的是传送双字的movl指令。

源操作数指令一个值,它可以是立即数,可以存放在寄存器中,也可以存放在存储器中。目的操作数指定一个位置,它可以是寄存器,也可以是存储器地址。

数据传输指令.jpg

第一个是原操作数,第二个是目的操作数。

movb指令是类似的,除了它只传送一个字节。movw传送两个字节。movsbl和movzbl指令负责拷贝一个字节,并设置目的操作数中其余的位。movsbl指令的源操作数时单字节的,它执行符号扩展到32位(将高24位设置为源字节的最高位),然后拷贝到双字的目的中。movzbl指令的源操作数时单字节的,在前面加24个0扩展到32位,并将结果拷贝到双字的目的中。

pushl和popl指令都只有一个操作数----同于压入的数据源和用于弹出的目的数据。程序栈存放在储存器中某个区域。%esp保存栈顶元素的地址

(4) 算术和逻辑操作

(a)加载有效地址

加载有效地址(leal)实际上是movl指令的变形,从存储器读数据到寄存器,实际上根本没有引用存储器。第一个操作看上去是一个寄存器引用,但该指令并不是从指定的位置读入数据,而是将有效地址写入到目的操作数(如寄存器)。C中&S说明这种操作,为后面的存储器引用产生指针。例子,如果寄存器%eax值为x,指令leal 7(%edx,%eax ,4),%eax将设置寄存器%eax的值为x,那么leal 7(%edx,%edx,4),%eax将设置%eax的值为5x+7。注意目的操作数必须是寄存器。

(b)一元和二元操作

第二类操作是一元操作,只有一个操作数,即做源,也作目的。这个操作数可以是一个寄存器,也可以是一个存储器位置。比如说,指令incl(%esp)会使栈顶元素加1。这种说法让人想起C中的加1运算符(++)和减1运算符(--)

第三类是二元操作,第二个操作数既是源又是目的。这种语法让人想起C中像+=这样的赋值运算符。注意,源操作数是第一个,目的操作数时第二个,这是不可交换操作持有的。例如指令subl %eax,%edx使寄存器%edx的值减去%eax中的值。第一个操作可以是立即数,寄存器或存储器位置。第二个操作数可以是寄存器或存储器围桌。不过movl指令一样,两个操作数不能同时都是存储器位置。

(c)位移操作

先给出位移量,然后是待位移的值,可以进行算术或逻辑右移。移位量用单个字节编码。位移量可以是一个立即数,或者存放在单字节寄存器中%cl中。左移指令:sall,shll。两者效果都一样,都是将右边填上0。右移指令sarl执行算术移位(填上符号位
,而shrl执行逻辑位移(填上0)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容