Swift与LLVM-Clang原理与示例

本文介绍: Swi ft与LLVM-Clang 原理与示例LLVM 学习从简单汇编基础到 Swi ft 不简单的 a + 1作为iOS开发，程序崩溃犹如家常便饭，秉着没有崩溃也要制造崩溃的原则每天都吃的很饱但学艺不精的经常有这样的困扰，每次崩溃都定位到一堆。类似m ovq $0x0, 0xc7a(%rip) 的天书里面初识汇编虽然不知道 m ovq是什么意思，但知道 m ov emo v e 的意思，没错是飘逸至于q，不管 q不q 的，哎e呢？汇编语言汇编语言:(asse m bly language

Swi ft与LLVM-Clan g 原理与示例
LLVM 学习
在这里插入图片描述

在这里插入图片描述

从简单汇编基础到 Swi ft 不简单的 a + 1
作为iOS开发，程序崩溃犹如家常便饭，秉着没有崩溃也要制造崩溃的原则
每天都吃的很饱
但学艺不精的经常有这样的困扰，每次崩溃都定位到一堆。类似
m ovq $0x0, 0xc7a(%rip) 的天书里面
初识汇编
虽然不知道movq是什么意思，但知道mov e
mov e 的意思，没错是飘逸
至于q，不管 q不q 的，哎e呢？
汇编语言
 汇编语言:(assembly language) 是一种用于电子计算机、微处理器、微控制器，或其他可编程器件的低级语言 – 维基百科
简单来说，平时写的代码都是高级语言，计算机不理解高级语言，就像吃饭不吃塑料包装一样，吃的是里面的东西
汇编语言是二进制指令的文本形式，计算机会把代码转换为汇编语言，汇编语言通过机器指令还原成二进制代码，也就是所谓的 0，1，计算机就可以执行了。
每一个 CPU的机器指令不同，所以对应的汇编语言也不同。
寄存器
 为什么需要了解寄存器？
因为汇编语言的数据存储与寄存器和内存息息相关
一般来说，数据是放在内存中的，CPU 计算的时候就去内存里拿数据，但是
CPU 的运算速度 &g t; 内存的运算速度
就仿佛
吃饭的速度 &g t; 食堂大妈打菜的速度
受不了，大妈受得了吗？
所以CPU 自带了一级，二级缓存，相当于大妈让她儿子给送饭
问题是这个中间层还是慢且不稳定
CPU 缓存的数据地址是不固定的，意味着点了份西红柿盖浇饭，让店员给送到座位上，店员找了半个小时，发现坐在别人店里。
所以CPU 有了寄存器，来存储频繁使用的数据。CPU 通过寄存器跟内存间接交换数据
寄存器都有自己的名称(如 rax ，r d x等)
说坐在C区21号，店员还不是分分钟把饭塞到嘴里，质问：喂，还要饭吗？
所以CPU 会去指定名称的寄存器拿数据，这样速度就不快了嘛
天下武功，唯快不破。
所以为什么需要寄存器，因为读写速度够快
内存
说到底，寄存器依旧是一个暂存区，只是一个中间站，真正存储数据，操作数据的还是内存。
以下是内存分布图:
在这里插入图片描述

简单介绍一下堆栈
• 堆 heap
o 分配方式：alloc，速度相对栈比较慢，容易产生内存碎片
 o 管理方式：程序员，ARC下面，堆区的分配和释放基本也是系统操作
o 地址分布：从低到高，非连续
o 大小：取决于计算机系统的有效的虚拟空间
o 作用：动态分配内存，存储变量，延长生命周期
• 栈 stack
o 一端进行插入和删除操作的特殊线性表
o 分配方式：系统，速度比较快
o 管理方式：系统，不受程序员控制
o 地址分布：从高到低，连续
o 大小：栈顶的地址和容量是系统决定
o 生命周期：出了作用域就会释放
o 入栈出栈：先进后出，类似羽毛球筒，先放入的羽毛球，总是最后才能拿到
在Linux 下，i t e rm2 敲下ulimit -a，可以看到栈分配的默认大小为 8192 ，也就是 8M
–t: cpu time (s ec on ds) unlimited
-f: file size (block s) unlimit e d
–d: data seg s ize (k bytes) unlimited
–s: stack size (k bytes) 8192
复制代码
汇编语言
因为是iOS开发，所以就只稍微了解了 AT&T 汇编的皮毛
虽然看起来会枯燥一点，但是理解这些比较常用的寄存器，对汇编代码的理解就会有质的飞跃
之前是门外汉
现在好歹算个半个汇编人
iOS 模拟器、MAC OS、Linux : AT&T汇编 ;

iOS 真机： ARM 汇编
复制代码
x86-64 中,AT&T 中常用的寄存器有 16种：
• %rax、%r bx、%rcx、%rdx、%rsi、%r di、%r bp、%rsp
• %r8、%r9、%r10、%r11、%r12、%r13、%r14、%r15
常用寄存器
AT&T 常用寄存器介绍：
%rax：常作为函数返回值。一般来说，为了向后兼容，64位的寄存器会兼容32的寄存器，32和64可以一起使用
64位: 8个字节，以 r 开头; 32位: 4个字节，以e 开头，看图
在这里插入图片描述

在64位的寄存器 rax中，为了兼容分配了较低的32位，也就是4个字节给了 eax。基本上，汇编出现的eax 就是代表rax，eax是 rax 的一部分，其他部分寄存器同理
%rdi、%rsi、%rdx、%rcx、%r8、%r9: 常作为函数参数
r8,r9 这种32位的表示法，通常在后面加d，如r8d,r9d
%rip: 指令指针，存储CPU 即将执行的指令地址
• 解释一下rip
即将执行: 下一条执行
 指令地址: 开头的那一串 0x100…

父函数不保存，交由子函数保存和恢复寄存器的值
复制代码
例子
 简单的建立一个命令行工程，打开汇编 Alway s Show Disass embly
用 Swi ft 写出以下代码
func test() -> Int {
var a = 3
a = a + 1
return a
}
-> test() // 断点指向 test，run
复制代码
程序运行起来，程序断点在 test 函数调用的地方
zzzmain: 0x100000bc0 <+0>: pushq %rbp 0x100000bc1 <+1>: movq %rsp, %rbp 0x100000bc4 <+4>: subq $0x20, %rsp 0x100000bc8 <+8>: movl %edi, -0x4(%rbp) 0x100000bcb <+11>: movq %rsi, -0x10(%rbp) -> 0x100000bcf <+15>: callq 0x100000bf0 ; zzz.test() -> Swift.Int at main.swift:189 0x100000bd4 <+20>: xorl %edi, %edi 0x100000bd6 <+22>: movq %rax, -0x18(%rbp) 0x100000bda <+26>: movl %edi, %eax 0x100000bdc <+28>: addq $0x20, %rsp 0x100000be0 <+32>: popq %rbp 0x100000be1 <+33>: retq 复制代码控制台用 si 进入 test 函数内部可以看到 test 内部的汇编代码,参考下面的图，说一说理解 zzztest():
-> 0x100000bf0 <+0>: pushq %rbp
0x100000bf1 <+1>: movq %rsp, %rbp
0x100000bf4 <+4>: movq $0x0, -0x8(%rbp)
0x100000bfc <+12>: movq $0x3, -0x8(%rbp)
0x100000c04 <+20>: movq $0x4, -0x8(%rbp)
0x100000c0c <+28>: movl $0x4, %eax
0x100000c11 <+33>: popq %rbp
0x100000c12 <+34>: retq
复制代码
• 借图，侵删
子函数调用时，调用者与被调用者的栈帧结构
在这里插入图片描述