计算机系统基础

ICS 中的基本运算和概念

计算机系统概述

计算机的发展

  1. 1946年,第1台通用电子计算机 ENIAC诞⽣生
    • 由电子真空管组成
  2. 电子管计算机
  3. 晶体管
  4. SSI, MSI, LSI, VLSI, ULSI

冯.诺依曼计算机结构

  1. 计算机由运算器, 控制器, 存储器, 输入设备, 输出设备组成
  2. 指令和数据用二进制表示, 形式上没有差别, 通过CPU访问阶段进行区别
  3. 指令和数据存储在存储器中, 按地址访问
  4. 指令由 操作码和地址码组成, 操作码指定操作性质, 地址码指定操作数地址
  5. 采用 “存储程序” 方式进行工作

计算机系统抽象层的转换

高级语言虚拟机 - 汇编语言虚拟机 - 操作系统虚拟机 - 机器语言机器

程序开发与执行过程

从一个程序的编写到完成程序的执行整个过程简述如下:

  1. 通过本文编辑软件编写源程序文件(如hello.c)
  2. 然后使用语言处理工具,对源程序文件进行预处理、编译、汇编和链接,最终生成可执行目标文件。
  3. 通过双击程序图标或在命令行中输入命令等方式,启动可执行目标文件执行
  4. 每一个可执行文件的执行都采用"存储程序”工作方式。一旦程序被启动就会装入主存,CPU从主存储器中取出指令,并对指令译码,根据译码结果控制数据的运算、传送或存储,每条指令执行完后,CPU能自动控制执行下一条指令或跳转到某一条指令处执行,当可执行文件中包含的所有指令都执行结束,则程序执行结束。

性能参数

  • 时钟周期 = 时钟频率的倒数
  • CPI
  • MIPS 峰值MIPS 平均每秒执行多少百万条整数运算指令
  • MFLOPS 百万次浮点运算 GFLOPS TFLOPS
  • 执行时间

数据的机器级表示与处理

整数

加减运算

  1. 原码 -> 变成绝对值的运算

  2. 补码 -> [X]=2n+X[X] = 2^n + X

加法直接相加, 减法中, 被减数取反加 1 再相加

C中的整数

类型转换: 带符号数 -> 无符号数

常用数据:

  • 2147483647=23112147483647 = 2^{31} - 1

  • 2147483648=2312147483648 = 2^{31}

在 ISO C90 下, 2147483648 为 **unsigned int**型

溢出判断

对于补码而言, 在进行加法时, 如果两个数的最高位不同, 不会发生溢出.
否则, 如果

  1. 运算结果的最高位与加数的最高位不同
  2. 最高位进位与次高位进位的异或为 1

则发生了溢出.

比较判断

关系 无符号数 有符号数
等于 ZFZF ZFZF
大于 CF+ZF\overline{CF+ZF} ZF(SFOF)\overline{ZF}\cdot\overline{(SF \bigoplus OF)}
小于 CFZFCF\cdot\overline{ZF} ZF(SFOF)\overline{ZF} \cdot(SF \bigoplus OF)
大于等于 CF+ZF\overline{CF}+ZF ZF+(SFOF)ZF+\overline{(SF \bigoplus OF)}
小于等于 CF+ZFCF+ZF ZF+(SFOF)ZF+(SF \bigoplus OF)
  1. 无符号数情况
    1. 等于: 相减后结果为零
    2. 大于: 没有借位且相减后不为0
    3. 小于: 有借位且相减后不为0
    4. 大于等于: 没有借位或相减后结果为0
    5. 小于等于: 有借位或相减后结果为0
  2. 带符号整数情况
    1. 等于: 相减后结果为零
    2. 大于: 相减后结果不为0,并且,不溢出时为正,溢出时为负。
    3. 小于: 相减后结果不为0,并且,不溢出时为负,溢出时为正。
    4. 大于等于: 相减后结果为0,或者,不溢出时为正,溢出时为负。
    5. 小于等于: 相减后结果为0,或者,不溢出时为负,溢出时为正。

浮点数

IEEE 754 标准

单精度

1
S EEEE EEEE MMM MMMM MMMM MMMM MMMM MMMM
  • 1 位符号位
  • 8 位阶码 (移码)
  • 23 位尾数 (原码)
  • 阶码的偏置常数为 127
  • 尾数最高位默认为 1

程序的转换及机器级表示

ISA

ISA 定义了机器语言级虚拟机的属性和功能特性

  • 可执行的指令的集合
  • 指令可以接受的操作数的类型
  • 操作数所能存放的寄存器组的结构
  • 操作数所能存放的存储空间的大小和编址方
  • 操作数在存储空间存放时按照大端方式还是小端方式存放
  • 指令获取操作数的方式,即寻址方式
  • 指令执行过程的控制方式,包括程序计数器、条件码定义等。

生成机器代码

这个转换过程分为以下4个步骤。

  1. 预处理。例如,在C语言源程序中有一些以#开头的语句,可以在预处理阶段对这些语句进行处理,在源程序中插入所有用 #include 命令指定的文件和用 #define 声明指定的宏。
  2. 编译。将预处理后的源程序文件编译生成相应的汇编语言程序。
  3. 汇编。由汇编程序将汇编语言源程序文件转换为可重定位的机器语言目标代码文件。
  4. 链接。由链接器将多个可重定位的机器语言目标文件以及库例程(如 printf() 库函数)链接起来,生成最终的可执行文件。

ADD 程序示例

1
2
3
4
5
6
// test.c
int add(int i, int j)
{
int x = i + j;
return x;
}
1
2
3
4
5
6
7
8
9
10
11
12
add:
pushl %ebp
movl %esp, %ebp
subl $16, %esp
movl 8(%ebp), %edx
movl 12(%ebp), %eax
# leal (%edx, %eax), %eax
addl %edx, %eax
movl %eax, -4(%ebp)
movl -4(%ebp), %eax
leave
ret
1
2
3
4
5
6
7
8
9
10
11
12
13
# test.o:     file format elf32-i386

00000000 <add>:
0: 55 push %ebp
1: 89 e5 mov %esp,%ebp
3: 83 ec 10 sub $0x10,%esp
6: 8b 55 08 mov 0x8(%ebp),%edx
9: 8b 45 0c mov 0xc(%ebp),%eax
c: 01 d0 add %edx,%eax
e: 89 45 fc mov %eax,-0x4(%ebp)
11: 8b 45 fc mov -0x4(%ebp),%eax
14: c9 leave
15: c3 ret

对于test.o文件

  • 目标代码从相对地址0开始
  • 机器指令的长度不同, 即为变长指令字结构

可执行文件中:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
08048403 <add>:
8048403: 55 push %ebp
8048404: 89 e5 mov %esp,%ebp
8048406: 83 ec 10 sub $0x10,%esp
8048409: 8b 55 08 mov 0x8(%ebp),%edx
804840c: 8b 45 0c mov 0xc(%ebp),%eax
804840f: 01 d0 add %edx,%eax
8048411: 89 45 fc mov %eax,-0x4(%ebp)
8048414: 8b 45 fc mov -0x4(%ebp),%eax
8048417: c9 leave
8048418: c3 ret
8048419: 66 90 xchg %ax,%ax
804841b: 66 90 xchg %ax,%ax
804841d: 66 90 xchg %ax,%ax
804841f: 90 nop

IA32 指令

数据类型与寄存器


x87 浮点寄存器中含有专用的状态寄存器, 8个浮点寄存器

mov 传送指令

算术运算指令

乘法运算

  • 1个操作数 SRC : 另一个操作数隐含在 AL / AX / EAX 中, 结果存放在 AX / DX-AX / EDX-EAX
  • 2个操作数 DST, SRC : DST * SRC -> DST
  • 3个操作数 REG, SRC, IMM : SRC * IMM -> REG

除法运算

  • 1个操作数 SRC : 另一个操作数隐含在 AL / AX / EAX
  • 被除数的位数为除数的2倍
  • 16 / 8 : 商: AL 余数: AH
  • 32 / 16 : 商: AX 余数: DX
  • 64 / 32 : 商: EAX 余数: EDX

移位运算

  • 逻辑: SHL SHR
  • 算术: SAL SAR
  • 循环: ROL ROR RCL RCR

控制转移指令

C语言程序的机器级表示

过程调用的执行步骤

假定过程P调用过程Q, 则P称为调用者, Q称为被调用者

  1. P将入口参数(实参)放到Q能访问到的地方。
  2. P将返回地址存到特定的地方,然后将控制转移到Q。(CALL)
  3. Q保存P的现场,并为自己的非静态局部变量分配空间。
  4. 执行Q的过程体(函数体)。
  5. Q恢复P的现场,并释放局部变量所占空间。
  6. Q取出返回地址,将控制转移到P。(RET)

寄存器使用约定

  • 寄存器EAXECXEDX调用者保存寄存器
  • 寄存器EBXESIEDI被调用者保存寄存器

栈与栈帧

C语句的汇编形式

if 选择语句

1
2
3
4
5
// if 
if (cond_expr)
then_statement
else
else_statement

汇编格式

1
2
3
4
5
6
7
8
    c=cond_expr;
if(!c)
goto false_label;
then_statement
goto done;
false_label:
else_statement
done:
1
2
3
4
5
6
7
8
    c=cond_expr;
if(c)
goto true_label;
else_statement
goto done;
true_label:
then_statement
done:

switch

do - while

1
2
3
4
do
{
loop_body_statement
} while (cond_expr) ;
1
2
3
4
loop:
loop_body_statement
c = cond_expr ;
if (c) goto loop ;

while

1
2
while (cond_expr)
loop_body_statement
1
2
3
4
5
6
7
    c = cond_expr;
if (!c) goto done;
loop:
loop_body_statement
c = conct_expr;
if (c) goto loop;
done:

for

1
2
for (begin_expr; cond_expr; update_expr)
loop_body_statement
1
2
3
4
5
6
7
8
9
    begin_expr ;
c = conct_expr;
if (!c) goto done ;
loop:
loop_body_statement
update_expr;
c = cond_expr;
if (c) goto loop ;
done:

数据对齐

Windows : 按其长度对齐

IA32 :

  • short : 2
  • int float double char* : 4
  • double : 80位, 分配12字节(96位)
作者

Cheng

发布于

2018-08-18

更新于

2022-08-06

许可协议

评论