You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

184 lines
18 KiB
Markdown

2 years ago
# 06 | x86架构有了开放的架构才能打造开放的营商环境
做生意的人最喜欢开放的营商环境,也就是说,我的这家公司,只要符合国家的法律,到哪里做生意,都能受到公平的对待,这样就不用为了适配各个地方的规则煞费苦心,只要集中精力优化自己的服务就可以了。
作为Linux操作系统何尝不是这样。如果下面的硬件环境千差万别就会很难集中精力做出让用户易用的产品。毕竟天天适配不同的平台就已经够头大了。x86架构就是这样一个开放的平台。今天我们就来解析一下它。
## 计算机的工作模式是什么样的?
还记得咱们攒电脑时买的那堆硬件吗?虽然你可以根据经验,把那些复杂的设备和连接线安装起来,但是你真的了解它们为什么要这么连接吗?
现在我就把硬件图和计算机的逻辑图对应起来,带你看看计算机的工作模式。
![](https://static001.geekbang.org/resource/image/fa/9b/fa6c2b6166d02ac37637d7da4e4b579b.jpeg?wh=2144*995)
对于一个计算机来讲,最核心的就是**CPU**Central Processing Unit中央处理器。这是这台计算机的大脑所有的设备都围绕它展开。
对于公司来说CPU是真正干活的将来执行项目都要靠它。
CPU就相当于咱们公司的程序员我们常说二十一世纪最缺的是什么是人才所以大量水平高、干活快的程序员才是营商环境中最重要的部分。
CPU和其他设备连接要靠一种叫做**总线**Bus的东西其实就是主板上密密麻麻的集成电路这些东西组成了CPU和其他设备的高速通道。
在这些设备中,最重要的是**内存**Memory。因为单靠CPU是没办法完成计算任务的很多复杂的计算任务都需要将中间结果保存下来然后基于中间结果进行进一步的计算。CPU本身没办法保存这么多中间结果这就要依赖内存了。
内存就相当于办公室,我们要看看方不方便租到办公室,有没有什么创新科技园之类的。有了共享的、便宜的办公位,公司就有注册地了。
当然总线上还有一些其他设备例如显卡会连接显示器、磁盘控制器会连接硬盘、USB控制器会连接键盘和鼠标等等。
CPU和内存是完成计算任务的核心组件所以这里我们重点介绍一下**CPU和内存是如何配合工作的**。
CPU其实也不是单纯的一块它包括三个部分运算单元、数据单元和控制单元。
**运算单元**只管算,例如做加法、做位移等等。但是,它不知道应该算哪些数据,运算结果应该放在哪里。
运算单元计算的数据如果每次都要经过总线,到内存里面现拿,这样就太慢了,所以就有了**数据单元**。数据单元包括CPU内部的缓存和寄存器组空间很小但是速度飞快可以暂时存放数据和运算结果。
有了放数据的地方,也有了算的地方,还需要有个指挥到底做什么运算的地方,这就是**控制单元**。控制单元是一个统一的指挥中心,它可以获得下一条指令,然后执行这条指令。这个指令会指导运算单元取出数据单元中的某几个数据,计算出个结果,然后放在数据单元的某个地方。
![](https://static001.geekbang.org/resource/image/3a/23/3afda18fc38e7e53604e9ebf9cb42023.jpeg?wh=2749*1882)
每个项目都有一个项目执行计划书,里面是一行行项目执行的指令,这些都是放在档案库里面的。每个进程都有一个程序放在硬盘上,是二进制的,再里面就是一行行的指令,会操作一些数据。
进程一旦运行比如图中两个进程A和B会有独立的内存空间互相隔离程序会分别加载到进程A和进程B的内存空间里面形成各自的代码段。当然真实情况肯定比我说的要复杂的多进程的内存虽然隔离但不连续除了简单的区分代码段和数据段还会分得更细。
程序运行的过程中要操作的数据和产生的计算结果,都会放在数据段里面。**那CPU怎么执行这些程序操作这些数据产生一些结果****并****写入回内存呢?**
CPU的控制单元里面有一个**指令指针寄存器**,它里面存放的是下一条指令在内存中的地址。控制单元会不停地将代码段的指令拿进来,先放入指令寄存器。
当前的指令分两部分,一部分是做什么操作,例如是加法还是位移;一部分是操作哪些数据。
要执行这条指令,就要把第一部分交给运算单元,第二部分交给数据单元。
数据单元根据数据的地址,从数据段里读到数据寄存器里,就可以参与运算了。运算单元做完运算,产生的结果会暂存在数据单元的数据寄存器里。最终,会有指令将数据写回内存中的数据段。
你可能会问上面算来算去执行的都是进程A里的指令那进程B呢CPU里有两个寄存器专门保存当前处理进程的代码段的起始地址以及数据段的起始地址。这里面写的都是进程A那当前执行的就是进程A的指令等切换成进程B就会执行B的指令了这个过程叫作**进程切换**Process Switch。这是一个多任务系统的必备操作我们后面有专门的章节讲这个内容这里你先有个印象。
到这里你会发现CPU和内存来来回回传数据靠的都是总线。其实总线上主要有两类数据一个是地址数据也就是我想拿内存中哪个位置的数据这类总线叫**地址总线**Address Bus另一类是真正的数据这类总线叫**数据总线**Data Bus
所以说总线其实有点像连接CPU和内存这两个设备的高速公路说总线到底是多少位就类似说高速公路有几个车道。但是这两种总线的位数意义是不同的。
地址总线的位数决定了能访问的地址范围到底有多广。例如只有两位那CPU就只能认00011011四个位置超过四个位置就区分不出来了。位数越多能够访问的位置就越多能管理的内存的范围也就越广。
而数据总线的位数决定了一次能拿多少个数据进来。例如只有两位那CPU一次只能从内存拿两位数。要想拿八位就要拿四次。位数越多一次拿的数据就越多访问速度也就越快。
## x86成为开放平台历史中的重要一笔
那CPU中总线的位数有没有个标准呢如果没有标准那操作系统作为软件就很难办了因为软件层没办法实现通用的运算逻辑。这就像很多非标准的元器件一样你烧你的电路板我烧我的电路板谁都不能用彼此的。
早期的IBM凭借大型机技术成为计算机市场的领头羊直到后来个人计算机兴起苹果公司诞生。但是那个时候无论是大型机还是个人计算机每家的CPU架构都不一样。如果一直是这样个人电脑、平板电脑、手机等等都没办法形成统一的体系就不会有我们现在通用的计算机了更别提什么云计算、大数据这些统一的大平台了。
好在历史将x86平台推到了**开放、统一、兼容**的位置。我们继续来看IBM和x86的故事。
IBM开始做IBM PC时一开始并没有让最牛的华生实验室去研发而是交给另一个团队。一年时间软硬件全部自研根本不可能完成于是他们采用了英特尔的8088芯片作为CPU使用微软的MS-DOS做操作系统。
谁能想到IBM PC卖得超级好好到因为垄断市场而被起诉。IBM就在被逼的情况下公开了一些技术使得后来无数IBM-PC兼容机公司的出现也就有了后来占据市场的惠普、康柏、戴尔等等。
能够开放自己的技术是一件了不起的事。从技术和发展的层面来讲它会使得一项技术大面积铺开形成行业标准。就比如现在常用的Android手机如果没有开放的Android系统我们也没办法享受到这么多不同类型的手机。
对于当年的PC机来说其实也是这样。英特尔的技术因此成为了行业的开放事实标准。由于这个系列开端于8086因此称为x86架构。
后来英特尔的CPU数据总线和地址总线越来越宽处理能力越来越强。但是一直不能忘记三点一是标准二是开放三是兼容。因为要想如此大的一个软硬件生态都基于这个架构符合它的标准如果是封闭或者不兼容的那谁都不答应。
![](https://static001.geekbang.org/resource/image/54/8a/548dfd163066d061d1e882c73e7c2b8a.jpg?wh=2049*741)
## 从8086的原理说起
说完了x86的历史我们再来看x86中最经典的一款处理器8086处理器。虽然它已经很老了但是咱们现在操作系统中的很多特性都和它有关并且一直保持兼容。
我们把CPU里面的组件放大之后来看。你可以看我画的这幅图。
![](https://static001.geekbang.org/resource/image/2d/1c/2dc8237e996e699a0361a6b5ffd4871c.jpeg?wh=2770*1849)
我们先来看数据单元。
为了暂存数据8086处理器内部有8个16位的通用寄存器也就是刚才说的CPU内部的数据单元分别是AX、BX、CX、DX、SP、BP、SI、DI。这些寄存器主要用于在计算过程中暂存数据。
这些寄存器比较灵活其中AX、BX、CX、DX可以分成两个8位的寄存器来使用分别是AH、AL、BH、BL、CH、CL、DH、DL其中H就是High高位L就是Low低位的意思。
这样比较长的数据也能暂存比较短的数据也能暂存。你可能会说16位并不长啊你可别忘了那是在计算机刚刚起步的时代。
接着我们来看控制单元。
IP寄存器就是指令指针寄存器Instruction Pointer Register)指向代码段中下一条指令的位置。CPU会根据它来不断地将指令从内存的代码段中加载到CPU的指令队列中然后交给运算单元去执行。
如果需要切换进程呢每个进程都分代码段和数据段为了指向不同进程的地址空间有四个16位的段寄存器分别是CS、DS、SS、ES。
其中CS就是代码段寄存器Code Segment Register通过它可以找到代码在内存中的位置DS是数据段的寄存器通过它可以找到数据在内存中的位置。
SS是栈寄存器Stack Register。栈是程序运行中一个特殊的数据结构数据的存取只能从一端进行秉承后进先出的原则push就是入栈pop就是出栈。
![](https://static001.geekbang.org/resource/image/08/47/08ea4adb633f114d788d5c6a9dae0f47.jpeg?wh=2003*1013)
凡是与函数调用相关的操作都与栈紧密相关。例如A调用BB调用C。当A调用B的时候要执行B函数的逻辑因而A运行的相关信息就会被push到栈里面。当B调用C的时候同样B运行相关信息会被push到栈里面然后才运行C函数的逻辑。当C运行完毕的时候先pop出来的是BB就接着调用C之后的指令运行下去。B运行完了再pop出来的就是AA接着运行直到结束。
如果运算中需要加载内存中的数据需要通过DS找到内存中的数据加载到通用寄存器中应该如何加载呢对于一个段有一个起始的地址而段内的具体位置我们称为**偏移量**Offset。例如8号会议室的第三排8号会议室就是起始地址第三排就是偏移量。
在CS和DS中都存放着一个段的起始地址。代码段的偏移量在IP寄存器中数据段的偏移量会放在通用寄存器中。
这时候问题来了CS和DS都是16位的也就是说起始地址都是16位的IP寄存器和通用寄存器都是16位的偏移量也是16位的但是8086的地址总线地址是20位。怎么凑够这20位呢方法就是“**起始地址\*16+偏移量**”也就是把CS和DS中的值左移4位变成20位的加上16位的偏移量这样就可以得到最终20位的数据地址。
从这个计算方式可以算出无论真正的内存多么大对于只有20位地址总线的8086来讲能够区分出的地址也就2^20=1M超过这个空间就访问不到了。这又是为啥呢如果你想访问1M+X的地方这个位置已经超过20位了由于地址总线只有20位在总线上超过20位的部分根本是发不出去的所以发出去的还是X最后还是会访问1M内的X的位置。
那一个段最大能有多大呢因为偏移量只能是16位的所以一个段最大的大小是2^16=64k。
是不是好可怜对于8086CPU最多只能访问1M的内存空间还要分成多个段每个段最多64K。尽管我们现在看来这不可想象得小根本没法儿用但是在当时其实够用了。
## 再来说32位处理器
当然后来计算机的发展日新月异内存越来越大总线也越来越宽。在32位处理器中有32根地址总线可以访问2^32=4G的内存。使用原来的模式肯定不行了但是又不能完全抛弃原来的模式因为这个架构是开放的。
“开放”,意味着有大量其他公司的软硬件是基于这个架构来实现的,不能为所欲为,想怎么改怎么改,一定要和原来的架构兼容,而且要一直兼容,这样大家才愿意跟着你这个开放平台一直玩下去。如果你朝令夕改,那其他厂商就惨了。
如果是不开放的架构,那就没有问题。硬件、操作系统,甚至上面的软件都是自己搞的,你想怎么改就可以怎么改。
我们下面来说说,在开放架构的基础上,如何保持兼容呢?
首先通用寄存器有扩展可以将8个16位的扩展到8个32位的但是依然可以保留16位的和8位的使用方式。你可能会问为什么高16位不分成两个8位使用呢因为这样就不兼容了呀
其中指向下一条指令的指令指针寄存器IP就会扩展成32位的同样也兼容16位的。
![](https://static001.geekbang.org/resource/image/e3/84/e3f4f64e6dfe5591b7d8ef346e8e8884.jpeg?wh=2575*1192)
而改动比较大,有点不兼容的就是**段寄存器**Segment Register
因为原来的模式其实有点不伦不类因为它没有把16位当成一个段的起始地址也没有按8位或者16位扩展的形式而是根据当时的硬件弄了一个不上不下的20位的地址。这样每次都要左移四位也就意味着段的起始地址不能是任何一个地方只是能整除16的地方。
如果新的段寄存器都改成32位的明明4G的内存全部都能访问到还左移不左移四位呢
那我们索性就重新定义一把吧。CS、SS、DS、ES仍然是16位的但是不再是段的起始地址。段的起始地址放在内存的某个地方。这个地方是一个表格表格中的一项一项是**段描述符**Segment Descriptor。这里面才是真正的段的起始地址。而段寄存器里面保存的是在这个表格中的哪一项称为**选择子**Selector
这样,将一个从段寄存器直接拿到的段起始地址,就变成了先间接地从段寄存器找到表格中的一项,再从表格中的一项中拿到段起始地址。
这样段起始地址就会很灵活了。当然为了快速拿到段起始地址段寄存器会从内存中拿到CPU的描述符高速缓存器中。
这样就不兼容了,咋办呢?好在后面这种模式灵活度非常高,可以保持将来一直兼容下去。前面的模式出现的时候,没想到自己能够成为一个标准,所以设计就没这么灵活。
因而到了32位的系统架构下我们将前一种模式称为**实模式**Real Pattern后一种模式称为**保护模式**Protected Pattern
当系统刚刚启动的时候CPU是处于实模式的这个时候和原来的模式是兼容的。也就是说哪怕你买了32位的CPU也支持在原来的模式下运行只不过快了一点而已。
当需要更多内存的时候你可以遵循一定的规则进行一系列的操作然后切换到保护模式就能够用到32位CPU更强大的能力。
这也就是说,不能无缝兼容,但是通过切换模式兼容,也是可以接受的。
在接下来的几节我们就来看一下CPU如何从启动开始逐渐从实模式变为保护模式的。
## 总结时刻
这一节我们讲了x86架构。在以后的操作系统讲解中我们也是主要基于x86架构进行讲解只有了解了底层硬件的基本工作原理将来才能理解操作系统的工作模式。
x86架构总体来说还是很复杂的其中和操作系统交互比较密切的部分我画了个图。在这个图中建议你重点牢记这些寄存器的作用以及段的工作模式后面我们马上就能够用到了。
![](https://static001.geekbang.org/resource/image/e2/76/e2e92f2239fe9b4c024d300046536d76.jpeg?wh=4042*1705)
## 课堂练习
操作这些底层的寄存器往往需要使用汇编语言,操作系统的一些底层的模块也是用汇编语言写的,因而你需要简单回顾一些汇编语言中的一些简单的命令的作用。所以,今天给你留个练习题,简单了解一下这些命令。
mov, call, jmp, int, ret, add, or, xor, shl, shr, push, pop, inc, dec, sub, cmp。
欢迎留言和我分享你的疑惑和见解,也欢迎你收藏本节内容,反复研读。你也可以把今天的内容分享给你的朋友,和他一起学习、进步。
![](https://static001.geekbang.org/resource/image/8c/37/8c0a95fa07a8b9a1abfd394479bdd637.jpg?wh=1110*659)