You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

500 lines
21 KiB
Markdown

2 years ago
# 15 | 内存模型Go如何保证并发读写的顺序
你好,我是鸟窝。
Go官方文档里专门介绍了Go的[内存模型](https://golang.org/ref/mem)你不要误解这里的内存模型的含义它并不是指Go对象的内存分配、内存回收和内存整理的规范它描述的是并发环境中多goroutine读相同变量的时候变量的可见性条件。具体点说就是指在什么条件下goroutine在读取一个变量的值的时候能够看到其它goroutine对这个变量进行的写的结果。
由于CPU指令重排和多级Cache的存在保证多核访问同一个变量这件事儿变得非常复杂。毕竟不同CPU架构x86/amd64、ARM、Power等的处理方式也不一样再加上编译器的优化也可能对指令进行重排所以编程语言需要一个规范来明确多线程同时访问同一个变量的可见性和顺序 Russ Cox在麻省理工学院 [6.824 分布式系统Distributed Systems课程](https://pdos.csail.mit.edu/6.824/) 的一课,专门介绍了相关的[知识](http://nil.csail.mit.edu/6.824/2016/notes/gomem.pdf))。在编程语言中,这个规范被叫做内存模型。
除了GoJava、C++、C、C#、Rust等编程语言也有内存模型。为什么这些编程语言都要定义内存模型呢在我看来主要是两个目的。
* 向广大的程序员提供一种保证以便他们在做设计和开发程序时面对同一个数据同时被多个goroutine访问的情况可以做一些串行化访问的控制比如使用Channel或者sync包和sync/atomic包中的并发原语。
* 允许编译器和硬件对程序做一些优化。这一点其实主要是为编译器开发者提供的保证这样可以方便他们对Go的编译器做优化。
既然内存模型这么重要,今天,我们就来花一节课的时间学习一下。
首先,我们要先弄明白重排和可见性的问题,因为它们影响着程序实际执行的顺序关系。
# 重排和可见性的问题
**由于指令重排,代码并不一定会按照你写的顺序执行**。
举个例子当两个goroutine同时对一个数据进行读写时假设goroutine g1对这个变量进行写操作wgoroutine g2同时对这个变量进行读操作r那么如果g2在执行读操作r的时候已经看到了g1写操作w的结果那么也不意味着g2能看到在w之前的其它的写操作。这是一个反直观的结果不过的确可能会存在。
接下来我再举几个具体的例子带你来感受一下重排以及多核CPU并发执行导致程序的运行和代码的书写顺序不一样的情况。
先看第一个例子,代码如下:
```
var a, b int
func f() {
a = 1 // w之前的写操作
b = 2 // 写操作w
}
func g() {
print(b) // 读操作r
print(a) // ???
}
func main() {
go f() //g1
g() //g2
}
```
可以看到第9行是要打印b的值。需要注意的是即使这里打印出的值是2但是依然可能在打印a的值时打印出初始值0而不是1。这是因为程序运行的时候不能保证g2看到的a和b的赋值有先后关系。
再来看一个类似的例子。
```
var a string
var done bool
func setup() {
a = "hello, world"
done = true
}
func main() {
go setup()
for !done {
}
print(a)
}
```
在这段代码中主goroutine main即使观察到done变成true了最后读取到的a的值仍然可能为空。
更糟糕的情况是main根本就观察不到另一个goroutine对done的写操作这就会导致main程序一直被hang住。甚至可能还会出现**半初始化**的情况,比如:
```
type T struct {
msg string
}
var g *T
func setup() {
t := new(T)
t.msg = "hello, world"
g = t
}
func main() {
go setup()
for g == nil {
}
print(g.msg)
}
```
即使main goroutine观察到g不为nil也可能打印出空的msg第17行
看到这里你可能要说了我都运行这个程序几百万次了怎么也没有观察到这种现象我可以这么告诉你能不能观察到和提供保证guarantee是两码事儿。由于CPU架构和Go编译器的不同即使你运行程序时没有遇到这些现象也不代表Go可以100%保证不会出现这些问题。
刚刚说了程序在运行的时候两个操作的顺序可能不会得到保证那该怎么办呢接下来我要带你了解一下Go内存模型中很重要的一个概念happens-before这是用来描述两个时间的顺序关系的。如果某些操作能提供happens-before关系那么我们就可以100%保证它们之间的顺序。
# happens-before
在一个goroutine内部程序的执行顺序和它们的代码指定的顺序是一样的即使编译器或者CPU重排了读写顺序从行为上来看也和代码指定的顺序一样。
这是一个非常重要的保证,我们一定要记住。
我们来看一个例子。在下面的代码中即使编译器或者CPU对a、b、c的初始化进行了重排但是打印结果依然能保证是1、2、3而不会出现1、0、0或1、0、1等情况。
```
func foo() {
var a = 1
var b = 2
var c = 3
println(a)
println(b)
println(c)
}
```
但是对于另一个goroutine来说重排却会产生非常大的影响。**因为Go只保证goroutine内部重排对读写的顺序没有影响**比如刚刚我们在讲“可见性”问题时提到的三个例子那该怎么办呢这就要用到happens-before关系了。
如果两个actionread 或者 write有明确的happens-before关系你就可以确定它们之间的执行顺序或者是行为表现上的顺序
Go内存模型通过happens-before定义两个事件读、写action的顺序如果事件e1 happens before 事件e2那么我们就可以说事件e2在事件e1之后发生happens after。如果e1 不是happens before e2 同时也不happens after e2那么我们就可以说事件e1和e2是同时发生的。
如果要保证对“变量**v**的读操作**r**”能够观察到一个对“变量**v**的写操作**w**”,并且**r**只能观察到**w**对变量**v**的写没有其它对v的写操作也就是说我们要保证**r**绝对能观察到**w**操作的结果,那么就需要同时满足两个条件:
1. w happens before r
2. 其它对v的写操作w2、w3、w4, ...... 要么happens before w要么happens after r绝对不会和w、r同时发生或者是在它们之间发生。
你可能会说,这是很显然的事情啊,但我要和你说的是,这是一个非常严格、严谨的数学定义。
对于单个的goroutine来说它有一个特殊的happens-before关系Go内存模型中是这么讲的
> Within a single goroutine, the happens-before order is the order expressed by the program.
我来解释下这句话。它的意思是在单个的goroutine内部 happens-before的关系和代码编写的顺序是一致的。
其实,在这一章的开头我已经用橙色把这句话标注出来了。我再具体解释下。
在goroutine内部对一个局部变量v的读一定能观察到最近一次对这个局部变量v的写。如果要保证多个goroutine之间对一个共享变量的读写顺序在Go语言中可以使用并发原语为读写操作建立happens-before关系这样就可以保证顺序了。
说到这儿我想先给你补充三个Go语言中和内存模型有关的小知识掌握了这些你就能更好地理解下面的内容。
1. 在Go语言中对变量进行零值的初始化就是一个写操作。
2. 如果对超过机器word64bit、32bit或者其它大小的值进行读写那么就可以看作是对拆成word大小的几个读写无序进行。
3. Go并不提供直接的CPU屏障CPU fence来提示编译器或者CPU保证顺序性而是使用不同架构的内存屏障指令来实现统一的并发原语。
接下来我就带你学习下Go语言中提供的happens-before关系保证。
# Go语言中保证的happens-before关系
除了单个goroutine内部提供的happens-before保证Go语言中还提供了一些其它的happens-before关系的保证下面我来一个一个介绍下。
## init函数
应用程序的初始化是在单一的goroutine执行的。如果包p导入了包q那么q的init函数的执行一定 happens before p的任何初始化代码。
这里有一个特殊情况需要你记住:**main函数一定在导入的包的init函数之后执行**。
包级别的变量在同一个文件中是按照声明顺序逐个初始化的,除非初始化它的时候依赖其它的变量。同一个包下的多个文件,会按照文件名的排列顺序进行初始化。这个顺序被定义在[Go语言规范](https://golang.org/ref/spec#Program_initialization_and_execution)中而不是Go的内存模型规范中。你可以看看下面的例子中各个变量的值
```
var (
a = c + b // == 9
b = f() // == 4
c = f() // == 5
d = 3 // == 5 全部初始化完成后
)
func f() int {
d++
return d
}
```
具体怎么对这些变量进行初始化呢Go采用的是依赖分析技术。不过依赖分析技术保证的顺序只是针对同一包下的变量而且只有引用关系是本包变量、函数和非接口的方法才能保证它们的顺序性。
同一个包下可以有多个init函数甚至一个文件中也可以包含多个相同签名的init函数。
刚刚讲的这些都是不同包的init函数执行顺序下面我举一个具体的例子把这些内容串起来你一看就明白了。
这个例子是一个**main**程序它依赖包p1包p1依赖包p2包p2依赖p3。
![](https://static001.geekbang.org/resource/image/d5/2a/d5059fab1977602934339e18f9eddb2a.jpg)
为了追踪初始化过程,并输出有意义的日志,我定义了一个辅助方法,打印出日志并返回一个用来初始化的整数值:
```
func Trace(t string, v int) int {
fmt.Println(t, ":", v)
return v
}
```
包**p3**包含两个文件分别定义了一个init函数。第一个文件中定义了两个变量这两个变量的值还会在init函数中进行修改。
我们来分别看下包p3的这两个文件
```
// lib1.go in p3
var V1_p3 = trace.Trace("init v1_p3", 3)
var V2_p3 = trace.Trace("init v2_p3", 3)
func init() {
fmt.Println("init func in p3")
V1_p3 = 300
V2_p3 = 300
}
```
```
// lib2.go in p3
func init() {
fmt.Println("another init func in p3")
}
```
下面再来看看包p2。包p2定义了变量和init函数。第一个变量初始化为2并在init函数中更改为200。第二个变量是复制的p3.V2\_p3。
```
var V1_p2 = trace.Trace("init v1_p2", 2)
var V2_p2 = trace.Trace("init v2_p2", p3.V2_p3)
func init() {
fmt.Println("init func in p2")
V1_p2 = 200
}
```
包**p1**定义了变量和init函数。它的两个变量的值是复制的p2对应的两个变量值。
```
var V1_p1 = trace.Trace("init v1_p1", p2.V1_p2)
var V2_p1 = trace.Trace("init v2_p1", p2.V2_p2)
func init() {
fmt.Println("init func in p1")
}
```
**main**定义了init函数和main函数。
```
func init() {
fmt.Println("init func in main")
}
func main() {
fmt.Println("V1_p1:", p1.V1_p1)
fmt.Println("V2_p1:", p1.V2_p1)
}
```
运行main函数会依次输出p3、p2、p1、main的初始化变量时的日志变量初始化时的日志和init函数调用时的日志
```
// 包p3的变量初始化
init v1_p3 : 3
init v2_p3 : 3
// p3的init函数
init func in p3
// p3的另一个init函数
another init func in p3
// 包p2的变量初始化
init v1_p2 : 2
init v2_p2 : 300
// 包p2的init函数
init func in p2
// 包p1的变量初始化
init v1_p1 : 200
init v2_p1 : 300
// 包p1的init函数
init func in p1
// 包main的init函数
init func in main
// main函数
V1_p1: 200
V2_p1: 300
```
下面我们再来看看goroutine对happens-before关系的保证情况。
## goroutine
首先,我们需要明确一个规则:**启动goroutine的go语句的执行一定happens before此goroutine内的代码执行。**
根据这个规则我们就可以知道如果go语句传入的参数是一个函数执行的结果那么这个函数一定先于goroutine内部的代码被执行。
我们来看一个例子。在下面的代码中第8行a的赋值和第9行的go语句是在同一个goroutine中执行的所以在主goroutine看来第8行肯定happens before 第9行又由于刚才的保证第9行子goroutine的启动happens before 第4行的变量输出那么我们就可以推断出第8行happens before 第4行。也就是说在第4行打印a的值的时候肯定会打印出“hello world”。
```
var a string
func f() {
print(a)
}
func hello() {
a = "hello, world"
go f()
}
```
刚刚说的是启动goroutine的情况goroutine退出的时候是没有任何happens-before保证的。所以如果你想观察某个goroutine的执行效果你需要使用同步机制建立happens-before关系比如Mutex或者Channel。接下来我会讲Channel的happens-before的关系保证。
## Channel
Channel是goroutine同步交流的主要方法。往一个Channel中发送一条数据通常对应着另一个goroutine从这个Channel中接收一条数据。
通用的Channel happens-before关系保证有4条规则我分别来介绍下。
**第1条规则是**往Channel中的发送操作happens before 从该Channel接收相应数据的动作完成之前即第n个send一定happens before第n个receive的完成。
```
var ch = make(chan struct{}, 10) // buffered或者unbuffered
var s string
func f() {
s = "hello, world"
ch <- struct{}{}
}
func main() {
go f()
<-ch
print(s)
}
```
在这个例子中s的初始化第5行happens before 往ch中发送数据 往ch发送数据 happens before从ch中读取出一条数据第11行第12行打印s的值 happens after第11行所以打印的结果肯定是初始化后的s的值“hello world”。
**第2条规则是**close一个Channel的调用肯定happens before 从关闭的Channel中读取出一个零值。
还是拿刚刚的这个例子来说如果你把第6行替换成 close(ch)也能保证同样的执行顺序。因为第11行从关闭的ch中读取出零值后第6行肯定被调用了。
**第3条规则是**对于unbuffered的Channel也就是容量是0的Channel从此Channel中读取数据的调用一定happens before 往此Channel发送数据的调用完成。
所以,在上面的这个例子中呢,如果想保持同样的执行顺序,也可以写成这样:
```
var ch = make(chan int)
var s string
func f() {
s = "hello, world"
<-ch
}
func main() {
go f()
ch <- struct{}{}
print(s)
}
```
如果第11行发送语句执行成功完毕那么根据这个规则第6行接收的调用肯定发生了执行完成不完成不重要重要的是这一句“肯定执行了”那么s也肯定初始化了所以一定会打印出“hello world”。
这一条比较晦涩但是因为Channel是unbuffered的Channel所以这个规则也成立。
**第4条规则是**如果Channel的容量是mm>0那么第n个receive一定happens before 第 n+m 个 send的完成。
前一条规则是针对unbuffered channel的这里给出了更广泛的针对buffered channel的保证。利用这个规则我们可以实现信号量Semaphore的并发原语。Channel的容量相当于可用的资源发送一条数据相当于请求信号量接收一条数据相当于释放信号。关于信号量这个并发原语我会在下一讲专门给你介绍一下这里你只需要知道它可以控制多个资源的并发访问就可以了。
## Mutex/RWMutex
对于互斥锁Mutex m或者读写锁RWMutex m有3条happens-before关系的保证。
1. 第n次的m.Unlock一定happens before第n+1 m.Lock方法的返回
2. 对于读写锁RWMutex m如果它的第n个m.Lock方法的调用已返回那么它的第n个m.Unlock的方法调用一定happens before 任何一个m.RLock方法调用的返回只要这些m.RLock方法调用 happens after 第n次m.Lock的调用的返回。这就可以保证只有释放了持有的写锁那些等待的读请求才能请求到读锁。
3. 对于读写锁RWMutex m如果它的第n个m.RLock方法的调用已返回那么它的第k k<=n个成功的m.RUnlock方法的返回一定happens before 任意的m.RUnlockLock方法调用只要这些m.Lock方法调用happens after第n次m.RLock。
读写锁的保证有点绕,我再带你看看官方的描述:
> 对于读写锁l的 l.RLock方法调用如果存在一个**n**这次的l.RLock调用 happens after 第n次的l.Unlock那么和这个RLock相对应的l.RUnlock一定happens before 第n+1次l.Lock。意思是读写锁的Lock必须等待既有的读锁释放后才能获取到。
我再举个例子。在下面的代码中第6行第一次的Unlock一定happens before第二次的Lock第12行所以这也能保证正确地打印出“hello world”。
```
var mu sync.Mutex
var s string
func foo() {
s = "hello, world"
mu.Unlock()
}
func main() {
mu.Lock()
go foo()
mu.Lock()
print(s)
```
## WaitGroup
接下来是WaitGroup的保证。
对于一个WaitGroup实例wg在某个时刻t0时它的计数值已经不是零了假如t0时刻之后调用了一系列的wg.Add(n)或者wg.Done()并且只有最后一次调用wg的计数值变为了0那么可以保证这些wg.Add或者wg.Done()一定 happens before t0时刻之后调用的wg.Wait方法的返回。
这个保证的通俗说法,就是**Wait方法等到计数值归零之后才返回**。
## Once
我们在[第8讲](https://time.geekbang.org/column/article/301113)学过Once了相信你已经很熟悉它的功能了。它提供的保证是**对于once.Do(f)调用f函数的那个单次调用一定happens before 任何once.Do(f)调用的返回**。换句话说就是函数f一定会在Do方法返回之前执行。
还是以hello world的例子为例这次我们使用Once并发原语实现可以看下下面的代码
```
var s string
var once sync.Once
func foo() {
s = "hello, world"
}
func twoprint() {
once.Do(foo)
print(s)
}
```
第5行的执行一定happens before第9行的返回所以执行到第10行的时候sd已经初始化了所以会正确地打印“hello world”。
最后我再来说说atomic的保证。
## atomic
其实Go内存模型的官方文档并没有明确给出atomic的保证有一个相关的issue [go# 5045](https://github.com/golang/go/issues/5045)记录了相关的讨论。光看issue号就知道这个讨论由来已久了。Russ Cox想让atomic有一个弱保证这样可以为以后留下充足的可扩展空间所以Go内存模型规范上并没有严格的定义。
对于Go 1.15的官方实现来说可以保证使用atomic的Load/Store的变量之间的顺序性。
在下面的例子中打印出的a的结果总是1但是官方并没有做任何文档上的说明和保证。
依照Ian Lance Taylor的说法Go核心开发组的成员几乎没有关注这个方向上的研究因为这个问题太复杂有很多问题需要去研究所以现阶段还是不要使用atomic来保证顺序性。
```
func main() {
var a, b int32 = 0, 0
go func() {
atomic.StoreInt32(&a, 1)
atomic.StoreInt32(&b, 1)
}()
for atomic.LoadInt32(&b) == 0{
runtime.Gosched()
}
fmt.Println(atomic.LoadInt32(&a))
}
```
# 总结
Go的内存模型规范中一开始有这么一段话
> If you must read the rest of this document to understand the behavior of your program, you are being too clever.
> Don't be clever.
我来说说我对这句话的理解:你通过学习这节课来理解你的程序的行为是聪明的,但是,不要自作聪明。
谨慎地使用这些保证能够让你的程序按照设想的happens-before关系执行但是不要以为完全理解这些概念和保证就可以随意地制造所谓的各种技巧否则就很容易掉进“坑”里而且会给代码埋下了很多的“定时炸弹”。
比如Go里面已经有值得信赖的互斥锁了如果没有额外的需求就不要使用Channel创造出自己的互斥锁。
当然我也不希望你畏手畏脚地把思想局限住我还是建议你去做一些有意义的尝试比如使用Channel实现信号量等扩展并发原语。
![](https://static001.geekbang.org/resource/image/dc/4d/dc68fc5f93a4af96c8f4d45d6282104d.jpg)
# 思考题
我们知道Channel可以实现互斥锁那么我想请你思考一下它是如何利用happens-before关系保证锁的请求和释放的呢
欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得有所收获,也欢迎你把今天的内容分享给你的朋友或同事。