You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

248 lines
12 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 04 Mutex骇客编程如何拓展额外功能
你好,我是鸟窝。
前面三讲我们学习了互斥锁Mutex的基本用法、实现原理以及易错场景可以说是涵盖了互斥锁的方方面面。如果你能熟练掌握这些内容那么在大多数的开发场景中你都可以得心应手。
但是,在一些特定的场景中,这些基础功能是不足以应对的。这个时候,我们就需要开发一些扩展功能了。我来举几个例子。
比如说我们知道如果互斥锁被某个goroutine获取了而且还没有释放那么其他请求这把锁的goroutine就会阻塞等待直到有机会获得这把锁。有时候阻塞并不是一个很好的主意比如你请求锁更新一个计数器如果获取不到锁的话没必要等待大不了这次不更新我下次更新就好了如果阻塞的话会导致业务处理能力的下降。
再比如如果我们要监控锁的竞争情况一个监控指标就是等待这把锁的goroutine数量。我们可以把这个指标推送到时间序列数据库中再通过一些监控系统比如Grafana展示出来。要知道**锁是性能下降的“罪魁祸首”之一所以有效地降低锁的竞争就能够很好地提高性能。因此监控关键互斥锁上等待的goroutine的数量是我们分析锁竞争的激烈程度的一个重要指标**。
实际上不论是不希望锁的goroutine继续等待还是想监控锁我们都可以基于标准库中Mutex的实现通过Hacker的方式为Mutex增加一些额外的功能。这节课我就来教你实现几个扩展功能包括实现TryLock获取等待者的数量等指标以及实现一个线程安全的队列。
# TryLock
我们可以为Mutex添加一个TryLock的方法也就是尝试获取排外锁。PS在Go 1.18官方标准库中已经为Mutex/RWMutex增加了TryLock方法。
这个方法具体是什么意思呢我来解释一下这里的逻辑。当一个goroutine调用这个TryLock方法请求锁的时候如果这把锁没有被其他goroutine所持有那么这个goroutine就持有了这把锁并返回true如果这把锁已经被其他goroutine所持有或者是正在准备交给某个被唤醒的goroutine那么这个请求锁的goroutine就直接返回false不会阻塞在方法调用上。
如下图所示如果Mutex已经被一个goroutine持有调用Lock的goroutine阻塞排队等待调用TryLock的goroutine直接得到一个false返回。
![](https://static001.geekbang.org/resource/image/e7/65/e7787d959b60d66cc3a46ee921098865.jpg?wh=2973*1913)
在实际开发中如果要更新配置数据我们通常需要加锁这样可以避免同时有多个goroutine并发修改数据。有的时候我们也会使用TryLock。这样一来当某个goroutine想要更改配置数据时如果发现已经有goroutine在更改了其他的goroutine调用TryLock返回了false这个goroutine就会放弃更改。
很多语言比如Java都为锁提供了TryLock的方法但是Go官方[issue 6123](https://github.com/golang/go/issues/6123)有一个讨论后来一些issue中也提到过标准库的Mutex不会添加TryLock方法。虽然通过Go的Channel我们也可以实现TryLock的功能但是基于Channel的实现我们会放在Channel那一讲中去介绍这一次我们还是基于Mutex去实现毕竟大部分的程序员还是熟悉传统的同步原语而且传统的同步原语也不容易出错。所以这节课还是希望带你掌握基于Mutex实现的方法。
那怎么实现一个扩展TryLock方法的Mutex呢我们直接来看代码。
```
// 复制Mutex定义的常量
const (
mutexLocked = 1 << iota // 加锁标识位置
mutexWoken // 唤醒标识位置
mutexStarving // 锁饥饿标识位置
mutexWaiterShift = iota // 标识waiter的起始bit位置
)
// 扩展一个Mutex结构
type Mutex struct {
sync.Mutex
}
// 尝试获取锁
func (m *Mutex) TryLock() bool {
// 如果能成功抢到锁
if atomic.CompareAndSwapInt32((*int32)(unsafe.Pointer(&m.Mutex)), 0, mutexLocked) {
return true
}
// 如果处于唤醒、加锁或者饥饿状态这次请求就不参与竞争了返回false
old := atomic.LoadInt32((*int32)(unsafe.Pointer(&m.Mutex)))
if old&(mutexLocked|mutexStarving|mutexWoken) != 0 {
return false
}
// 尝试在竞争的状态下请求锁
new := old | mutexLocked
return atomic.CompareAndSwapInt32((*int32)(unsafe.Pointer(&m.Mutex)), old, new)
}
```
第17行是一个fast path如果幸运没有其他goroutine争这把锁那么这把锁就会被这个请求的goroutine获取直接返回。
如果锁已经被其他goroutine所持有或者被其他唤醒的goroutine准备持有那么就直接返回false不再请求代码逻辑在第23行。
如果没有被持有也没有其它唤醒的goroutine来竞争锁锁也不处于饥饿状态就尝试获取这把锁第29行不论是否成功都将结果返回。因为这个时候可能还有其他的goroutine也在竞争这把锁所以不能保证成功获取这把锁。
我们可以写一个简单的测试程序来测试我们的TryLock的机制是否工作。
这个测试程序的工作机制是这样子的程序运行时会启动一个goroutine持有这把我们自己实现的锁经过随机的时间才释放。主goroutine会尝试获取这把锁。如果前一个goroutine一秒内释放了这把锁那么主goroutine就有可能获取到这把锁了输出“got the lock”否则没有获取到也不会被阻塞会直接输出“`can't get the lock`”。
```
func try() {
var mu Mutex
go func() { // 启动一个goroutine持有一段时间的锁
mu.Lock()
time.Sleep(time.Duration(rand.Intn(2)) * time.Second)
mu.Unlock()
}()
time.Sleep(time.Second)
ok := mu.TryLock() // 尝试获取到锁
if ok { // 获取成功
fmt.Println("got the lock")
// do something
mu.Unlock()
return
}
// 没有获取到
fmt.Println("can't get the lock")
}
```
# 获取等待者的数量等指标
接下来,我想和你聊聊怎么获取等待者数量等指标。
第二讲中我们已经学习了Mutex的结构。先来回顾一下Mutex的数据结构如下面的代码所示。它包含两个字段state和sema。前四个字节int32就是state字段。
```
type Mutex struct {
state int32
sema uint32
}
```
Mutex结构中的state字段有很多个含义通过state字段你可以知道锁是否已经被某个goroutine持有、当前是否处于饥饿状态、是否有等待的goroutine被唤醒、等待者的数量等信息。但是state这个字段并没有暴露出来所以我们需要想办法获取到这个字段并进行解析。
怎么获取未暴露的字段呢很简单我们可以通过unsafe的方式实现。我来举一个例子你一看就明白了。
```
const (
mutexLocked = 1 << iota // mutex is locked
mutexWoken
mutexStarving
mutexWaiterShift = iota
)
type Mutex struct {
sync.Mutex
}
func (m *Mutex) Count() int {
// 获取state字段的值
v := atomic.LoadInt32((*int32)(unsafe.Pointer(&m.Mutex)))
v = v >> mutexWaiterShift + (v & mutexLocked)
return int(v)
```
这个例子的第14行通过unsafe操作我们可以得到state字段的值。第15行我们右移三位这里的常量mutexWaiterShift的值为3就得到了当前等待者的数量。如果当前的锁已经被其他goroutine持有那么我们就稍微调整一下这个值加上一个1第16行你基本上可以把它看作是当前持有和等待这把锁的goroutine的总数。
state这个字段的第一位是用来标记锁是否被持有第二位用来标记是否已经唤醒了一个等待者第三位标记锁是否处于饥饿状态通过分析这个state字段我们就可以得到这些状态信息。我们可以为这些状态提供查询的方法这样就可以实时地知道锁的状态了。
```
// 锁是否被持有
func (m *Mutex) IsLocked() bool {
state := atomic.LoadInt32((*int32)(unsafe.Pointer(&m.Mutex)))
return state&mutexLocked == mutexLocked
}
// 是否有等待者被唤醒
func (m *Mutex) IsWoken() bool {
state := atomic.LoadInt32((*int32)(unsafe.Pointer(&m.Mutex)))
return state&mutexWoken == mutexWoken
}
// 锁是否处于饥饿状态
func (m *Mutex) IsStarving() bool {
state := atomic.LoadInt32((*int32)(unsafe.Pointer(&m.Mutex)))
return state&mutexStarving == mutexStarving
}
```
我们可以写一个程序测试一下比如在1000个goroutine并发访问的情况下我们可以把锁的状态信息输出出来
```
func count() {
var mu Mutex
for i := 0; i < 1000; i++ { // 启动1000个goroutine
go func() {
mu.Lock()
time.Sleep(time.Second)
mu.Unlock()
}()
}
time.Sleep(time.Second)
// 输出锁的信息
fmt.Printf("waitings: %d, isLocked: %t, woken: %t, starving: %t\n", mu.Count(), mu.IsLocked(), mu.IsWoken(), mu.IsStarving())
}
```
有一点你需要注意一下在获取state字段的时候并没有通过Lock获取这把锁所以获取的这个state的值是一个瞬态的值可能在你解析出这个字段之后锁的状态已经发生了变化。不过没关系因为你查看的就是调用的那一时刻的锁的状态。
# 使用Mutex实现一个线程安全的队列
最后我们来讨论一下如何使用Mutex实现一个线程安全的队列。
为什么要讨论这个话题呢因为Mutex经常会和其他非线程安全对于Go来说我们其实指的是goroutine安全的数据结构一起组合成一个线程安全的数据结构。新数据结构的业务逻辑由原来的数据结构提供而**Mutex提供了锁的机制****来****保证线程安全**。
比如队列我们可以通过Slice来实现但是通过Slice实现的队列不是线程安全的出队Dequeue和入队Enqueue会有data race的问题。这个时候Mutex就要隆重出场了通过它我们可以在出队和入队的时候加上锁的保护。
```
type SliceQueue struct {
data []interface{}
mu sync.Mutex
}
func NewSliceQueue(n int) (q *SliceQueue) {
return &SliceQueue{data: make([]interface{}, 0, n)}
}
// Enqueue 把值放在队尾
func (q *SliceQueue) Enqueue(v interface{}) {
q.mu.Lock()
q.data = append(q.data, v)
q.mu.Unlock()
}
// Dequeue 移去队头并返回
func (q *SliceQueue) Dequeue() interface{} {
q.mu.Lock()
if len(q.data) == 0 {
q.mu.Unlock()
return nil
}
v := q.data[0]
q.data = q.data[1:]
q.mu.Unlock()
return v
}
```
因为标准库中没有线程安全的队列数据结构的实现所以你可以通过Mutex实现一个简单的队列。通过Mutex我们就可以为一个非线程安全的data interface{}实现线程安全的访问。
# 总结
好了,我们来做个总结。
Mutex是package sync的基石其他的一些同步原语也是基于它实现的所以我们“隆重”地用了四讲来深度学习它。学到后面你一定能感受到多花些时间来完全掌握Mutex是值得的。
今天这一讲我和你分享了几个Mutex的拓展功能这些方法是不是给你带来了一种“骇客”的编程体验呢通过Hacker的方式我们真的可以让Mutex变得更强大。
我们学习了基于Mutex实现TryLock通过unsafe的方式读取到Mutex内部的state字段这样我们就解决了开篇列举的问题一是不希望锁的goroutine继续等待一是想监控锁。
另外使用Mutex组合成更丰富的数据结构是我们常见的场景今天我们就实现了一个线程安全的队列未来我们还会讲到实现线程安全的map对象。
到这里Mutex我们就系统学习完了最后给你总结了一张Mutex知识地图帮你复习一下。
![](https://static001.geekbang.org/resource/image/5a/0b/5ayy6cd9ec9fe0bcc13113302056ac0b.jpg?wh=2396*3131)
# 思考题
你可以为Mutex获取锁时加上Timeout机制吗会有什么问题吗
欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得有所收获,也欢迎你把今天的内容分享给你的朋友或同事。