You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

17 KiB

11 | Context信息穿透上下文

你好,我是鸟窝。

在这节课正式开始之前,我想先带你看一个工作中的场景。

假设有一天你进入办公室,突然同事们都围住你,然后大喊“小王小王你最帅”,此时你可能一头雾水,只能尴尬地笑笑。为啥呢?因为你缺少上下文的信息,不知道之前发生了什么。

但是如果同事告诉你由于你业绩突出一天之内就把云服务化的主要架构写好了因此被评为9月份的工作之星总经理还特意给你发1万元的奖金那么你心里就很清楚了原来同事恭喜你是因为你的工作被表扬了还获得了奖金。同事告诉你的这些前因后果就是上下文信息他把上下文传递给你你接收后就可以获取之前不了解的信息。

你看上下文Context就是这么重要。在我们的开发场景中上下文也是不可或缺的缺少了它我们就不能获取完整的程序信息。那到底啥是上下文呢其实这就是指在API之间或者方法调用之间所传递的除了业务参数之外的额外信息。

比如服务端接收到客户端的HTTP请求之后可以把客户端的IP地址和端口、客户端的身份信息、请求接收的时间、Trace ID等信息放入到上下文中这个上下文可以在后端的方法调用中传递后端的业务方法除了利用正常的参数做一些业务处理如订单处理之外还可以从上下文读取到消息请求的时间、Trace ID等信息把服务处理的时间推送到Trace服务中。Trace服务可以把同一Trace ID的不同方法的调用顺序和调用时间展示成流程图方便跟踪。

不过Go标准库中的Context功能还不止于此它还提供了超时Timeout和取消Cancel的机制下面就让我一一道来。

Context的来历

在学习Context的功能之前呢我先带你了解下它的来历。毕竟知道了它的来龙去脉我们才能应用得更加得心应手一些。

Go在1.7的版本中才正式把Context加入到标准库中。在这之前很多Web框架在定义自己的handler时都会传递一个自定义的Context把客户端的信息和客户端的请求信息放入到Context中。Go最初提供了golang.org/x/net/context库用来提供上下文信息最终还是在Go1.7中把此库提升到标准库context包中。

为啥呢这是因为在Go1.7之前有很多库都依赖golang.org/x/net/context中的Context实现这就导致Go 1.7发布之后出现了标准库Context和golang.org/x/net/context并存的状况。新的代码使用标准库Context的时候没有办法使用这个标准库的Context去调用旧有的使用x/net/context实现的方法。

所以在Go1.9中还专门实现了一个叫做type alias的新特性然后把x/net/context中的Context定义成标准库Context的别名以解决新旧Context类型冲突问题你可以看一下下面这段代码

    // +build go1.9
	package context
	
	import "context"
	
	type Context = context.Context
	type CancelFunc = context.CancelFunc

Go标准库的Context不仅提供了上下文传递的信息还提供了cancel、timeout等其它信息这些信息貌似和context这个包名没关系但是还是得到了广泛的应用。所以你看context包中的Context不仅仅传递上下文信息还有timeout等其它功能是不是“名不副实”呢

其实啊这也是这个Context的一个问题比较容易误导人Go布道师Dave Cheney还专门写了一篇文章讲述这个问题Context isnt for cancellation

同时也有一些批评者针对Context提出了批评Context should go away for Go 2这篇文章把Context比作病毒病毒会传染结果把所有的方法都传染上了病毒加上Context参数绝对是视觉污染。

Go的开发者也注意到了“关于Context存在一些争议”这件事儿所以Go核心开发者Ian Lance Taylor专门开了一个issue 28342用来记录当前的Context的问题

  • Context包名导致使用的时候重复ctx context.Context
  • Context.WithValue可以接受任何类型的值非类型安全
  • Context包名容易误导人实际上Context最主要的功能是取消goroutine的执行
  • Context漫天飞函数污染。

尽管有很多的争议但是在很多场景下使用Context其实会很方便所以现在它已经在Go生态圈中传播开来了包括很多的Web应用框架都切换成了标准库的Context。标准库中的database/sql、os/exec、net、net/http等包中都使用到了Context。而且如果我们遇到了下面的一些场景也可以考虑使用Context

  • 上下文信息传递 request-scoped比如处理http请求、在请求处理链路上传递信息
  • 控制子goroutine的运行
  • 超时控制的方法调用;
  • 可以取消的方法调用。

所以我们需要掌握Context的具体用法这样才能在不影响主要业务流程实现的时候实现一些通用的信息传递或者是能够和其它goroutine协同工作提供timeout、cancel等机制。

Context基本使用方法

首先我们来学习一下Context接口包含哪些方法这些方法都是干什么用的。

包context定义了Context接口Context的具体实现包括4个方法分别是Deadline、Done、Err和Value如下所示

type Context interface {
    Deadline() (deadline time.Time, ok bool)
    Done() <-chan struct{}
    Err() error
    Value(key interface{}) interface{}
}

下面我来具体解释下这4个方法。

Deadline方法会返回这个Context被取消的截止日期。如果没有设置截止日期ok的值是false。后续每次调用这个对象的Deadline方法时都会返回和第一次调用相同的结果。

Done方法返回一个Channel对象。在Context被取消时此Channel会被close如果没被取消可能会返回nil。后续的Done调用总是返回相同的结果。当Done被close的时候你可以通过ctx.Err获取错误信息。Done这个方法名其实起得并不好因为名字太过笼统不能明确反映Done被close的原因因为cancel、timeout、deadline都可能导致Done被close不过目前还没有一个更合适的方法名称。

关于Done方法你必须要记住的知识点就是如果Done没有被closeErr方法返回nil如果Done被closeErr方法会返回Done被close的原因。

Value返回此ctx中和指定的key相关联的value。

Context中实现了2个常用的生成顶层Context的方法。

  • context.Background()返回一个非nil的、空的Context没有任何值不会被cancel不会超时没有截止日期。一般用在主函数、初始化、测试以及创建根Context的时候。
  • context.TODO()返回一个非nil的、空的Context没有任何值不会被cancel不会超时没有截止日期。当你不清楚是否该用Context或者目前还不知道要传递一些什么上下文信息的时候就可以使用这个方法。

官方文档是这么讲的你可能会觉得像没说一样因为界限并不是很明显。其实你根本不用费脑子去考虑可以直接使用context.Background。事实上它们两个底层的实现是一模一样的

var (
    background = new(emptyCtx)
    todo       = new(emptyCtx)
)

func Background() Context {
    return background
}

func TODO() Context {
    return todo
}

在使用Context的时候有一些约定俗成的规则。

  1. 一般函数使用Context的时候会把这个参数放在第一个参数的位置。
  2. 从来不把nil当做Context类型的参数值可以使用context.Background()创建一个空的上下文对象也不要使用nil。
  3. Context只用来临时做函数之间的上下文透传不能持久化Context或者把Context长久保存。把Context持久化到数据库、本地文件或者全局变量、缓存中都是错误的用法。
  4. key的类型不应该是字符串类型或者其它内建类型否则容易在包之间使用Context时候产生冲突。使用WithValue时key的类型应该是自己定义的类型。
  5. 常常使用struct{}作为底层类型定义key的类型。对于exported key的静态类型常常是接口或者指针。这样可以尽量减少内存分配。

其实官方的文档也是比较搞笑的文档中强调key的类型不要使用string结果接下来的例子中就是用string类型作为key的类型。你自己把握住这个要点就好如果你能保证别人使用你的Context时不会和你定义的key冲突那么key的类型就比较随意因为你自己保证了不同包的key不会冲突否则建议你尽量采用保守的unexported的类型。

创建特殊用途Context的方法

接下来我会介绍标准库中几种创建特殊用途Context的方法WithValue、WithCancel、WithTimeout和WithDeadline包括它们的功能以及实现方式。

WithValue

WithValue基于parent Context生成一个新的Context保存了一个key-value键值对。它常常用来传递上下文。

WithValue方法其实是创建了一个类型为valueCtx的Context它的类型定义如下

type valueCtx struct {
    Context
    key, val interface{}
}

它持有一个key-value键值对还持有parent的Context。它覆盖了Value方法优先从自己的存储中检查这个key不存在的话会从parent中继续检查。

Go标准库实现的Context还实现了链式查找。如果不存在还会向parent Context去查找如果parent还是valueCtx的话还是遵循相同的原则valueCtx会嵌入parent所以还是会查找parent的Value方法的。

ctx = context.TODO()
ctx = context.WithValue(ctx, "key1", "0001")
ctx = context.WithValue(ctx, "key2", "0001")
ctx = context.WithValue(ctx, "key3", "0001")
ctx = context.WithValue(ctx, "key4", "0004")

fmt.Println(ctx.Value("key1"))

WithCancel

WithCancel 方法返回parent的副本只是副本中的Done Channel是新建的对象它的类型是cancelCtx。

我们常常在一些需要主动取消长时间的任务时创建这种类型的Context然后把这个Context传给长时间执行任务的goroutine。当需要中止任务时我们就可以cancel这个Context这样长时间执行任务的goroutine就可以通过检查这个Context知道Context已经被取消了。

WithCancel返回值中的第二个值是一个cancel函数。其实这个返回值的名称cancel和类型Cancel也非常迷惑人。

记住不是只有你想中途放弃才去调用cancel只要你的任务正常完成了就需要调用cancel这样这个Context才能释放它的资源通知它的children 处理cancel从它的parent中把自己移除甚至释放相关的goroutine。很多同学在使用这个方法的时候都会忘记调用cancel切记切记而且一定尽早释放。

我们来看下WithCancel方法的实现代码

func WithCancel(parent Context) (ctx Context, cancel CancelFunc) {
    c := newCancelCtx(parent)
    propagateCancel(parent, &c)// 把c朝上传播
    return &c, func() { c.cancel(true, Canceled) }
}

// newCancelCtx returns an initialized cancelCtx.
func newCancelCtx(parent Context) cancelCtx {
    return cancelCtx{Context: parent}
}

代码中调用的propagateCancel方法会顺着parent路径往上找直到找到一个cancelCtx或者为nil。如果不为空就把自己加入到这个cancelCtx的child以便这个cancelCtx被取消的时候通知自己。如果为空会新起一个goroutine由它来监听parent的Done是否已关闭。

当这个cancelCtx的cancel函数被调用的时候或者parent的Done被close的时候这个cancelCtx的Done才会被close。

cancel是向下传递的如果一个WithCancel生成的Context被cancel时如果它的子Context也有可能是孙或者更低依赖子的类型也是cancelCtx类型的就会被cancel但是不会向上传递。parent Context不会因为子Context被cancel而cancel。

cancelCtx被取消时它的Err字段就是下面这个Canceled错误

var Canceled = errors.New("context canceled")

WithTimeout

WithTimeout其实是和WithDeadline一样只不过一个参数是超时时间一个参数是截止时间。超时时间加上当前时间其实就是截止时间因此WithTimeout的实现是

func WithTimeout(parent Context, timeout time.Duration) (Context, CancelFunc) {
    // 当前时间+timeout就是deadline
    return WithDeadline(parent, time.Now().Add(timeout))
}

WithDeadline

WithDeadline会返回一个parent的副本并且设置了一个不晚于参数d的截止时间类型为timerCtx或者是cancelCtx

如果它的截止时间晚于parent的截止时间那么就以parent的截止时间为准并返回一个类型为cancelCtx的Context因为parent的截止时间到了就会取消这个cancelCtx。

如果当前时间已经超过了截止时间就直接返回一个已经被cancel的timerCtx。否则就会启动一个定时器到截止时间取消这个timerCtx。

综合起来timerCtx的Done被Close掉主要是由下面的某个事件触发的

  • 截止时间到了;
  • cancel函数被调用
  • parent的Done被close。

下面的代码是WithDeadline方法的实现

func WithDeadline(parent Context, d time.Time) (Context, CancelFunc) {
    // 如果parent的截止时间更早直接返回一个cancelCtx即可
    if cur, ok := parent.Deadline(); ok && cur.Before(d) {
        return WithCancel(parent)
    }
    c := &timerCtx{
        cancelCtx: newCancelCtx(parent),
        deadline:  d,
    }
    propagateCancel(parent, c) // 同cancelCtx的处理逻辑
    dur := time.Until(d)
    if dur <= 0 { //当前时间已经超过了截止时间直接cancel
        c.cancel(true, DeadlineExceeded)
        return c, func() { c.cancel(false, Canceled) }
    }
    c.mu.Lock()
    defer c.mu.Unlock()
    if c.err == nil {
        // 设置一个定时器,到截止时间后取消
        c.timer = time.AfterFunc(dur, func() {
            c.cancel(true, DeadlineExceeded)
        })
    }
    return c, func() { c.cancel(true, Canceled) }
}

和cancelCtx一样WithDeadlineWithTimeout返回的cancel一定要调用并且要尽可能早地被调用这样才能尽早释放资源不要单纯地依赖截止时间被动取消。正确的使用姿势是啥呢我们来看一个例子。

func slowOperationWithTimeout(ctx context.Context) (Result, error) {
	ctx, cancel := context.WithTimeout(ctx, 100*time.Millisecond)
	defer cancel() // 一旦慢操作完成就立马调用cancel
	return slowOperation(ctx)
}

总结

我们经常使用Context来取消一个goroutine的运行这是Context最常用的场景之一Context也被称为goroutine生命周期范围goroutine-scoped的Context把Context传递给goroutine。但是goroutine需要尝试检查Context的Done是否关闭了

func main() {
    ctx, cancel := context.WithCancel(context.Background())

    go func() {
        defer func() {
            fmt.Println("goroutine exit")
        }()

        for {
            select {
            case <-ctx.Done():
                return
            default:
                time.Sleep(time.Second)
            }
        }
    }()

    time.Sleep(time.Second)
    cancel()
    time.Sleep(2 * time.Second)
}

如果你要为Context实现一个带超时功能的调用比如访问远程的一个微服务超时并不意味着你会通知远程微服务已经取消了这次调用大概率的实现只是避免客户端的长时间等待远程的服务器依然还执行着你的请求。

所以有时候Context并不会减少对服务器的请求负担。如果在Context被cancel的时候你能关闭和服务器的连接中断和数据库服务器的通讯、停止对本地文件的读写那么这样的超时处理同时能减少对服务调用的压力但是这依赖于你对超时的底层处理机制。

思考题

使用WithCancel和WithValue写一个级联的使用Context的例子验证一下parent Context被cancel后子conext是否也立刻被cancel了。

欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得有所收获,也欢迎你把今天的内容分享给你的朋友或同事。