gitbook/Tony Bai · Go语言第一课/docs/479883.md

451 lines
18 KiB
Markdown
Raw Permalink Normal View History

2022-09-03 22:05:03 +08:00
# 大咖助阵叶剑峰Go语言中常用的那些代码优化点
你好,我是轩脉刃,是[《手把手带你写一个Web框架》](https://time.geekbang.org/column/intro/100090601)专栏的作者。
很高兴应编辑邀请,为 Tony Bai 老师的专栏写一篇加餐文章。Tony Bai大佬是我很早在微博关注的一名Go先行者。他的《Gopher Daily》也是我经常学习阅读的Go语言资料之一。很高兴看到Tony Bai老师在极客时间也开了一个专栏将他的经验分享出来。
这篇加餐我主要想和你聊一聊Go语言中常用的一些代码优化点。在Go语言中如果你不断地在一线写代码一定多多少少都会有一些写代码的套路和经验。这些套路和经验可以帮助你在实际工作中遇到类似问题时更成竹在胸。
所以这里,我想和你分享一下我个人在开发过程中看到和使用到的一些常用的代码优化点,希望能给你日常编码带来一些帮助。
## 第一点使用pkg/errors而不是官方error库
其实我们可以思考一下,我们在一个项目中使用错误机制,最核心的几个需求是什么?我觉得主要是这两点:
* 附加信息:我们希望错误出现的时候能附带一些描述性的错误信息,甚至这些信息是可以嵌套的;
* 附加堆栈:我们希望错误不仅仅打印出错误信息,也能打印出这个错误的堆栈信息,让我们可以知道出错的具体代码。
在Go语言的演进过程中error传递的信息太少一直是被诟病的一点。使用官方的error库我们只能打印一条简单的错误信息而没有更多的信息辅助快速定位错误。所以我推荐你在应用层使用 github.com/pkg/errors 来替换官方的error库。因为使用pkg/errors我们不仅能传递出标准库error的错误信息还能传递出抛出error的堆栈信息。
这里我们看一个例子直观感受一下。假设我们有一个项目叫errdemo他有sub1,sub2两个子包。sub1和sub2两个包都有Diff和IoDiff两个函数。
![图片](https://static001.geekbang.org/resource/image/d9/b4/d9eb082d98575e2cddb4c473f82d0bb4.png?wh=546x698)
我们设计的这个程序在sub2.go和sub1.go中都抛出了错误且错误信息都为diff error。我们看下使用标准库error和pkg/errors都能返回什么信息
```plain
// sub2.go
package sub2
import (
"errors"
)
func Diff(foo int, bar int) error {
return errors.New("diff error")
}
// sub1.go
package sub1
import (
"errdemo/sub1/sub2"
"fmt"
"errors"
)
func Diff(foo int, bar int) error {
if foo < 0 {
return errors.New("diff error")
}
if err := sub2.Diff(foo, bar); err != nil {
return err
}
return nil
}
// main.go
package main
import (
"errdemo/sub1"
"fmt"
)
func main() {
err := sub1.Diff(1, 2)
fmt.Println(err)
}
```
在这三段代码中我们很不幸地将sub1.go中的Diff返回的error和sub2.go中Diff返回的error都定义为同样的字符串“diff error”
![图片](https://static001.geekbang.org/resource/image/ae/c5/ae93bd0cd55f6d5e9fe00e374245fec5.png?wh=374x51)
这个时候在main.go中我们是无论如何都不能通过这个错误信息来判断这个error到底是从sub1 还是 sub2 中抛出的,调试的时候会带来很大的困扰。
而使用 github.com/pkg/errors 就不同了它可以把错误的堆栈信息也打印出来。而且我们所有的代码都不需要进行修改只需要将import地方进行对应的修改就可以了。
比如在这段代码中我们只需要在main.go中使用`fmt.Printf("%+v", err)` 就可以了:
```plain
// sub2.go
package sub2
import (
"github.com/pkg/errors"
)
func Diff(foo int, bar int) error {
return errors.New("diff error")
}
// sub1.go
package sub1
import (
"errdemo/sub1/sub2"
"fmt"
"github.com/pkg/errors"
)
func Diff(foo int, bar int) error {
if foo < 0 {
return errors.New("diff error")
}
if err := sub2.Diff(foo, bar); err != nil {
return err
}
return nil
}
// main.go
package main
import (
"errdemo/sub1"
"fmt"
)
func main() {
err := sub1.Diff(1, 2)
fmt.Printf("%+v", err)
}
```
我们再看这个程序运行的结果:
![图片](https://static001.geekbang.org/resource/image/2d/40/2dff326f340d6e3f6a4b91091b83a240.png?wh=600x288)
我们可以看到,除了"diff error" 的错误信息之外pkg/errors 还将堆栈打印出来了我们能明确地看到是sub2.go中第7行抛出的错误。
那么github.com/pkg/errors是怎么实现这个功能的呢其实它的原理非常简单它就是利用了fmt包的一个特性。fmt包在打印error之前会判断当前打印的对象是否实现了Formatter接口这个formatter接口只有一个format方法。如果要输出的对象实现了这个Formatter接口则调用对象的Format方法来打印信息
```
type Formatter interface {
Format(f State, c rune)
}
```
而github.com/pkg/errors 中提供的各种初始化error方法包括errors.New封装了一个fundamental 结构这个结构就是实现了Formatter接口
```
// fundamental is an error that has a message and a stack, but no caller.
type fundamental struct {
msg string
*stack
}
```
我们可以看到这个fundamental结构中带着error的信息和堆栈信息。并且实现了Format方法。在Format方法中判断调用fmt.Printf 函数的第一个参数,如果是+v则打印错误内容和堆栈信息如果是v或者s则打印错误内容如果是q则打印转义后的信息
```
func (f *fundamental) Format(s fmt.State, verb rune){
switch verb {
case 'v':
if s.Flag('+') {
io.WriteString(s, f.msg)
f.stack.Format(s, verb)
return
}
fallthrough
case 's':
io.WriteString(s, f.msg)
case 'q':
fmt.Fprintf(s, "%q", f.msg)
}
}
```
所以说我们在实际的工作项目中我建议你尽量使用pkg/errors而不是官方error库这样我们能在错误出现的时候获取更多的错误信息更快地定位问题。
## 第二点在初始化slice的时候尽量补全cap
当我们要创建一个slice结构并且往slice中append元素的时候我们可能有两种写法来初始化这个slice。
**方法一,直接使用\[\]int的方式来初始化**
```plain
package main
import "fmt"
func main() {
arr := []int{}
arr = append(arr, 1, 2, 3, 4, 5)
fmt.Println(arr)
}
```
**方法二使用make关键字来初始化**
```plain
package main
import "fmt"
func main() {
arr := make([]int, 0, 5)
arr = append(arr, 1, 2, 3, 4, 5)
fmt.Println(arr)
}
```
我们可以看到,方法二相较于方法一,就只有一个区别:**在初始化\[\]int slice的时候在make中设置了cap的长度就是slice的大小**。
而且这两种方法对应的功能和输出结果是没有任何差别的但是实际运行的时候方法二会比方法一少运行了一个growslice的命令能够提升我们程序的运行性能。具体我们可以打印汇编码查看一下。
方法一:
![图片](https://static001.geekbang.org/resource/image/ee/9d/ee3e93ab0b2f145befe5e4d4dde2e29d.png?wh=551x485)
方法二:
![图片](https://static001.geekbang.org/resource/image/b9/9f/b95ba410d26d5130d0fc5d0ec2761e9f.png?wh=549x483)
我们看到方法一中使用了growsslice方法而方法二中是没有调用这个方法的。
这个growslice的作用就是扩充slice容量每当我们的slice容量小于我们需要使用的slice大小这个函数就会被触发。它的机制就好比是原先我们没有定制容量系统给了我们一个能装两个鞋子的盒子但是当我们装到第三个鞋子的时候这个盒子就不够了我们就要换一个盒子而换这个盒子我们势必还需要将原先的盒子里面的鞋子也拿出来放到新的盒子里面。
而growsslice的操作是一个比较复杂的操作它的表现和复杂度会高于最基本的初始化make方法。对追求性能的程序来说应该能避免就尽量避免。
如果你对growsslice函数的具体实现感兴趣你可以参考源码src的 [runtime/slice.go](https://github.com/golang/go/blob/master/src/runtime/slice.go) 。
当然我们并不是每次都能在slice初始化的时候就准确预估到最终的使用容量所以我这里说的是“尽量补全cap”。明白是否设置slice容量的区别后我们在能预估容量的时候请尽量使用方法二那种预估容量后的slice初始化方式。
## 第三点初始化一个类的时候如果类的构造参数较多尽量使用Option写法
当我们遇到一定要初始化一个类的时候大部分时候我们都会使用类似下列的New方法
```plain
package newdemo
type Foo struct {
name string
id int
age int
db interface{}
}
func NewFoo(name string, id int, age int, db interface{}) *Foo {
return &Foo{
name: name,
id: id,
age: age,
db: db,
}
}
```
在这段代码中我们定义一个NewFoo方法其中存放初始化Foo结构所需要的各种字段属性。
这个写法乍看之下是没啥问题的但是一旦Foo结构内部的字段发生了变化增加或者减少了那么这个初始化函数NewFoo就怎么看怎么别扭了。
参数继续增加那么所有调用了这个NewFoo方法的地方也都需要进行修改且按照代码整洁的逻辑参数多于5个这个函数就很难使用了。而且如果这5个参数都是可有可无的参数就是有的参数可以不填写有默认值比如age这个字段即使我们不填写在后续的业务逻辑中可能也没有很多影响那么我在实际调用NewFoo的时候age这个字段还需要传递0值
```plain
foo := NewFoo("jianfengye", 1, 0, nil)
```
乍看这行代码你可能会以为我创建了一个Foo它的年龄为0但是实际上我们是希望表达这里使用了一个“缺省值”这种代码的语义逻辑就不对了。
这里其实有一种更好的写法:**使用Option写法来进行改造**。
Option写法顾名思义就是将所有可选的参数作为一个可选方式一般我们会设计一个“函数类型”来代表这个Option然后配套将所有可选字段设计为一个这个函数类型的具体实现。在具体的使用的时候使用可变字段的方式来控制有多少个函数类型会被执行。比如上述的代码我们会改造为
```plain
type Foo struct {
name string
id int
age int
db interface{}
}
// FooOption 代表可选参数
type FooOption func(foo *Foo)
// WithName 代表Name为可选参数
func WithName(name string) FooOption {
return func(foo *Foo) {
foo.name = name
}
}
// WithAge 代表age为可选参数
func WithAge(age int) FooOption {
return func(foo *Foo) {
foo.age = age
}
}
// WithDB 代表db为可选参数
func WithDB(db interface{}) FooOption {
return func(foo *Foo) {
foo.db = db
}
}
// NewFoo 代表初始化
func NewFoo(id int, options ...FooOption) *Foo {
foo := &Foo{
name: "default",
id: id,
age: 10,
db: nil,
}
for _, option := range options {
option(foo)
}
return foo
}
```
现在我们来解释下上面的这段代码我们创建了一个FooOption的函数类型这个函数类型代表的函数结构是 `func(foo *Foo)` 。这个结构很简单就是将foo指针传递进去能让内部函数进行修改。
然后我们针对三个初始化字段nameagedb定义了三个返回了FooOption的函数负责修改它们
* WithName
* WithAge
* WithDB。
以WithName为例这个函数参数为string返回值为FooOption。在返回值的FooOption中根据参数修改了Foo指针。
```plain
// WithName 代表Name为可选参数
func WithName(name string) FooOption {
return func(foo *Foo) {
foo.name = name
}
}
```
顺便说一下这种函数我们一般都以With开头表示我这次初始化“带着”这个字段。
而最后NewFoo函数的参数我们就改造为两个部分一个部分是“非Option”字段就是必填字段假设我们的Foo结构实际上只有一个必填字段id而其他字段皆是选填的第二个部分就是其他所有选填字段我们使用一个可变参数 options 替换:
```plain
NewFoo(id int, options ...FooOption)
```
在具体的NewFoo实现中也变化成2个步骤
* 按照默认值初始化一个foo对象
* 遍历options改造这个foo对象。
按照这样改造之后我们具体使用Foo结构的函数就变成了这个样子
```plain
// 具体使用NewFoo的函数
func Bar() {
foo := NewFoo(1, WithAge(15), WithName("foo"))
fmt.Println(foo)
}
```
可读性是不是高了很多这里New了一个Foo结构id为1并且带着指定age为15指定name为“foo”。
如果我们后续Foo多了一个可变属性那么我们只需要多一个WithXXX的方法就可以了而NewFoo函数不需要任何变化调用方只要在指定这个可变属性的地方增加WithXXX就可以了扩展性非常好。
这种Option的写法在很多著名的库中都有使用到比如gorm, go-redis等。所以我们要把这种方式熟悉起来一旦我们需要对一个比较复杂的类进行初始化的时候这种方法应该是最优的方式了。
## 第四点:巧用大括号控制变量作用域
在写Go的过程中你一定有过为 := 和 = 烦恼的时刻。一个变量,到写的时候,我还要记得前面是否已经定义过了,如果没有定义过,使用 := ,如果已经定义过,使用 =。
当然很多时候你可能并不会犯这种错误如果变量命名得比较好的话我们是很容易记得这个变量前面是否有定义过的。但是更多时候对于err这种通用的变量名字你可能就不一定记得了。
**这个时候,巧妙使用大括号,就能很好避免这个问题。**
我举一个我之前写过的一个命令行工具的例子。我们都知道写命令行工具对传递的参数的解析需要有一些逻辑“如果参数中有某个字段那么就解析并存储到变量中如果没有就记录error”这里我就使用了大括号将每个参数的解析和处理错误的逻辑都封装起来。
代码大概是这样的:
```plain
var name string
var folder string
var mod string
...
{
prompt := &survey.Input{
Message: "请输入目录名称:",
}
err := survey.AskOne(prompt, &name)
if err != nil {
return err
}
...
}
{
prompt := &survey.Input{
Message: "请输入模块名称(go.mod中的module, 默认为文件夹名称)",
}
err := survey.AskOne(prompt, &mod)
if err != nil {
return err
}
...
}
{
// 获取hade的版本
client := github.NewClient(nil)
prompt := &survey.Input{
Message: "请输入版本名称(参考 https://github.com/gohade/hade/releases默认为最新版本)",
}
err := survey.AskOne(prompt, &version)
if err != nil {
return err
}
...
}
```
我简单解释下这段代码。首先整段代码的作用是解析出三个变量name、mod、version。最开始我们先定义这三个变量然后使用三个大括号分别将这三个变量的解析逻辑封装在里面。这样每个大括号里面的err变量的作用域就完全局限在括号中了。所以我们每次都可以直接使用 := 来创建一个新的 err并处理它不用再额外思考这个err 变量是否前面已经创建过了。
你可以自己观察一下,大括号在代码语义上还有一个好处,就是归类和展示。
归类的意思就是,这个大括号里面的变量和逻辑是一个完整的部分,他们内部创建的变量不会泄漏到外部。这个等于告诉后续的阅读者,你在阅读的时候,如果对这个逻辑不感兴趣,可以不阅读里面的内容;如果你感兴趣,就可以进入里面进行阅读。
基本上所有IDE都支持对大括号封装的内容进行压缩。这里我使用的是Goland压缩后我的命令行的主体逻辑就更清晰了
![图片](https://static001.geekbang.org/resource/image/d6/08/d66665bf45f98f1295011636cf981808.png?wh=1784x1620)
所以使用大括号结合IDE你的代码的可读性能得到很大的提升。
## 总结
好了这次的分享到这里就结束了。今天我给你总结了四个Go语言中常用的写法
* 使用pkg/error而不是官方error库
* 在初始化slice的时候尽量补全cap
* 初始化一个类的时候如果类的构造参数较多尽量使用Option写法
* 巧用大括号控制变量作用域。
这几种写法和注意事项都是我在工作和阅读开源项目中的一些总结和经验,每个经验都是对应为了解决不同的问题。
虽然说Go已经对代码做了不少的规范和优化但是好的代码和不那么好的代码还是有一些差距的这些写法优化点就是其中一部分。
我今天只列出的了四个点当然了还有很多类似的Go写法优化点等着你去发现。相信你在工作生活中也能遇到不少只要你平时能多思考、多总结、多动手也能积攒出属于自己的一本小小的优化手册。