You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

386 lines
18 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 10变量声明静态语言有别于动态语言的重要特征
你好我是Tony Bai。
今天我们将深入Go语法细节学习静态语言有别于动态语言的一个重要特征**变量声明**。那么变量声明究竟解决的是什么问题呢?我们先从变量这个概念说起。
在编程语言中,为了方便操作内存特定位置的数据,我们用一个特定的名字与位于特定位置的内存块绑定在一起,这个名字被称为**变量**。
但这并不代表我们可以通过变量随意引用或修改内存,**变量所绑定的内存区域是要有一个明确的边界的**。也就是说通过这样一个变量我们究竟可以操作4个字节内存还是8个字节内存又或是256个字节内存编程语言的编译器或解释器需要明确地知道。
那么,编程语言的编译器或解释器是如何知道一个变量所能引用的内存区域边界呢?
其实动态语言和静态语言有不同的处理方式。动态语言比如Python、Ruby等的解释器可以在运行时通过对变量赋值的分析自动确定变量的边界。并且在动态语言中一个变量可以在运行时被赋予大小不同的边界。
而静态编程语言在这方面的“体验略差”。静态类型语言编译器必须明确知道一个变量的边界才允许使用这个变量,但静态语言编译器又没能力自动提供这个信息,这个边界信息必须由这门语言的使用者提供,于是就有了“**变量声明**”。通过变量声明,语言使用者可以显式告知编译器一个变量的边界信息。在具体实现层面呢,这个边界信息由变量的类型属性赋予。
作为身处静态编程语言阵营的Go语言它沿袭了静态语言的这一要求**使用变量之前需要先进行变量声明**。
首先让我们先来看看Go语言的变量声明方法。
## Go语言的变量声明方法
我们前面说过Go是静态语言所有变量在使用前必须先进行声明。声明的意义在于告诉编译器该变量可以操作的内存的边界信息而这种边界通常又是由变量的类型信息提供的。
在Go语言中有一个通用的变量声明方法是这样的
![图片](https://static001.geekbang.org/resource/image/cf/03/cf0a619528dd03893edbb83f3c4dd303.jpg?wh=1487x770)
这个变量声明分为四个部分:
* var是修饰变量声明的关键字
* a为变量名
* int为该变量的类型
* 10是变量的初值。
你看啊其实Go语言的变量声明形式与其他主流静态语言有一个显著的差异那就是**它将变量名放在了类型的前面**。这样做有什么好处呢我先不说我想请你思考一下。这个类型为变量提供了边界信息在Go语言中无论什么类型的变量都可以使用这种形式进行变量声明。
但是如果你没有显式为变量赋予初值Go编译器会为变量赋予这个类型的零值
```plain
var a int // a的初值为int类型的零值0
```
什么是类型的零值呢Go语言的每种原生类型都有它的默认值这些原生类型我们后面再讲这个默认值就是这个类型的零值。这里我给你写了Go规范定义的内置原生类型的默认值即零值
![图片](https://static001.geekbang.org/resource/image/92/23/92242134ff5ccdaed32854d01690ab23.jpg?wh=1920x687)
另外,像数组、结构体这样复合类型变量的零值就是它们组成元素都为零值时的结果。
除了单独声明每个变量外Go语言还提供了变量声明块block的语法形式可以用一个var关键字将多个变量声明放在一起像下面代码这样
```plain
var (
a int = 128
b int8 = 6
s string = "hello"
c rune = 'A'
t bool = true
)
```
你看在这个变量声明块中我们通过一个var关键字声明了5个不同类型的变量。而且Go语言还支持在一行变量声明中同时声明多个变量
```plain
var a, b, c int = 5, 6, 7
```
这样的多变量声明同样也可以用在变量声明块中,像下面这样:
```plain
var (
a, b, c int = 5, 6, 7
c, d, e rune = 'C', 'D', 'E'
)
```
当然了,虽然我们现在写的多变量声明都是在声明同一类型的变量,但是它也适用于声明不同类型的变量,这个我们等会儿会详细讲讲。
除了上面这种通用的变量声明形式为了给开发者带来更好的使用体验Go语言还提供了两种变量声明的“语法糖”下面我们逐一来学习一下。
**1\. 省略类型信息的声明:**
在通用的变量声明的基础上Go编译器允许我们省略变量声明中的类型信息它的标准范式是“**var varName = initExpression**”,比如下面就是一个省略了类型信息的变量声明:
```plain
var b = 13
```
那么Go编译器在遇到这样的变量声明后是如何确定变量的类型信息呢
其实很简单Go编译器会根据右侧变量初值自动推导出变量的类型并给这个变量赋予初值所对应的默认类型。比如整型值的默认类型int浮点值的默认类型为float64复数值的默认类型为complex128。其他类型值的默认类型就更好分辨了在Go语言中仅有唯一与之对应的类型比如布尔值的默认类型只能是bool字符值默认类型只能是rune字符串值的默认类型只能是string等。
如果我们不接受默认类型,而是要显式地为变量指定类型,除了通用的声明形式,我们还可以通过显式类型转型达到我们的目的:
```plain
var b = int32(13)
```
显然这种省略类型信息声明的“语法糖”仅**适用于在变量声明的同时显式赋予变量初值的情况**,下面这种没有初值的声明形式是不被允许的:
```plain
var b
```
结合多变量声明,我们可以使用这种变量声明“语法糖”声明多个不同类型的变量:
```plain
var a, b, c = 12, 'A', "hello"
```
在这个变量声明中我们声明了三个变量a、b和c但它们分别具有不同的类型分别为int、rune和string。
在这种变量声明语法糖中我们省去了变量类型信息但Go编译器会为我们自动推导出类型信息。那是否还有更简化的变量声明形式呢答案是有的。下面我们就来看看短变量声明。
**2\. 短变量声明:**
其实Go语言还为我们提供了最简化的变量声明形式**短变量声明**。使用短变量声明时我们甚至可以省去var关键字以及类型信息它的标准范式是“varName := initExpression”。我这里也举了几个例子
```plain
a := 12
b := 'A'
c := "hello"
```
这里我们看到,短变量声明将通用变量声明中的四个部分省去了两个,但它并没有使用赋值操作符“=”,而是使用了短变量声明专用的“:=”。这个原理和上一种省略类型信息的声明语法糖一样短变量声明中的变量类型也是由Go编译器自动推导出来的。
而且,短变量声明也支持一次声明多个变量,而且形式更为简洁,是这个样子的:
```plain
a, b, c := 12, 'A', "hello"
```
不过呢,短变量声明的使用也是有约束的,并不是所有变量都能用短变量声明来声明的,这个你会在下面的讲解中了解到。
好了,现在我们已经学习了至少三种变量声明形式了。这时候你可能有些犯迷糊了:这些变量声明形式是否适合所有变量呢?我到底该使用哪一种呢?别急,在揭晓答案之前,我们需要学习点预备知识:**Go语言的两类变量**。
通常来说Go语言的变量可以分为两类一类称为**包级变量(package varible)**,也就是在包级别可见的变量。如果是导出变量(大写字母开头),那么这个包级变量也可以被视为全局变量;另一类则是**局部变量(local varible)**也就是Go函数或方法体内声明的变量仅在函数或方法体内可见。而我们声明的所有变量都逃不开这两种。
有了这个预备知识,接下来我们就来分别说明一下这两类变量在声明形式选择上的方法,以及一些最佳实践。
## 包级变量的声明形式
首先,我先下个结论:**包级变量只能使用带有var关键字的变量声明形式不能使用短变量声明形式但在形式细节上可以有一定灵活度。**具体这个灵活度怎么去考虑呢?我们可以从“变量声明时是否延迟初始化”这个角度,对包级变量的声明形式进行一次分类。
**第一类:声明并同时显式初始化。**
你先看看这个代码:
```plain
// $GOROOT/src/io/io.go
var ErrShortWrite = errors.New("short write")
var ErrShortBuffer = errors.New("short buffer")
var EOF = errors.New("EOF")
```
我们可以看到这个代码块里声明的变量都是io包的包级变量。在Go标准库中对于变量声明的同时进行显式初始化的这类包级变量实践中多使用这种省略类型信息的“语法糖”格式
```plain
var varName = initExpression
```
就像我们前面说过的那样Go编译器会自动根据等号右侧InitExpression结果值的类型来确定左侧声明的变量的类型这个类型会是结果值对应类型的默认类型。
当然,如果我们不接受默认类型,而是**要显式地为包级变量指定类型**,那么我们有两种方式,我这里给出了两种包级变量的声明形式的对比示例。
```
//第一种:
plain
var a = 13 // 使用默认类型
var b int32 = 17 // 显式指定类型
var f float32 = 3.14 // 显式指定类型
//第二种:
var a = 13 // 使用默认类型
var b = int32(17) // 显式指定类型
var f = float32(3.14) // 显式指定类型
```
虽然这两种方式都是可以使用的但从声明一致性的角度出发Go更推荐我们使用后者这样能统一接受默认类型和显式指定类型这两种声明形式尤其是在将这些变量放在一个var块中声明时你会更明显地看到这一点。
所以我们更青睐下面这样的形式:
```plain
var (
a = 13
b = int32(17)
f = float32(3.14)
)
```
而不是下面这种看起来不一致的声明形式:
```plain
var (
a = 13
b int32 = 17
f float32 = 3.14
)
```
**第二类:声明但延迟初始化。**
对于声明时并不立即显式初始化的包级变量,我们可以使用下面这种通用变量声明形式:
```plain
var a int32
var f float64
```
我们知道虽然没有显式初始化Go语言也会让这些变量拥有初始的“零值”。如果是自定义的类型我也建议你尽量保证它的零值是可用的。
**这里还有一个注意事项,就是声明聚类与就近原则。**
正好Go语言提供了**变量声明块**用来把多个的变量声明放在一起并且在语法上也不会限制放置在var块中的声明类型那我们就应该学会充分利用var变量声明块让我们变量声明更规整更具可读性现在我们就来试试看。
通常我们会将同一类的变量声明放在一个var变量声明块中不同类的声明放在不同的var声明块中比如下面就是我从标准库net包中摘取的两段变量声明代码
```plain
// $GOROOT/src/net/net.go
var (
netGo bool
netCgo bool
)
var (
aLongTimeAgo = time.Unix(1, 0)
noDeadline = time.Time{}
noCancel = (chan struct{})(nil)
)
```
我们可以看到上面这两个var声明块各自声明了一类特定用途的包级变量。那我就要问了你还能从中看出什么包级变量声明的原则吗
其实我们可以将延迟初始化的变量声明放在一个var声明块(比如上面的第一个var声明块)然后将声明且显式初始化的变量放在另一个var块中比如上面的第二个var声明块这里我称这种方式为**“声明聚类”**,声明聚类可以提升代码可读性。
到这里,你可能还会有一个问题:我们是否应该将包级变量的声明全部集中放在源文件头部呢?答案不能一概而论。
使用静态编程语言的开发人员都知道,变量声明最佳实践中还有一条:**就近原则**。也就是说我们尽可能在靠近第一次使用变量的位置声明这个变量。就近原则实际上也是对变量的作用域最小化的一种实现手段。在Go标准库中我们也很容易找到符合就近原则的变量声明的例子比如下面这段标准库http包中的代码就是这样
```plain
// $GOROOT/src/net/http/request.go
var ErrNoCookie = errors.New("http: named cookie not present")
func (r *Request) Cookie(name string) (*Cookie, error) {
for _, c := range readCookies(r.Header, name) {
return c, nil
}
return nil, ErrNoCookie
}
```
在这个代码块里ErrNoCookie这个变量在整个包中仅仅被用在了Cookie方法中因此它被声明在紧邻Cookie方法定义的地方。当然了如果一个包级变量在包内部被多处使用那么这个变量还是放在源文件头部声明比较适合的。
接下来,我们再来看看另外一种变量:局部变量的声明形式。
## 局部变量的声明形式
有了包级变量做铺垫,我们再来讲解局部变量就容易很多了。和包级变量相比,局部变量又多了一种短变量声明形式,这是局部变量特有的一种变量声明形式,也是局部变量采用最多的一种声明形式。
这里我们也从“变量声明的时候是否延迟初始化”这个角度,对本地变量的声明形式进行分类说明。
**第一类:对于延迟初始化的局部变量声明,我们采用通用的变量声明形式**
其实,我们之前讲过的省略类型信息的声明和短变量声明这两种“语法糖”变量声明形式都不支持变量的延迟初始化,因此对于这类局部变量,和包级变量一样,我们只能采用通用的变量声明形式:
```plain
var err error
```
**第二类:对于声明且显式初始化的局部变量,建议使用短变量声明形式**
短变量声明形式是局部变量最常用的声明形式它遍布在Go标准库代码中。对于接受默认类型的变量我们使用下面这种形式
```plain
a := 17
f := 3.14
s := "hello, gopher!"
```
对于不接受默认类型的变量,我们依然可以使用短变量声明形式,只是在":="右侧要做一个显式转型,以保持声明的一致性:
```plain
a := int32(17)
f := float32(3.14)
s := []byte("hello, gopher!")
```
**这里我们还要注意:尽量在分支控制时使用短变量声明形式。**
分支控制应该是Go中短变量声明形式应用得最广泛的场景了。在编写Go代码时我们很少单独声明用于分支控制语句中的变量而是将它与if、for等控制语句通过短变量声明形式融合在一起即在控制语句中直接声明用于控制语句代码块中的变量。
你看一下下面这个我摘自Go标准库中的代码strings包的LastIndexAny方法为我们很好地诠释了如何将短变量声明形式与分支控制语句融合在一起使用
```plain
// $GOROOT/src/strings/strings.go
func LastIndexAny(s, chars string) int {
if chars == "" {
// Avoid scanning all of s.
return -1
}
if len(s) > 8 {
// 作者注在if条件控制语句中使用短变量声明形式声明了if代码块中要使用的变量as和isASCII
if as, isASCII := makeASCIISet(chars); isASCII {
for i := len(s) - 1; i >= 0; i-- {
if as.contains(s[i]) {
return i
}
}
return -1
}
}
for i := len(s); i > 0; {
// 作者注在for循环控制语句中使用短变量声明形式声明了for代码块中要使用的变量c
r, size := utf8.DecodeLastRuneInString(s[:i])
i -= size
for _, c := range chars {
if r == c {
return i
}
}
}
return -1
}
```
而且,短变量声明的这种融合的使用方式也体现出“就近”原则,让变量的作用域最小化。
另外,虽然良好的函数/方法设计都讲究“单一职责”,所以每个函数/方法规模都不大很少需要应用var块来聚类声明局部变量但是如果你在声明局部变量时遇到了适合聚类的应用场景你也应该毫不犹豫地使用var声明块来声明多于一个的局部变量具体写法你可以参考Go标准库net包中resolveAddrList方法
```plain
// $GOROOT/src/net/dial.go
func (r *Resolver) resolveAddrList(ctx context.Context, op, network,
addr string, hint Addr) (addrList, error) {
... ...
var (
tcp *TCPAddr
udp *UDPAddr
ip *IPAddr
wildcard bool
)
... ...
}
```
## 小结
好了,今天的课讲到这里就结束了,现在我们一起来回顾一下吧。
在这一讲中我们学习了多种Go变量声明的方法还学习了不同类型Go变量可以采用的变量声明形式和惯用法以及一些变量声明的最佳实践原则。
具体来说Go语言提供了一种通用变量声明形式以及两种变量声明“语法糖”形式而且Go包级变量和局部变量会根据具体情况选择不同的变量声明形式这里我们用一幅图来做个形象化的小结
![](https://static001.geekbang.org/resource/image/9c/77/9c663f2d88e2e53a8184669bf2338077.jpg?wh=1980x1080)
你可以看到,良好的变量声明实践需要我们考虑多方面因素,包括明确要声明的变量是包级变量还是局部变量、是否要延迟初始化、是否接受默认类型、是否是分支控制变量并结合聚类和就近原则等。
说起来Go语言崇尚“做一件事只用一种方法”但变量声明却似乎是一个例外。如果让Go语言的设计者重新来设计一次变量声明语法我觉得他们很大可能不会给予开发们这么大的变量声明灵活性。作为开发者我们要注意的是在统一项目范围内我们选择的变量声明的形式应该是一致的。
## 思考题
今天我们的思考题是与主流静态语言不同在Go语言变量声明中类型是放在变量名的后面的你认为这样做有什么好处欢迎在留言区给我留言。
感谢你和我一起学习也欢迎你把这节课分享给更多对Go语言的类型声明感兴趣的朋友。我是Tony Bai我们下节课见。