268 lines
15 KiB
Markdown
268 lines
15 KiB
Markdown
# 06 | auto/decltype:为什么要有自动类型推导?
|
||
|
||
你好,我是Chrono。
|
||
|
||
前两周我们从宏观的层面上重新认识了C++,从今天开始,我们将进入一个新的“语言特性”单元,“下沉”到微观的层面去观察C++,一起去见一些老朋友、新面孔,比如const、exception、lambda。
|
||
|
||
这次要说的,就是C++11里引入的一个很重要的语言特性:自动类型推导。
|
||
|
||
## 自动类型推导
|
||
|
||
如果你有过一些C++的编程经验,了解过C++11,那就一定听说过“**自动类型推导**”(auto type deduction)。
|
||
|
||
它其实是一个非常“老”的特性,C++之父Bjarne Stroustrup(B·S )早在C++诞生之初就设计并实现了它,但因为与早期C语言的语义有冲突,所以被“雪藏”了近三十年。直到C99消除了兼容性问题,C++11才让它再度登场亮相。
|
||
|
||
那为什么要重新引入这个“老特性”呢?为什么非要有“自动类型推导”呢?
|
||
|
||
我觉得,你可以先从字面上去理解,把这个词分解成三个部分:“自动”“类型”和“推导”。
|
||
|
||
* “自动”就是让计算机去做,而不是人去做,相对的是“手动”。
|
||
* “类型”指的是操作目标,出来的是编译阶段的类型,而不是数值。
|
||
* “推导”就是演算、运算,把隐含的值给算出来。
|
||
|
||
好,我们来看一看“自动类型推导”之外的其他几种排列组合,通过对比的方式来帮你理解它。
|
||
|
||
像计算“a = 1 + 1”,你可以在写代码的时候直接填上2,这就是“手动数值推导”。你也可以“偷懒”,只写上表达式,让电脑在运行时自己算,这就是“自动数值推导”。
|
||
|
||
“数值推导”对于人和计算机来说都不算什么难事,所以手动和自动的区别不大,只有快慢的差异。但“类型推导”就不同了。
|
||
|
||
因为C++是一种静态强类型的语言,任何变量都要有一个确定的类型,否则就不能用。在“自动类型推导”出现之前,我们写代码时只能“手动推导”,也就是说,在声明变量的时候,必须要明确地给出类型。
|
||
|
||
这在变量类型简单的时候还好说,比如int、double,但在泛型编程的时候,麻烦就来了。因为泛型编程里会有很多模板参数,有的类型还有内部子类型,一下子就把C++原本简洁的类型体系给搞复杂了,这就迫使我们去和编译器“斗智斗勇”,只有写对了类型,编译器才会“放行”(编译通过)。
|
||
|
||
```
|
||
int i = 0; // 整数变量,类型很容易知道
|
||
double x = 1.0; // 浮点数变量,类型很容易知道
|
||
|
||
std::string str = "hello"; // 字符串变量,有了名字空间,麻烦了一点
|
||
|
||
std::map<int, std::string> m = // 关联数组,名字空间加模板参数,很麻烦
|
||
{{1,"a"}, {2,"b"}}; // 使用初始化列表的形式
|
||
|
||
std::map<int, std::string>::const_iterator // 内部子类型,超级麻烦
|
||
iter = m.begin();
|
||
|
||
??? = bind1st(std::less<int>(), 2); // 根本写不出来
|
||
|
||
```
|
||
|
||
虽然你可以用typedef或者using来简化类型名,部分减轻打字的负担,但关键的“手动推导”问题还是没有得到解决,还是要去翻看类型定义,找到正确的声明。这时,C++的静态强类型的优势反而成为了劣势,阻碍了程序员的工作,降低了开发效率。
|
||
|
||
其实编译器是知道(而且也必须知道)这些类型的,但它却没有办法直接告诉你,这就很尴尬了。一边是急切地想知道答案,而另一边却只给判个对错,至于怎么错了、什么是正确答案,“打死了也不说”。
|
||
|
||
但有了“自动类型推导”,问题就迎刃而解了。这就像是在编译器紧闭的大门上开了道小口子,你跟它说一声,它就递过来张小纸条,具体是什么不重要,重要的是里面存了我们想要的类型。
|
||
|
||
这个“小口子”就是关键字**auto**,在代码里的作用像是个“占位符”(placeholder)。写上它,你就可以让编译器去自动“填上”正确的类型,既省力又省心。
|
||
|
||
```
|
||
auto i = 0; // 自动推导为int类型
|
||
auto x = 1.0; // 自动推导为double类型
|
||
|
||
auto str = "hello"; // 自动推导为const char [6]类型
|
||
|
||
std::map<int, std::string> m = {{1,"a"}, {2,"b"}}; // 自动推导不出来
|
||
|
||
auto iter = m.begin(); // 自动推导为map内部的迭代器类型
|
||
|
||
auto f = bind1st(std::less<int>(), 2); // 自动推导出类型,具体是啥不知道
|
||
|
||
```
|
||
|
||
不过需要注意的是,因为C++太复杂,“自动类型推导”有时候可能失效,给不出你想要的结果。比如,在上面的这段代码里,就把字符串的类型推导成了“const char \[6\]”而不是“std::string”。而有的时候,编译器也理解不了代码的意思,推导不出恰当的类型,还得你自己“亲力亲为”。
|
||
|
||
在这个示例里,你还可以直观感觉到auto让代码干净整齐了很多,不用去写那些复杂的模板参数了。但如果你把“自动类型推导”理解为仅仅是简化代码、少打几个字,那就实在是浪费了C++标准委员会的一番苦心。
|
||
|
||
**除了简化代码,auto还避免了对类型的“硬编码”**,也就是说变量类型不是“写死”的,而是能够“自动”适应表达式的类型。比如,你把map改为unordered\_map,那么后面的代码都不用动。这个效果和类型别名([第5讲](https://time.geekbang.org/column/article/235301))有点像,但你不需要写出typedef或者using,全由auto“代劳”。
|
||
|
||
另外,你还应该认识到,“自动类型推导”实际上和“attribute”一样([第4讲](https://time.geekbang.org/column/article/235295)),是编译阶段的特殊指令,指示编译器去计算类型。所以,它在泛型编程和模板元编程里还有更多的用处,后面我会陆续讲到。
|
||
|
||
## 认识auto
|
||
|
||
刚才说了,auto有时候会不如你设想的那样工作,因此在使用的时候,有一些需要特别注意的地方,下面我就给你捋一捋。
|
||
|
||
首先,你要知道,auto的“自动推导”能力只能用在“**初始化**”的场合。
|
||
|
||
具体来说,就是**赋值初始化**或者**花括号初始化**(初始化列表、Initializer list),变量右边必须要有一个表达式(简单、复杂都可以)。这样你才能在左边放上auto,编译器才能找到表达式,帮你自动计算类型。
|
||
|
||
如果不是初始化的形式,只是“纯”变量声明,那就无法使用auto。因为这个时候没有表达式可以让auto去推导。
|
||
|
||
```
|
||
auto x = 0L; // 自动推导为long
|
||
auto y = &x; // 自动推导为long*
|
||
auto z {&x}; // 自动推导为long*
|
||
|
||
auto err; // 错误,没有赋值表达式,不知道是什么类型
|
||
|
||
```
|
||
|
||
这里还有一个特殊情况,在类成员变量初始化的时候([第5讲](https://time.geekbang.org/column/article/235301)),目前的C++标准不允许使用auto推导类型(但我个人觉得其实没有必要,也许以后会放开吧)。所以,在类里你还是要老老实实地去“手动推导类型”。
|
||
|
||
```
|
||
class X final
|
||
{
|
||
auto a = 10; // 错误,类里不能使用auto推导类型
|
||
};
|
||
|
||
```
|
||
|
||
知道了应用场合,你还需要了解auto的推导规则,保证它能够按照你的意思去工作。虽然标准里规定得很复杂、很细致,但我总结出了两条简单的规则,基本上够用了:
|
||
|
||
* **auto总是推导出“值类型”,绝不会是“引用”;**
|
||
* **auto可以附加上const、volatile、\*、&这样的类型修饰符,得到新的类型。**
|
||
|
||
下面我举几个例子,你一看就能明白:
|
||
|
||
```
|
||
auto x = 10L; // auto推导为long,x是long
|
||
|
||
auto& x1 = x; // auto推导为long,x1是long&
|
||
auto* x2 = &x; // auto推导为long,x2是long*
|
||
const auto& x3 = x; // auto推导为long,x3是const long&
|
||
auto x4 = &x3; // auto推导为const long*,x4是const long*
|
||
|
||
```
|
||
|
||
## 认识decltype
|
||
|
||
前面我都在说auto,其实,C++的“自动类型推导”还有另外一个关键字:**decltype**。
|
||
|
||
刚才你也看到了,auto只能用于“初始化”,而这种“**向编译器索取类型**”的能力非常有价值,把它限制在这么小的场合,实在是有点“屈才”了。
|
||
|
||
“自动类型推导”要求必须从表达式推导,那在没有表达式的时候,该怎么办呢?
|
||
|
||
其实解决思路也很简单,就是“自己动手,丰衣足食”,自己带上表达式,这样就走到哪里都不怕了。
|
||
|
||
decltype的形式很像函数,后面的圆括号里就是可用于计算类型的表达式(和sizeof有点类似),其他方面就和auto一样了,也能加上const、\*、&来修饰。
|
||
|
||
但因为它已经自带表达式,所以不需要变量后面再有表达式,也就是说可以直接声明变量。
|
||
|
||
```
|
||
int x = 0; // 整型变量
|
||
|
||
decltype(x) x1; // 推导为int,x1是int
|
||
decltype(x)& x2 = x; // 推导为int,x2是int&,引用必须赋值
|
||
decltype(x)* x3; // 推导为int,x3是int*
|
||
decltype(&x) x4; // 推导为int*,x4是int*
|
||
decltype(&x)* x5; // 推导为int*,x5是int**
|
||
decltype(x2) x6 = x2; // 推导为int&,x6是int&,引用必须赋值
|
||
|
||
```
|
||
|
||
把decltype和auto比较一下,简单来看,好像就是把表达式改到了左边而已,但实际上,在推导规则上,它们有一点细微且重要的区别:
|
||
|
||
**decltype不仅能够推导出值类型,还能够推导出引用类型,也就是表达式的“原始类型”**。
|
||
|
||
在示例代码中,我们可以看到,除了加上\*和&修饰,decltype还可以直接从一个引用类型的变量推导出引用类型,而auto就会把引用去掉,推导出值类型。
|
||
|
||
所以,你完全可以把decltype看成是一个真正的类型名,用在变量声明、函数参数/返回值、模板参数等任何类型能出现的地方,只不过这个类型是在编译阶段通过表达式“计算”得到的。
|
||
|
||
如果不信的话,你可以用using类型别名来试一试。
|
||
|
||
```
|
||
using int_ptr = decltype(&x); // int *
|
||
using int_ref = decltype(x)&; // int &
|
||
|
||
```
|
||
|
||
既然decltype类型推导更精确,那是不是可以替代auto了呢?
|
||
|
||
实际上,它也有个缺点,就是写起来略麻烦,特别在用于初始化的时候,表达式要重复两次(左边的类型计算,右边的初始化),把简化代码的优势完全给抵消了。
|
||
|
||
所以,C++14就又增加了一个“**decltype(auto)**”的形式,既可以精确推导类型,又能像auto一样方便使用。
|
||
|
||
```
|
||
int x = 0; // 整型变量
|
||
|
||
decltype(auto) x1 = (x); // 推导为int&,因为(expr)是引用类型
|
||
decltype(auto) x2 = &x; // 推导为int*
|
||
decltype(auto) x3 = x1; // 推导为int&
|
||
|
||
```
|
||
|
||
## 使用auto/decltype
|
||
|
||
现在,我已经讲完了“自动类型推导”的两个关键字:auto和decltype,那么,该怎么用好它们呢?
|
||
|
||
我觉得,因为auto写法简单,推导规则也比较好理解,所以,**在变量声明时应该尽量多用auto**。前面已经举了不少例子,这里就不再重复了。
|
||
|
||
auto还有一个“最佳实践”,就是“**range-based for**”,不需要关心容器元素类型、迭代器返回值和首末位置,就能非常轻松地完成遍历操作。不过,为了保证效率,最好使用“const auto&”或者“auto&”。
|
||
|
||
```
|
||
vector<int> v = {2,3,5,7,11}; // vector顺序容器
|
||
|
||
for(const auto& i : v) { // 常引用方式访问元素,避免拷贝代价
|
||
cout << i << ","; // 常引用不会改变元素的值
|
||
}
|
||
|
||
for(auto& i : v) { // 引用方式访问元素
|
||
i++; // 可以改变元素的值
|
||
cout << i << ",";
|
||
}
|
||
|
||
```
|
||
|
||
在C++14里,auto还新增了一个应用场合,就是能够推导函数返回值,这样在写复杂函数的时候,比如返回一个pair、容器或者迭代器,就会很省事。
|
||
|
||
```
|
||
auto get_a_set() // auto作为函数返回值的占位符
|
||
{
|
||
std::set<int> s = {1,2,3};
|
||
return s;
|
||
}
|
||
|
||
```
|
||
|
||
再来看decltype怎么用最合适。
|
||
|
||
它是auto的高级形式,更侧重于编译阶段的类型计算,所以常用在泛型编程里,获取各种类型,配合typedef或者using会更加方便。当你感觉“这里我需要一个特殊类型”的时候,选它就对了。
|
||
|
||
比如说,定义函数指针在C++里一直是个比较头疼的问题,因为传统的写法实在是太怪异了。但现在就简单了,你只要手里有一个函数,就可以用decltype很容易得到指针类型。
|
||
|
||
```
|
||
// UNIX信号函数的原型,看着就让人晕,你能手写出函数指针吗?
|
||
void (*signal(int signo, void (*func)(int)))(int)
|
||
|
||
// 使用decltype可以轻松得到函数指针类型
|
||
using sig_func_ptr_t = decltype(&signal) ;
|
||
|
||
```
|
||
|
||
在定义类的时候,因为auto被禁用了,所以这也是decltype可以“显身手”的地方。它可以搭配别名任意定义类型,再应用到成员变量、成员函数上,变通地实现auto的功能。
|
||
|
||
```
|
||
class DemoClass final
|
||
{
|
||
public:
|
||
using set_type = std::set<int>; // 集合类型别名
|
||
private:
|
||
set_type m_set; // 使用别名定义成员变量
|
||
|
||
// 使用decltype计算表达式的类型,定义别名
|
||
using iter_type = decltype(m_set.begin());
|
||
|
||
iter_type m_pos; // 类型别名定义成员变量
|
||
};
|
||
|
||
```
|
||
|
||
## 小结
|
||
|
||
好了,今天我介绍了C++里的“自动类型推导”,简单小结一下今天的内容。
|
||
|
||
1. “自动类型推导”是给编译器下的指令,让编译器去计算表达式的类型,然后返回给程序员。
|
||
2. auto用于初始化时的类型推导,总是“值类型”,也可以加上修饰符产生新类型。它的规则比较好理解,用法也简单,应该积极使用。
|
||
3. decltype使用类似函数调用的形式计算表达式的类型,能够用在任意场合,因为它就是一个编译阶段的类型。
|
||
4. decltype能够推导出表达式的精确类型,但写起来比较麻烦,在初始化时可以采用decltype(auto)的简化形式。
|
||
5. 因为auto和decltype不是“硬编码”的类型,所以用好它们可以让代码更清晰,减少后期维护的成本。
|
||
|
||
## 课下作业
|
||
|
||
最后是课下作业时间,给你留两个思考题:
|
||
|
||
1. auto和decltype虽然很方便,但用多了也确实会“隐藏”真正的类型,增加阅读时的理解难度,你觉得这算是缺点吗?是否有办法克服或者缓解?
|
||
2. 说一下你对auto和decltype的认识。你认为,两者有哪些区别呢?(推导规则、应用场合等)
|
||
|
||
欢迎你在留言区写下你的思考和答案,如果觉得今天的内容对你有所帮助,也欢迎分享给你的朋友,我们下节课见。
|
||
|
||
![](https://static001.geekbang.org/resource/image/6e/14/6ec0c53ee9917795c0e2a494cfe70014.png)
|
||
|