You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

357 lines
16 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 21 | 知识串讲(上):带你开发一个书店应用
你好我是Chrono。
到今天为止课程里的C++知识就全部讲完了。前面我们总共学习了四大模块,我再带你做一个简略的回顾。
在“概论”单元我带你从宏观的层面上重新认识了C++讲了它的四个生命周期和五个编程范式分别介绍了在编码阶段、预处理阶段、编译阶段C++能够做哪些事情接着又重点说了在C++里,运用哪些特性才能更好地实践面向对象编程。
在“语言特性”单元我们一起研究了自动类型推导、常量、智能指针、异常、函数式编程这五个特性。这些特性是“现代”C++区别于“传统”C++的关键,掌握了它们,你就能够写出清晰、易读、安全的代码。
在“标准库”单元我介绍了字符串、容器、算法和并发。它们是C++标准库中最核心的部分也是现代C++和泛型编程的最佳应用和范例。学会了标准库你才能说是真正理解了C++。
在“技能进阶”单元我为你挑选出了一些第三方工具包括序列化、网络通信、脚本语言和性能分析它们很好地补充完善了C++语言和标准库,免去了我们“自己造轮子”的麻烦,让我们把精力集中在实现业务逻辑上。
除了上面的这“十八般武艺”我还谈了谈能够帮你更好地运用C++的设计模式和设计原则,介绍了几个比较重要、常用的模式,希望你在今后的实际开发工作中,能够有意识地写出灵活、可扩展的代码。
这么回顾下来,内容还真是不少啊。
为了让你更好地把这些知识融会贯通接下来我会再用两节课的时间从需求、设计到开发编码、编译运行再加上一些我自己的实用小技巧详细讲解一个C++程序的实际开发过程,把知识点都串联起来。
虽然说是“串讲”,但是你只要学过了前面的内容,就可以跟着我做出这个书店程序。不过,我担心有些知识点你可能忘记了,所以,涉及到具体的知识点时,我会给你标注出是在哪一节,你可以随时回去复习一下。
## 项目设计
那么该用个什么样的例子来串讲C++的这些知识点呢?
说实话找出一个合适的例子真的很难。因为大多数C++实际项目都很大、很底层,还有各种依赖或者内部库,不好直接学习研究。
所以我再三考虑,决定借鉴一下 _C++ Primer_ 里的书店例子,修改一下它的需求,然后完全重新开发,作为我们这个课程的综合示例。
先介绍一下咱们这个书店程序。简单来说,就是销售记录管理,从多个渠道把书号、销售册数、销售额都汇总起来,做个统计分析,再把数据定期上报到后台。
_C++ Primer_ 里的书店程序是本地运行的为了演示课程里讲到的的C++特性,我把它改成了网络版。不过,拓扑结构并不复杂,我画了张图,你可以看一下。
![](https://static001.geekbang.org/resource/image/62/97/62632ba7426af7731902c83724504097.png)
项目的前期需求就算是定下来了,接着就要开始做设计了,这就要用到设计模式和设计原则的知识了([第19讲](https://time.geekbang.org/column/article/248880)、[第20讲](https://time.geekbang.org/column/article/248883))。
不过这个系统还是比较简单的不需要用什么复杂的分析手段就能够得出设计主要应用的是单一职责原则、接口隔离原则和包装外观模式。这里我也画了一个UML图可以帮助你理解程序的架构。
![](https://static001.geekbang.org/resource/image/f0/ef/f08637cf6b49316c230d058cb2a9f5ef.jpg)
下面我就对照这个UML类图结合开发思路和源码仔细说一下具体的C++开发,完整的源码都放在了[GitHub](https://github.com/chronolaw/cpp_study/tree/master/section5)上,课下可以仔细地看一下。
## 核心头文件
首先要说的是我写C++项目的一个习惯,定义核心头文件:**cpplang.hpp**。它集中了C++标准头和语言相关的定义,被用于其他所有的源文件。
注意,在写它的时候,最好要有文件头注释([第2讲](https://time.geekbang.org/column/article/233689)而且要有“Include guard”[第3讲](https://time.geekbang.org/column/article/233711)),就像下面这样:
```
// Copyright (c) 2020 by Chrono
#ifndef _CPP_LANG_HPP // Include guard
#define _CPP_LANG_HPP // Include guard
#include <cassert> // C++标准头文件
...
#endif //_CPP_LANG_HPP
```
在核心头文件里,我们还可以利用预处理编程,使用宏定义、条件编译来屏蔽操作系统、语言版本的差异,增强程序的兼容性。
比如这里我就检查了C++的版本号然后定义了简化版的“deprecated”和“static\_assert”
```
// must be C++11 or later
#if __cplusplus < 201103
# error "C++ is too old"
#endif // __cplusplus < 201103
// [[deprecated]]
#if __cplusplus >= 201402
# define CPP_DEPRECATED [[deprecated]]
#else
# define CPP_DEPRECATED [[gnu::deprecated]]
#endif // __cplusplus >= 201402
// static_assert
#if __cpp_static_assert >= 201411
# define STATIC_ASSERT(x) static_assert(x)
#else
# define STATIC_ASSERT(x) static_assert(x, #x)
#endif
```
## 自旋锁
有了核心头文件之后我们的C++程序就有了一个很好的起点,就可以考虑引入多线程,提高吞吐量,减少阻塞。
在多线程里保护数据一般要用到互斥量Mutex但它的代价太高所以我设计了一个自旋锁它使用了原子变量所以成本低效率高[第14讲](https://time.geekbang.org/column/article/245259))。
自旋锁被封装为一个SpinLock类所以就要遵循一些C++里常用的面向对象的设计准则([第5讲](https://time.geekbang.org/column/article/235301)、[第19讲](https://time.geekbang.org/column/article/248880)比如用final禁止继承、用default/delete显式标记构造/析构函数、成员变量初始化、类型别名,等等,你可以看看代码:
```
class SpinLock final // 自旋锁类
{
public:
using this_type = SpinLock; // 类型别名
using atomic_type = std::atomic_flag;
public:
SpinLock() = default; // 默认构造函数
~SpinLock() = default;
SpinLock(const this_type&) = delete; // 禁止拷贝
SpinLock& operator=(const this_type&) = delete;
private:
atomic_type m_lock {false}; // 成员变量初始化
};
```
在编写成员函数的时候为了尽量高效需要给函数都加上noexcept修饰表示绝不会抛出异常[第9讲](https://time.geekbang.org/column/article/240292)
```
public:
void lock() noexcept // 自旋锁定,绝不抛出异常
{
for(;;) { // 无限循环
if (!m_lock.test_and_set()) { // 原子变量的TAS操作
return; // TAS成功则锁定
}
std::this_thread::yield(); // TAS失败则让出线程
}
}
void unlock() noexcept // 解除自旋锁定,绝不抛出异常
{
m_lock.clear();
}
```
为了保证异常安全在任何时候都不会死锁还需要利用RAII技术再编写一个LockGuard类。它在构造时锁定在析构时解锁这两个函数也应该用noexcept来优化
```
class SpinLockGuard final // 自旋锁RAII类自动解锁
{
public:
using this_type = SpinLockGuard; // 类型别名
using spin_lock_type = SpinLock;
public:
SpinLockGuard(const this_type&) = delete; // 禁止拷贝
SpinLockGuard& operator=(const this_type&) = delete;
public:
SpinLockGuard(spin_lock_type& lock) noexcept
: m_lock(lock)
{
m_lock.lock();
}
~SpinLockGuard() noexcept
{
m_lock.unlock();
}
private:
spin_lock_type& m_lock;
};
```
这样自旋锁就完成了,有了它就可以在多线程应用里保护共享的数据,避免数据竞争。
## 网络通信
自旋锁比较简单,但多线程只是书店程序的基本特性,它的核心关键词是“网络”,所以下面就来看看服务里的“重头”部分:网络通信。
正如我之前说的在现代C++里应当避免直接使用原生Socket来编写网络通信程序[第16讲](https://time.geekbang.org/column/article/245900)。这里我选择ZMQ作为底层通信库它不仅方便易用而且能够保证消息不丢失、完整可靠地送达目的地。
程序里使用ZmqContext类来封装底层接口包装外观它是一个模板类整数模板参数用来指定线程数在编译阶段就固定了ZMQ的多线程处理能力。
对于ZMQ必需的运行环境变量单件我使用了一个小技巧**以静态成员函数来代替静态成员变量**。这样就绕过了C++的语言限制,不必在实现文件“\*.cpp”里再写一遍变量定义全部的代码都可以集中在hpp头文件里
```
template<int thread_num = 1> // 使用整数模板参数来指定线程数
class ZmqContext final
{
public:
static // 静态成员函数代替静态成员变量
zmq_context_type& context()
{
static zmq_context_type ctx(thread_num);
return ctx;
}
};
```
然后我们要实现两个静态工厂函数创建收发数据的Socket对象。
这里要注意如果你看zmq.hpp的源码就会发现它的内部实际上是使用了异常来处理错误的。所以这里我们不能在函数后面加上noexcept修饰同时也就意味着在使用ZMQ的时候必须要考虑异常处理。
```
public:
static
zmq_socket_type recv_sock(int hwm = 1000) // 创建接收Socket
{
zmq_socket_type sock(context(), ZMQ_PULL); // 可能抛出异常
sock.setsockopt(ZMQ_RCVHWM, hwm);
return sock;
}
static
zmq_socket_type send_sock(int hwm = 1000) // 创建发送Socket
{
zmq_socket_type sock(context(), ZMQ_PUSH); // 可能抛出异常
sock.setsockopt(ZMQ_SNDHWM, hwm);
return sock;
}
```
现在有了ZmqContext类书店程序的网络基础也就搭建出来了后面就可以用它来收发数据了。
## 配置文件解析
接下来我要说的是解析配置文件的类Config。
大多数程序都会用到配置文件来保存运行时的各种参数常见的格式有INI、XML、JSON等等。但我通常会选择把Lua嵌入C++用Lua脚本写配置文件[第17讲](https://time.geekbang.org/column/article/242603))。
这么做的好处在哪里呢?
Lua是一个完备的编程语言所以写起来就非常自由灵活比如添加任意的注释数字可以写成“m × n”的运算形式。而INI、XML这些配置格式只是纯粹的数据很难做到这样很多时候需要在程序里做一些转换工作。
另外在Lua脚本里我们还能基于Lua环境写一些函数校验数据的有效性或者采集系统信息实现动态配置。
总而言之就是把Lua当作一个“可编程的配置语言”让配置“活起来”。
给你看一下配置文件的代码吧,里面包含了几个简单的值,配置了服务器的地址、时间间隔、缓冲区大小等信息:
```
config = {
-- should be same as client
-- you could change it to ipc
zmq_ipc_addr = "tcp://127.0.0.1:5555",
-- see http_study's lua code
http_addr = "http://localhost/cpp_study?token=cpp@2020",
time_interval = 5, -- seconds
max_buf_size = 4 * 1024,
}
```
Config类使用shared\_ptr来管理Lua虚拟机[第17讲](https://time.geekbang.org/column/article/245905)),因为封装在类里,所以,你要注意类型别名和成员变量初始化的用法([第5讲](https://time.geekbang.org/column/article/235301)
```
class Config final // 封装读取Lua配置文件
{
public:
using vm_type = std::shared_ptr<lua_State>; // 类型别名
using value_type = luabridge::LuaRef;
public:
Config() noexcept // 构造函数
{
assert(m_vm);
luaL_openlibs(m_vm.get()); // 打开Lua基本库
}
~Config() = default; // 默认析构函数
private:
vm_type m_vm // 类型别名定义Lua虚拟机
{luaL_newstate(), lua_close}; // 成员变量初始化
};
```
加载Lua脚本的时候还要注意一点外部的脚本有可能会写错导致Lua解析失败。但因为这个问题极少出现而且一出现就很严重没有配置就无法走后续的流程所以非常适合用异常来处理[第9讲](https://time.geekbang.org/column/article/240292))。
load()函数不会改变虚拟机成员变量所以应该用const修饰是一个常函数
```
public:
void load(string_view_type filename) const // 解析配置文件
{
auto status = luaL_dofile(m_vm.get(), filename.c_str());
if (status != 0) { // 出错就抛出异常
throw std::runtime_error("failed to parse config");
}
}
```
为了访问Lua配置文件里的值我决定采用“key1.key2”这样简单的两级形式有点像INI的小节这也正好对应Lua里的表结构。
想要解析出字符串里的前后两个key可以使用正则表达式[第11讲](https://time.geekbang.org/column/article/242603)然后再去查询Lua表。
因为构造正则表达式的成本很高,所以我把正则对象都定义为成员变量,而不是函数里的局部变量。
正则的匹配结果m\_what是“临时”的不会影响常量性所以要给它加上mutable修饰。
```
private:
const regex_type m_reg {R"(^(\w+)\.(\w+)$)"};
mutable match_type m_what; // 注意是mutable
```
在C++正则库的帮助下处理字符串就太轻松了拿到两个key再调用LuaBridge就可以获得Lua脚本里的配置项。
不过为了进一步简化客户代码我把get()函数改成了模板函数显式转换成int、string等C++标准类型,可读性、可维护性会更好。
```
public:
template<typename T> // 转换配置值的类型
T get(string_view_type key) const // const常函数
{
if (!std::regex_match(key, m_what, m_reg)) { // 正则匹配
throw std::runtime_error("config key error");// 格式错误抛异常
}
auto w1 = m_what[1].str(); // 取出两个key
auto w2 = m_what[2].str();
auto v = getGlobal( // 获取Lua表
m_vm.get(), w1.c_str());
return LuaRef_cast<T>(v[w2]); // 取表里的值,再做类型转换
}
```
到这里呢Config类也就完成了可以轻松解析Lua格式的配置文件。
## 小结
今天我用一个书店程序作为例子把前面的知识点都串联起来应用到了这个“半真实”的项目里完成了UML类图里的外围部分。你也可以把刚才说的核心头文件、自旋锁、Lua配置文件这些用法放到自己的实际项目里去试试。
简单小结一下今天的内容:
1. 在项目起始阶段,应该认真做需求分析,然后应用设计模式和设计原则,得出灵活、可扩展的面向对象系统;
2. C++项目里最好要有一个核心头文件cpplang.hpp集中定义所有标准头和语言特性规范源文件里的C++使用方式;
3. 使用原子变量atomic可以实现自旋锁比互斥量的成本要低更高效
4. 使用ZMQ可以简化网络通信但要注意它使用了异常来处理错误
5. 使用Lua脚本作为配置文件的好处很多是“可编程的配置文件”
6. 在编写代码时要理解、用好C++特性恰当地使用final、default、const等关键字让代码更安全、更可读有利于将来的维护。
今天我们分析了需求设计出了架构开发了一些工具类但还没有涉及业务逻辑代码下节课我会带你看看容器、算法、线程还有lambda表达式的实践应用看看它们是怎么服务于具体业务的。
## 课下作业
最后是课下作业时间,给你留一个思考题:你能说出,程序里是怎么应用设计模式和设计原则的吗?
欢迎你在留言区写下你的思考和答案,如果觉得今天的内容对你有所帮助,也欢迎分享给你的朋友。我们下节课见。
![](https://static001.geekbang.org/resource/image/9b/e9/9b2d2c8285643a9202d822639fffe8e9.png)