gitbook/Go 语言项目开发实战/docs/411663.md

# 40 | 软件部署实战（上）：部署方案及负载均衡、高可用组件介绍

    你好，我是孔令飞。

接下来，我们就进入到这门课的最后一个模块，服务部署部分的学习。在这一模块中，我会带着你一步一步地部署一个生产级可用的IAM应用。

在 [03讲](https://time.geekbang.org/column/article/378082) 中，我们快速在单机上部署了IAM系统，但这样的系统缺少高可用、弹性扩容等能力，是很脆弱的，遇到流量波峰、发布变更很容易出问题。在系统真正上线前，我们需要重新调整部署架构，来保证我们的系统具有负载均衡、高可用、弹性伸缩等核心运维能力。

考虑到你手中的系统资源有限，这一模块会尽量简单地展示如何部署一个相对高可用的IAM系统。按照我讲的部署方法，基本上可以上线一个中小型的系统。

在这一模块中，我会介绍两种部署方式。

第一种是传统的部署方式，基于物理机/虚拟机来部署，容灾、弹性伸缩能力要部署人员自己实现。第二种是容器化部署方式，基于Docker、Kubernetes来部署，容灾、弹性伸缩等能力，可以借助Kubernetes自带的能力来实现。

接下来的三讲，我们先来看下传统的部署方式，也就是如何基于虚拟机来部署IAM应用。今天我主要讲跟IAM部署相关的两个组件，Nginx + Keepalived的相关功能。

## 部署方案

先来整体看下我们的部署方案。

这里，我采用Nginx + Keepalived来部署一个高可用的架构，同时将组件都部署在内网，来保证服务的安全和性能。

部署需要两台物理机/虚拟机，组件之间通过内网访问。所需的服务器如下表所示：

![图片](https://static001.geekbang.org/resource/image/e0/1d/e0a3323831768fbe7f45085ca4a53a1d.jpg?wh=1920x719)

两台服务器均为腾讯云CVM，VIP（Virtual IP，虚拟IP）为`10.0.4.99`。部署架构如下图所示：

![图片](https://static001.geekbang.org/resource/image/fc/9d/fc5331a780d45a7de6223d6ff3c86f9d.jpg?wh=1920x1197)

这里我来具体介绍下图中的部署架构。部署采用的这两台CVM服务器，一主一备，它们共享同一个VIP。同一时刻，VIP只在一台主设备上生效，当主服务器出现故障时，备用服务器会自动接管VIP，继续提供服务。

主服务器上部署了`iam-apiserver`、`iam-authz-server`、`iam-pump`和数据库`mongodb`、`redis`、`mysql`。备服务器部署了`iam-apiserver`、`iam-authz-server`和`iam-pump`。备服务器中的组件通过内网`10.0.4.20`访问主服务器中的数据库组件。

主备服务器同时安装了Keepalived和Nginx，通过Nginx的反向代理功能和负载均衡功能，实现后端服务`iam-apiserver`和`iam-authz-server`的高可用，通过Keepalived实现Nginx的高可用。

我们通过给虚拟IP绑定腾讯云弹性公网IP，从而使客户端可以通过外网IP访问内网的Nginx服务器（`443`端口），如果想通过域名访问内网，还可以申请域名指向该弹性公网IP。

通过以上部署方案，我们可以实现一个具有较高可用性的IAM系统，它主要具备下面这几个能力。

*   高性能：可以通过Nginx的负载均衡功能，水平扩容IAM服务，从而实现高性能。
*   具备容灾能力：通过Nginx实现IAM服务的高可用，通过Keepalived实现Nginx的高可用，从而实现核心组件的高可用。
*   具备水平扩容能力：通过Nginx的负载均衡功能，实现IAM服务的水平扩容。
*   高安全性：将所有组件部署在内网，客户端只能通过`VIP:443`端口访问Nginx服务，并且通过开启TLS认证和JWT认证，保障服务有一个比较高的安全性。因为是腾讯云CVM，所以也可以借助腾讯云的能力再次提高服务器的安全性，比如安全组、DDoS防护、主机安全防护、云监控、云防火墙等。

这里说明下，为了简化IAM应用的安装配置过程，方便你上手实操，有些能力，例如数据库高可用、进程监控和告警、自动伸缩等能力的构建方式，这里没有涉及到。这些能力的构建方式，你可以在日后的工作中慢慢学习和掌握。

接下来，我们看下这个部署方案中用到的两个核心组件，Nginx和Keepalived。我会介绍下它们的安装和配置方法，为你下一讲的学习做准备。

## Nginx安装和配置

### Nginx功能简介

这里先简单介绍下Nginx。Nginx是一个轻量级、高性能、开源的HTTP服务器和反向代理服务器。IAM系统使用了Nginx反向代理和负载均衡的功能，下面我就来分别介绍下。

为什么需要反向代理呢？在实际的生产环境中，服务部署的网络（内网）跟外部网络（外网）通常是不通的，这就需要一台既能够访问内网又能够访问外网的服务器来做中转，这种服务器就是反向代理服务器。Nginx作为反向代理服务器，简单的配置如下：

```plain
server {
    listen      80;
    server_name  iam.marmotedu.com;
    client_max_body_size 1024M;

    location / {
        proxy_set_header Host $http_host;
        proxy_set_header X-Forwarded-Host $http_host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_pass  http://127.0.0.1:8080/;
        client_max_body_size 100m;
    }
}

```

Nginx的反向代理功能，能够根据不同的配置规则转发到不同的后端服务器上。假如我们在IP为`x.x.x.x`的服务器上，用上面说的Nginx配置启动Nginx，当我们访问`http://x.x.x.x:80/`时，会将请求转发到`http://127.0.0.1:8080/`。`listen 80`指定了Nginx服务器的监听端口，`proxy_pass http://127.0.0.1:8080/`则指定了转发路径。

Nginx另一个常用的功能是七层负载均衡。所谓的负载均衡，就是指当Nginx收到一个HTTP请求后，会根据负载策略将请求转发到不同的后端服务器上。比如iam-apiserver部署在两台服务器A和B上，当请求到达Nginx后，Nginx会根据A和B服务器上的负载情况，将请求转发到负载较小的那台服务器上。

这里要求iam-apiserver是无状态的服务。Nginx有多种负载均衡策略，可以满足不同场景下的负载均衡需求。

### **Nginx安装步骤**

接下来，我就来介绍下如何安装和配置Nginx。

我们分别在`10.0.4.20`和`10.0.4.21`服务器上执行如下步骤，安装Nginx。

在CentOS 8.x系统上，我们可以使用yum命令来安装，具体安装过程可以分为下面4个步骤。

第一步，安装Nginx：

```bash
$ sudo yum -y install nginx

```

第二步，确认Nginx安装成功：

```bash
$ nginx -v
nginx version: nginx/1.14.1

```

第三步，启动Nginx，并设置开机启动：

```bash
$ sudo systemctl start nginx
$ sudo systemctl enable nginx

```

Nginx默认监听`80`端口，启动Nginx前要确保`80`端口没有被占用。当然，你也可以通过修改Nginx配置文件`/etc/nginx/nginx.conf`修改Nginx监听端口。

第四步，查看Nginx启动状态：

```bash
$ systemctl status nginx

```

输出中有`active (running)`字符串，说明成功启动。如果Nginx启动失败，你可以查看`/var/log/nginx/error.log`日志文件，定位错误原因。

## Keepalived安装和配置

Nginx自带负载均衡功能，并且当Nginx后端某个服务器故障后，Nginx会自动剔除该服务器，将请求转发到可用的服务器，通过这种方式实现后端API服务的高可用。但是 Nginx是单点的，如果Nginx挂了，后端的所有服务器就都不能访问，所以在实际生产环境中，也需要对Nginx做高可用。

业界最普遍采用的方法是通过Keepalived对前端Nginx实现高可用。Keepalived + Nginx的高可用方案具有服务功能强大、维护简单等特点。

接下来，我们来看下如何安装和配置Keepalived。

### Keepalived安装步骤

我们分别在`10.0.4.20`和`10.0.4.21`服务器上执行下面5个步骤，安装Keepalived。

第一步，下载Keepalived的最新版本（这门课安装了当前的最新版本 `2.1.5`）：

```bash
$ wget https://www.keepalived.org/software/keepalived-2.1.5.tar.gz

```

第二步，安装Keepalived：

```bash
$ sudo yum -y install openssl-devel # keepalived依赖OpenSSL，先安装依赖
$ tar -xvzf keepalived-2.1.5.tar.gz
$ cd keepalived-2.1.5
$ ./configure --prefix=/usr/local/keepalived
$ make
$ sudo make install

```

第三步，配置Keepalived：

```bash
$ sudo mkdir /etc/keepalived # 安装后，默认没有创建/etc/keepalived目录
$ sudo cp /usr/local/keepalived/etc/keepalived/keepalived.conf  /etc/keepalived/keepalived.conf
$ sudo cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/keepalived

```

Keepalived的systemd uint配置，默认使用了`/usr/local/keepalived/etc/sysconfig/keepalived`作为其`EnvironmentFile`，我们还需要把它修改为`/etc/sysconfig/keepalived`文件。编辑`/lib/systemd/system/keepalived.service`文件，设置`EnvironmentFile`，值如下：

```bash
EnvironmentFile=-/etc/sysconfig/keepalived

```

第四步，启动Keepalived，并设置开机启动：

```bash
$ sudo systemctl start keepalived
$ sudo systemctl enable keepalived

```

这里要注意，Keepalived启动时不会校验配置文件是否正确，所以我们要小心修改配置，防止出现意想不到的问题。

第五步，查看Keepalived的启动状态：

```bash
$ systemctl status keepalived

```

输出中有`active (running)`字符串，说明成功启动。Keepalived的日志保存在`/var/log/messages`中，你有需要的话可以查看。

### Keepalived配置文件解析

Keepalived的默认配置文件为`/etc/keepalived/keepalived.conf`，下面是一个Keepalived配置：

```plain
# 全局定义，定义全局的配置选项
global_defs {
# 指定keepalived在发生切换操作时发送email，发送给哪些email
# 建议在keepalived_notify.sh中发送邮件
  notification_email {
    acassen@firewall.loc
  }
  notification_email_from Alexandre.Cassen@firewall.loc # 发送email时邮件源地址
    smtp_server 192.168.200.1 # 发送email时smtp服务器地址
    smtp_connect_timeout 30 # 连接smtp的超时时间
    router_id VM-4-21-centos # 机器标识，通常可以设置为hostname
    vrrp_skip_check_adv_addr # 如果接收到的报文和上一个报文来自同一个路由器，则不执行检查。默认是跳过检查
    vrrp_garp_interval 0 # 单位秒，在一个网卡上每组gratuitous arp消息之间的延迟时间，默认为0
    vrrp_gna_interval 0 # 单位秒，在一个网卡上每组na消息之间的延迟时间，默认为0
}
# 检测脚本配置
vrrp_script checkhaproxy
{
  script "/etc/keepalived/check_nginx.sh" # 检测脚本路径
    interval 5 # 检测时间间隔（秒）
    weight 0 # 根据该权重改变priority，当值为0时，不改变实例的优先级
}
# VRRP实例配置
vrrp_instance VI_1 {
  state BACKUP  # 设置初始状态为'备份'
    interface eth0 # 设置绑定VIP的网卡，例如eth0
    virtual_router_id 51  # 配置集群VRID，互为主备的VRID需要是相同的值
    nopreempt               # 设置非抢占模式，只能设置在state为backup的节点上
    priority 50 # 设置优先级，值范围0～254，值越大优先级越高，最高的为master
    advert_int 1 # 组播信息发送时间间隔，两个节点必须设置一样，默认为1秒
# 验证信息，两个节点必须一致
    authentication {
      auth_type PASS # 认证方式，可以是PASS或AH两种认证方式
        auth_pass 1111 # 认证密码
    }
  unicast_src_ip 10.0.4.21  # 设置本机内网IP地址
    unicast_peer {
      10.0.4.20             # 对端设备的IP地址
    }
# VIP，当state为master时添加，当state为backup时删除
  virtual_ipaddress {
    10.0.4.99 # 设置高可用虚拟VIP，如果是腾讯云的CVM，需要填写控制台申请到的HAVIP地址。
  }
  notify_master "/etc/keepalived/keepalived_notify.sh MASTER" # 当切换到master状态时执行脚本
    notify_backup "/etc/keepalived/keepalived_notify.sh BACKUP" # 当切换到backup状态时执行脚本
    notify_fault "/etc/keepalived/keepalived_notify.sh FAULT" # 当切换到fault状态时执行脚本
    notify_stop "/etc/keepalived/keepalived_notify.sh STOP" # 当切换到stop状态时执行脚本
    garp_master_delay 1    # 设置当切为主状态后多久更新ARP缓存
    garp_master_refresh 5   # 设置主节点发送ARP报文的时间间隔
    # 跟踪接口，里面任意一块网卡出现问题，都会进入故障(FAULT)状态
    track_interface {
      eth0
    }
  # 要执行的检查脚本
  track_script {
    checkhaproxy
  }
}

```

这里解析下配置文件，大致分为下面4个部分。

*   global\_defs：全局定义，定义全局的配置选项。
*   vrrp\_script checkhaproxy：检测脚本配置。
*   vrrp\_instance VI\_1：VRRP实例配置。
*   virtual\_server：LVS配置。如果没有配置LVS+Keepalived，就不用设置这个选项。这门课中，我们使用Nginx代替LVS，所以无需配置`virtual_server`（配置示例中不再展示）。

只有在网络故障或者自身出问题时，Keepalived才会进行VIP切换。但实际生产环境中，我们往往使用Keepalived来监控其他进程，当业务进程出故障时切换VIP，从而保障业务进程的高可用。

为了让Keepalived感知到Nginx的运行状况，我们需要指定`vrrp_script`脚本，`vrrp_script`脚本可以根据退出码，判断Nginx进程是否正常，`0`正常，非`0`不正常。当不正常时，Keepalived会进行VIP切换。为了实现业务进程的监控，我们需要设置`vrrp_script`和`track_script`：

```plain
vrrp_script checkhaproxy
{
    script "/etc/keepalived/check_nginx.sh"
    interval 3
    weight -20
}

vrrp_instance test
{
    ...
    track_script
    {
        checkhaproxy
    }
    ...
}

```

这里，我介绍下上面配置中的一些配置项。

*   script：指定脚本路径。
*   interval：表示Keepalived执行脚本的时间间隔（秒）。
*   weight：检测权重，可以改变`priority`的值。例如，`-20`表示检测失败时，优先级`-20`，成功时不变。`20`表示检测成功时，优先级`+20`，失败时不变。

## 总结

今天我主要讲了跟IAM部署相关的两个组件，Nginx + Keepalived的相关功能。

我们可以基于物理机/虚拟机来部署IAM应用，在部署IAM应用时，需要确保整个应用具备高可用和弹性扩缩容能力。你可以通过Nginx的反向代理功能和负载均衡功能实现后端服务iam-apiserver和iam-authz-server的高可用，通过Keepalived实现Nginx的高可用，通过Nginx + Keepalived组合，来实现IAM应用的高可用和弹性伸缩能力。

## 课后练习

1.  Keepalived的主备服务器要接在同一个交换机上。思考下，如果交换机故障，如何实现整个系统的高可用？
2.  iam-pump是有状态的服务，思考下，如何实现iam-pump的高可用？

欢迎你在留言区与我交流讨论，我们下一讲见。