You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

115 lines
9.2 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 03 | 轮询与长连接:如何解决消息的实时到达问题?
你好,我是袁武林。
我在前面第一篇文章中从使用场景的需求方面讲到了IM系统的几个比较重要的特性。其中之一就是“消息到达的实时性”。
实时性场景是所有的IM系统绕不开的话题为了支持互联网的“实时互联”的概念大部分的App都需要实时技术的支持。
我们现在使用的聊天类App、直播互动类App都已经在实时性方面做得很好了消息收发延迟基本都能控制在毫秒级别。
当然这一方面得益于快速发展的移动网络让网络延迟越来越低、网络带宽越来越高另一个重要原因是社交网络App在实时性提升方面的技术也在不断升级迭代。
实时性主要解决的问题是:当一条消息发出后,我们的系统如何确保这条消息最快被接收人感知并获取到,并且尽量让耗费的资源较少。这里关键的几个点是:最快触达,且耗费资源少。
想好了吗下面我们来看一看IM在追求“消息实时性”的架构上所经历过的几个代表性阶段。
## 短轮询场景
在PC Web的早期时代对于数据的获取大部分应用采用一问一答的“请求响应”式模式实际上像现在我们浏览大部分门户网站的新闻以及刷微博其实都是采用的“请求响应”模式。
但这种依赖“手动”触发的模式,在即时消息系统中当有新消息产生时并不能很好地感知并获取到,所以明显不适用于对实时性要求高的场景。
因此这个时期的IM软件很多采用了一种“短轮询”的模式来定期、高频地轮询服务端的新消息。
在短轮询模式中,服务器接到请求后,如果有新消息就会将新消息返回给客户端,如果没有新消息就返回空列表,并关闭连接。
这种短轮询的方式就好像一位焦急等待重要信件的人,每天骑车跑到家门口的邮局去问是否有自己的信件,有就拿回家,没有第二天接着去邮局问。
![](https://static001.geekbang.org/resource/image/f0/db/f0de61adecb8925483517cb5df2aecdb.png)
作为从一问一答的请求响应模式孵化出来的短轮询模式,具有较低的迁移升级成本,比较容易落地。但劣势也很明显:
* 为了提升实时性,短轮询的频率一般较高,但大部分轮询请求实际上是无用的,客户端既费电也费流量;
* 高频请求对服务端资源的压力也较大一是大量服务器用于抗高频轮询的QPS每秒查询率二是对后端存储资源也有较大压力。
因此,“短轮询”这种方式,一般多用在用户规模比较小,且不愿花费太多服务改造成本的小型应用上。
## 长轮询场景
正是由于“短轮询”存在着高频无用功的问题为了避免这个问题IM逐步进化出“长轮询”的消息获取模式。
长轮询和短轮询相比一个最大的改进之处在于短轮询模式下服务端不管本轮有没有新消息产生都会马上响应并返回。而长轮询模式当本次请求没有获取到新消息时并不会马上结束返回而是会在服务端“悬挂hang等待一段时间如果在等待的这段时间内有新消息产生就能马上响应返回。
这种方式就像等待收信的人每天跑到邮局去问是否有自己的信件,如果没有,他不是马上回家,而是在邮局待上一天,如果还是没有就先回家,然后第二天再来。
![](https://static001.geekbang.org/resource/image/55/8b/55b526787ddc5761508df251c5f76d8b.png)
比较之下我们会发现长轮询能大幅降低短轮询模式中客户端高频无用的轮询导致的网络开销和功耗开销也降低了服务端处理请求的QPS相比短轮询模式而言显得更加先进。
长轮询的使用场景多见于: 对实时性要求比较高但是整体用户量不太大。它在不支持WebSocket的浏览器端的场景下还是有比较多的使用。
但是长轮询并没有完全解决服务端资源高负载的问题,仍然存在以下问题。
1. 服务端悬挂hang住请求只是降低了入口请求的QPS并没有减少对后端资源轮询的压力。假如有1000个请求在等待消息可能意味着有1000个线程在不断轮询消息存储资源。
2. 长轮询在超时时间内没有获取到消息时,会结束返回,因此仍然没有完全解决客户端“无效”请求的问题。
## 服务端推送:真正的边缘触发
短轮询和长轮询之所以没法做到基于事件的完全的“边缘触发当状态变化时发生一个IO事件这是因为服务端在有新消息产生时没有办法直接向客户端进行推送。
这里的根本原因在于短轮询和长轮询是基于HTTP协议实现的由于HTTP是一个无状态协议同一客户端的多次请求对于服务端来说并没有关系也不会去记录客户端相关的连接信息。
因此,所有的请求只能由客户端发起,服务端由于并不记录客户端状态,当服务端接收到新消息时,没法找到对应的客户端来进行推送。
随着HTML5的出现全双工的WebSocket彻底解决了服务端推送的问题。
![](https://static001.geekbang.org/resource/image/3c/6b/3c2eaba794372659e78bb9d678d16d6b.png)
这就像之前信件处理的逻辑,等待收信的用户不需要每天都跑到邮局去询问,而只要在邮局登记好自己家里的地址。等真正有信件时,邮局会派专门的邮递员按照登记的地址来把信送过去。
同样,当他需要写信给别人时,也只需要填好收件人地址,然后把信交给邮递员就可以了,不需要再自己跑邮局。
### WebSocket
WebSocket正是一种服务端推送的技术代表。
随着HTML5的出现基于单个TCP连接的全双工通信的协议WebSocket在2011年成为RFC标准协议逐渐代替了短轮询和长轮询的方式而且由于WebSocket协议获得了Web原生支持被广泛应用于IM服务中特别是在Web端基本属于IM的标配通信协议。
和短轮询、长轮询相比基于WebSocket实现的IM服务客户端和服务端只需要完成一次握手就可以创建持久的长连接并进行随时的双向数据传输。当服务端接收到新消息时可以通过建立的WebSocket连接直接进行推送真正做到“边缘触发”也保证了消息到达的实时性。
WebSocket的优点是
1. 支持服务端推送的双向通信,大幅降低服务端轮询压力;
2. 数据交互的控制开销低,降低双方通信的网络开销;
3. Web原生支持实现相对简单。
### TCP长连接衍生的IM协议
除了WebSocket协议在IM领域还有其他一些常用的基于TCP长连接衍生的通信协议如XMPP协议、MQTT协议以及各种私有协议。
这些基于TCP长连接的通信协议在用户上线连接时在服务端维护好连接到服务器的用户设备和具体TCP连接的映射关系通过这种方式客户端能够随时找到服务端服务端也能通过这个映射关系随时找到对应在线的用户的客户端。
而且这个长连接一旦建立,就一直存在,除非网络被中断。这样当有消息需要实时推送给某个用户时,就能简单地通过这个长连接实现“服务端实时推送”了。
但是上面提到的这些私有协议都各有优缺点XMPP协议虽然比较成熟、扩展性也不错但基于XML格式的协议传输上冗余比较多在流量方面不太友好而且整体实现上比较复杂在如今移动网络场景下用得并不多。
而轻量级的MQTT基于代理的“发布/订阅”模式在省流量和扩展性方面都比较突出在很多消息推送场景下被广泛使用但这个协议并不是IM领域的专有协议因此对于很多IM下的个性化业务场景仍然需要大量复杂的扩展和开发比如不支持群组功能、不支持离线消息。
因此对于开发人力相对充足的大厂目前很多是基于TCP或者UDP来实现自己的私有协议一方面私有协议能够贴合业务需要做到真正的高效和省流另一方面私有协议相对安全性更高一些被破解的可能性小。目前主流的大厂很多都是采用私有协议为主的方式来实现。
## 小结
这一篇我们介绍了即时消息服务中是如何解决“消息实时性”这个难题。
为了更好地解决实时性问题,即时消息领域经历过的几次技术的迭代升级:
* 从简单、低效的短轮询逐步升级到相对效率可控的长轮询;
* 随着HTML5的出现全双工的WebSocket彻底解决了服务端推送的问题
* 同时基于TCP长连接衍生的各种有状态的通信协议也能够实现服务端主动推送从而更好解决“消息收发实时性”的问题。
最后给你留一个思考题TCP长连接的方式是怎么实现“当有消息需要发送给某个用户时能够准确找到这个用户对应的网络连接”
你可以给我留言,我们一起讨论,感谢你的收听,我们下期再见。