gitbook/透视HTTP协议/docs/115564.md
2022-09-03 22:05:03 +08:00

139 lines
10 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 32 | 未来之路HTTP/3展望
在前面的两讲里我们一起学习了HTTP/2你也应该看到了HTTP/2做出的许多努力比如头部压缩、二进制分帧、虚拟的“流”与多路复用性能方面比HTTP/1有了很大的提升“基本上”解决了“队头阻塞”这个“老大难”问题。
## HTTP/2的“队头阻塞”
等等,你可能要发出疑问了:为什么说是“基本上”,而不是“完全”解决了呢?
这是因为HTTP/2虽然使用“帧”“流”“多路复用”没有了“队头阻塞”但这些手段都是在应用层里而在下层也就是TCP协议里还是会发生“队头阻塞”。
这是怎么回事呢?
让我们从协议栈的角度来仔细看一下。在HTTP/2把多个“请求-响应”分解成流交给TCP后TCP会再拆成更小的包依次发送其实在TCP里应该叫segment也就是“段”
在网络良好的情况下包可以很快送达目的地。但如果网络质量比较差像手机上网的时候就有可能会丢包。而TCP为了保证可靠传输有个特别的“丢包重传”机制丢失的包必须要等待重新传输确认其他的包即使已经收到了也只能放在缓冲区里上层的应用拿不出来只能“干着急”。
我举个简单的例子:
客户端用TCP发送了三个包但服务器所在的操作系统只收到了后两个包第一个包丢了。那么内核里的TCP协议栈就只能把已经收到的包暂存起来“停下”等着客户端重传那个丢失的包这样就又出现了“队头阻塞”。
由于这种“队头阻塞”是TCP协议固有的所以HTTP/2即使设计出再多的“花样”也无法解决。
Google在推SPDY的时候就已经意识到了这个问题于是就又发明了一个新的“QUIC”协议让HTTP跑在QUIC上而不是TCP上。
而这个“HTTP over QUIC”就是HTTP协议的下一个大版本**HTTP/3**。它在HTTP/2的基础上又实现了质的飞跃真正“完美”地解决了“队头阻塞”问题。
不过HTTP/3目前还处于草案阶段正式发布前可能会有变动所以今天我尽量不谈那些不稳定的细节。
这里先贴一下HTTP/3的协议栈图让你对它有个大概的了解。
![](https://static001.geekbang.org/resource/image/d2/03/d263202e431c84db0fd6c7e6b1980f03.png)
## QUIC协议
从这张图里你可以看到HTTP/3有一个关键的改变那就是它把下层的TCP“抽掉”了换成了UDP。因为UDP是无序的包之间没有依赖关系所以就从根本上解决了“队头阻塞”。
你一定知道UDP是一个简单、不可靠的传输协议只是对IP协议的一层很薄的包装和TCP相比它实际应用的较少。
不过正是因为它简单,不需要建连和断连,通信成本低,也就非常灵活、高效,“可塑性”很强。
所以QUIC就选定了UDP在它之上把TCP的那一套连接管理、拥塞窗口、流量控制等“搬”了过来“去其糟粕取其精华”打造出了一个全新的可靠传输协议可以认为是“**新时代的TCP**”。
![unpreview](https://static001.geekbang.org/resource/image/fd/7a/fd99221ede55272a998760cc6aaa037a.png)
QUIC最早是由Google发明的被称为gQUIC。而当前正在由IETF标准化的QUIC被称为iQUIC。两者的差异非常大甚至比当年的SPDY与HTTP/2的差异还要大。
gQUIC混合了UDP、TLS、HTTP是一个应用层的协议。而IETF则对gQUIC做了“清理”把应用部分分离出来形成了HTTP/3原来的UDP部分“下放”到了传输层所以iQUIC有时候也叫“QUIC-transport”。
接下来要说的QUIC都是指iQUIC要记住它与早期的gQUIC不同是一个传输层的协议和TCP是平级的。
## QUIC的特点
QUIC基于UDP而UDP是“无连接”的根本就不需要“握手”和“挥手”所以天生就要比TCP快。
就像TCP在IP的基础上实现了可靠传输一样QUIC也基于UDP实现了可靠传输保证数据一定能够抵达目的地。它还引入了类似HTTP/2的“流”和“多路复用”单个“流”是有序的可能会因为丢包而阻塞但其他“流”不会受到影响。
为了防止网络上的中间设备Middle Box识别协议的细节QUIC全面采用加密通信可以很好地抵御窜改和“协议僵化”ossification
而且因为TLS1.3已经在去年2018正式发布所以QUIC就直接应用了TLS1.3顺便也就获得了0-RTT、1-RTT连接的好处。
但QUIC并不是建立在TLS之上而是内部“包含”了TLS。它使用自己的帧“接管”了TLS里的“记录”握手消息、警报消息都不使用TLS记录直接封装成QUIC的帧发送省掉了一次开销。
## QUIC内部细节
由于QUIC在协议栈里比较偏底层所以我只简略介绍两个内部的关键知识点。
QUIC的基本数据传输单位是**包**packet和**帧**frame一个包由多个帧组成包面向的是“连接”帧面向的是“流”。
QUIC使用不透明的“**连接ID**”来标记通信的两个端点客户端和服务器可以自行选择一组ID来标记自己这样就解除了TCP里连接对“IP地址+端口”(即常说的四元组)的强绑定,支持“**连接迁移**”Connection Migration
![](https://static001.geekbang.org/resource/image/ae/3b/ae0c482ea0c3b8ebc71924b19feb9b3b.png)
比如你下班回家手机会自动由4G切换到WiFi。这时IP地址会发生变化TCP就必须重新建立连接。而QUIC连接里的两端连接ID不会变所以连接在“逻辑上”没有中断它就可以在新的IP地址上继续使用之前的连接消除重连的成本实现连接的无缝迁移。
QUIC的帧里有多种类型PING、ACK等帧用于管理连接而STREAM帧专门用来实现流。
QUIC里的流与HTTP/2的流非常相似也是帧的序列你可以对比着来理解。但HTTP/2里的流都是双向的而QUIC则分为双向流和单向流。
![](https://static001.geekbang.org/resource/image/9a/10/9ab3858bf918dffafa275c400d78d910.png)
QUIC帧普遍采用变长编码最少只要1个字节最多有8个字节。流ID的最大可用位数是62数量上比HTTP/2的2^31大大增加。
流ID还保留了最低两位用作标志第1位标记流的发起者0表示客户端1表示服务器第2位标记流的方向0表示双向流1表示单向流。
所以QUIC流ID的奇偶性质和HTTP/2刚好相反客户端的ID是偶数从0开始计数。
## HTTP/3协议
了解了QUIC之后再来看HTTP/3就容易多了。
因为QUIC本身就已经支持了加密、流和多路复用所以HTTP/3的工作减轻了很多把流控制都交给QUIC去做。调用的不再是TLS的安全接口也不是Socket API而是专门的QUIC函数。不过这个“QUIC函数”还没有形成标准必须要绑定到某一个具体的实现库。
HTTP/3里仍然使用流来发送“请求-响应”但它自身不需要像HTTP/2那样再去定义流而是直接使用QUIC的流相当于做了一个“概念映射”。
HTTP/3里的“双向流”可以完全对应到HTTP/2的流而“单向流”在HTTP/3里用来实现控制和推送近似地对应HTTP/2的0号流。
由于流管理被“下放”到了QUIC所以HTTP/3里帧的结构也变简单了。
帧头只有两个字段:类型和长度,而且同样都采用变长编码,最小只需要两个字节。
![](https://static001.geekbang.org/resource/image/26/5b/2606cbaa1a2e606a3640cc1825f5605b.png)
HTTP/3里的帧仍然分成数据帧和控制帧两类HEADERS帧和DATA帧传输数据但其他一些帧因为在下层的QUIC里有了替代所以在HTTP/3里就都消失了比如RST\_STREAM、WINDOW\_UPDATE、PING等。
头部压缩算法在HTTP/3里升级成了“**QPACK**”使用方式上也做了改变。虽然也分成静态表和动态表但在流上发送HEADERS帧时不能更新字段只能引用索引表的更新需要在专门的单向流上发送指令来管理解决了HPACK的“队头阻塞”问题。
另外QPACK的字典也做了优化静态表由之前的61个增加到了98个而且序号从0开始也就是说“:authority”的编号是0。
## HTTP/3服务发现
讲了这么多不知道你注意到了没有HTTP/3没有指定默认的端口号也就是说不一定非要在UDP的80或者443上提供HTTP/3服务。
那么该怎么“发现”HTTP/3呢
这就要用到HTTP/2里的“扩展帧”了。浏览器需要先用HTTP/2协议连接服务器然后服务器可以在启动HTTP/2连接后发送一个“**Alt-Svc**”帧包含一个“h3=host:port”的字符串告诉浏览器在另一个端点上提供等价的HTTP/3服务。
浏览器收到“Alt-Svc”帧会使用QUIC异步连接指定的端口如果连接成功就会断开HTTP/2连接改用新的HTTP/3收发数据。
## 小结
HTTP/3综合了我们之前讲的所有技术HTTP/1、SSL/TLS、HTTP/2包含知识点很多比如队头阻塞、0-RTT握手、虚拟的“流”、多路复用算得上是“集大成之作”需要多下些功夫好好体会。
1. HTTP/3基于QUIC协议完全解决了“队头阻塞”问题弱网环境下的表现会优于HTTP/2
2. QUIC是一个新的传输层协议建立在UDP之上实现了可靠传输
3. QUIC内含了TLS1.3只能加密通信支持0-RTT快速建连
4. QUIC的连接使用“不透明”的连接ID不绑定在“IP地址+端口”上,支持“连接迁移”;
5. QUIC的流与HTTP/2的流很相似但分为双向流和单向流
6. HTTP/3没有指定默认端口号需要用HTTP/2的扩展帧“Alt-Svc”来发现。
## 课下作业
1. IP协议要比UDP协议省去8个字节的成本也更通用QUIC为什么不构建在IP协议之上呢
2. 说一说你理解的QUIC、HTTP/3的好处。
3. 对比一下HTTP/3和HTTP/2各自的流、帧有什么相同点和不同点。
欢迎你把自己的学习体会写在留言区,与我和其他同学一起讨论。如果你觉得有所收获,也欢迎把文章分享给你的朋友。
![unpreview](https://static001.geekbang.org/resource/image/58/df/5857f14a3b06b6c0dd38e00b4a6124df.png)