gitbook/趣谈网络协议/docs/9895.md
2022-09-03 22:05:03 +08:00

10 KiB
Raw Permalink Blame History

第18讲 | DNS协议网络世界的地址簿

前面我们讲了平时常见的看新闻、支付、直播、下载等场景现在网站的数目非常多常用的网站就有二三十个如果全部用IP地址进行访问恐怕很难记住。于是就需要一个地址簿根据名称就可以查看具体的地址。

例如,我要去西湖边的“外婆家”,这就是名称,然后通过地址簿,查看到底是哪条路多少号。

DNS服务器

在网络世界也是这样的。你肯定记得住网站的名称但是很难记住网站的IP地址因而也需要一个地址簿就是DNS服务器

由此可见DNS在日常生活中多么重要。每个人上网都需要访问它但是同时这对它来讲也是非常大的挑战。一旦它出了故障整个互联网都将瘫痪。另外上网的人分布在全世界各地如果大家都去同一个地方访问某一台服务器时延将会非常大。因而DNS服务器一定要设置成高可用、高并发和分布式的

于是,就有了这样树状的层次结构

- 根DNS服务器 返回顶级域DNS服务器的IP地址

  • 顶级域DNS服务器返回权威DNS服务器的IP地址

  • 权威DNS服务器 返回相应主机的IP地址

DNS解析流程

为了提高DNS的解析性能很多网络都会就近部署DNS缓存服务器。于是就有了以下的DNS解析流程。

  1. 电脑客户端会发出一个DNS请求问www.163.com的IP是啥啊并发给本地域名服务器 (本地DNS)。那本地域名服务器 (本地DNS) 是什么呢如果是通过DHCP配置本地DNS由你的网络服务商ISP如电信、移动等自动分配它通常就在你网络服务商的某个机房。

  2. 本地DNS收到来自客户端的请求。你可以想象这台服务器上缓存了一张域名与之对应IP地址的大表格。如果能找到 www.163.com它就直接返回IP地址。如果没有本地DNS会去问它的根域名服务器“老大能告诉我www.163.com的IP地址吗”根域名服务器是最高层次的全球共有13套。它不直接用于域名解析但能指明一条道路。

  3. 根DNS收到来自本地DNS的请求发现后缀是 .com“哦www.163.com啊这个域名是由.com区域管理我给你它的顶级域名服务器的地址你去问问它吧。”

  4. 本地DNS转向问顶级域名服务器“老二你能告诉我www.163.com的IP地址吗”顶级域名服务器就是大名鼎鼎的比如 .com、.net、 .org这些一级域名它负责管理二级域名比如 163.com所以它能提供一条更清晰的方向。

  5. 顶级域名服务器说:“我给你负责 www.163.com 区域的权威DNS服务器的地址你去问它应该能问到。”

  6. 本地DNS转向问权威DNS服务器“您好www.163.com 对应的IP是啥呀”163.com的权威DNS服务器它是域名解析结果的原出处。为啥叫权威呢就是我的域名我做主。

  7. 权威DNS服务器查询后将对应的IP地址X.X.X.X告诉本地DNS。

  8. 本地DNS再将IP地址返回客户端客户端和目标建立连接。

至此我们完成了DNS的解析过程。现在总结一下整个过程我画成了一个图。

负载均衡

站在客户端角度,这是一次DNS递归查询过程。因为本地DNS全权为它效劳它只要坐等结果即可。在这个过程中DNS除了可以通过名称映射为IP地址它还可以做另外一件事就是负载均衡

还是以访问“外婆家”为例,还是我们开头的“外婆家”,但是,它可能有很多地址,因为它在杭州可以有很多家。所以,如果一个人想去吃“外婆家”,他可以就近找一家店,而不用大家都去同一家,这就是负载均衡。

DNS首先可以做内部负载均衡

例如一个应用要访问数据库在这个应用里面应该配置这个数据库的IP地址还是应该配置这个数据库的域名呢显然应该配置域名因为一旦这个数据库因为某种原因换到了另外一台机器上而如果有多个应用都配置了这台数据库的话一换IP地址就需要将这些应用全部修改一遍。但是如果配置了域名则只要在DNS服务器里将域名映射为新的IP地址这个工作就完成了大大简化了运维。

在这个基础上我们可以再进一步。例如某个应用要访问另外一个应用如果配置另外一个应用的IP地址那么这个访问就是一对一的。但是当被访问的应用撑不住的时候我们其实可以部署多个。但是访问它的应用如何在多个之间进行负载均衡只要配置成为域名就可以了。在域名解析的时候我们只要配置策略这次返回第一个IP下次返回第二个IP就可以实现负载均衡了。

另外一个更加重要的是DNS还可以做全局负载均衡

为了保证我们的应用高可用往往会部署在多个机房每个地方都会有自己的IP地址。当用户访问某个域名的时候这个IP地址可以轮询访问多个数据中心。如果一个数据中心因为某种原因挂了只要在DNS服务器里面将这个数据中心对应的IP地址删除就可以实现一定的高可用。

另外,我们肯定希望北京的用户访问北京的数据中心,上海的用户访问上海的数据中心,这样,客户体验就会非常好,访问速度就会超快。这就是全局负载均衡的概念。

示例DNS访问数据中心中对象存储上的静态资源

我们通过DNS访问数据中心中对象存储上的静态资源为例看一看整个过程。

假设全国有多个数据中心托管在多个运营商每个数据中心三个可用区Available Zone。对象存储通过跨可用区部署实现高可用性。在每个数据中心中都至少部署两个内部负载均衡器内部负载均衡器后面对接多个对象存储的前置服务器Proxy-server

  1. 当一个客户端要访问object.yourcompany.com的时候需要将域名转换为IP地址进行访问所以它要请求本地DNS解析器。

  2. 本地DNS解析器先查看看本地的缓存是否有这个记录。如果有则直接使用因为上面的过程太复杂了如果每次都要递归解析就太麻烦了。

  3. 如果本地无缓存则需要请求本地的DNS服务器。

  4. 本地的DNS服务器一般部署在你的数据中心或者你所在的运营商的网络中本地DNS服务器也需要看本地是否有缓存如果有则返回因为它也不想把上面的递归过程再走一遍。

  5. 至 7. 如果本地没有本地DNS才需要递归地从根DNS服务器查到.com的顶级域名服务器最终查到 yourcompany.com 的权威DNS服务器给本地DNS服务器权威DNS服务器按说会返回真实要访问的IP地址。

对于不需要做全局负载均衡的简单应用来讲yourcompany.com的权威DNS服务器可以直接将 object.yourcompany.com这个域名解析为一个或者多个IP地址然后客户端可以通过多个IP地址进行简单的轮询实现简单的负载均衡。

但是对于复杂的应用,尤其是跨地域跨运营商的大型应用,则需要更加复杂的全局负载均衡机制,因而需要专门的设备或者服务器来做这件事情,这就是全局负载均衡器GSLBGlobal Server Load Balance)。

在yourcompany.com的DNS服务器中一般是通过配置CNAME的方式给 object.yourcompany.com起一个别名例如 object.vip.yourcomany.com然后告诉本地DNS服务器让它请求GSLB解析这个域名GSLB就可以在解析这个域名的过程中通过自己的策略实现负载均衡。

图中画了两层的GSLB是因为分运营商和地域。我们希望不同运营商的客户可以访问相同运营商机房中的资源这样不跨运营商访问有利于提高吞吐量减少时延。

  1. 第一层GSLB通过查看请求它的本地DNS服务器所在的运营商就知道用户所在的运营商。假设是移动通过CNAME的方式通过另一个别名 object.yd.yourcompany.com告诉本地DNS服务器去请求第二层的GSLB。

  2. 第二层GSLB通过查看请求它的本地DNS服务器所在的地址就知道用户所在的地理位置然后将距离用户位置比较近的Region里面六个内部负载均衡SLBServer Load Balancer的地址返回给本地DNS服务器。

  3. 本地DNS服务器将结果返回给本地DNS解析器。

  4. 本地DNS解析器将结果缓存后返回给客户端。

  5. 客户端开始访问属于相同运营商的距离较近的Region 1中的对象存储当然客户端得到了六个IP地址它可以通过负载均衡的方式随机或者轮询选择一个可用区进行访问。对象存储一般会有三个备份从而可以实现对存储读写的负载均衡。

小结

好了,这节内容就到这里了,我们来总结一下:

  • DNS是网络世界的地址簿可以通过域名查地址因为域名服务器是按照树状结构组织的因而域名查找是使用递归的方法并通过缓存的方式增强性能

  • 在域名和IP的映射过程中给了应用基于域名做负载均衡的机会可以是简单的负载均衡也可以根据地址和运营商做全局的负载均衡。

最后,给你留两个思考题:

  1. 全局负载均衡为什么要分地址和运营商呢?

  2. 全局负载均衡使用过程中,常常遇到失灵的情况,你知道具体有哪些情况吗?对应应该怎么来解决呢?

我们的专栏更新过半了,不知你掌握得如何?每节课后我留的思考题,你都有没有认真思考,并在留言区写下答案呢?我会从已发布的文章中选出一批认真留言的同学,赠送**学习奖励礼券和我整理的独家网络协议知识图谱**。

欢迎你留言和我讨论。趣谈网络协议,我们下期见!