You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

148 lines
11 KiB
Markdown

This file contains invisible Unicode characters!

This file contains invisible Unicode characters that may be processed differently from what appears below. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to reveal hidden characters.

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 第10讲 | 深入区块链技术P2P网络
在上一篇文章中我大致讲解了一下区块链技术的几个核心要素。P2P网络协议、分布式一致性算法共识机制、加密签名算法、账户与存储模型。今天我们就来看看区块链技术的第一个核心要素P2P网络。
如果我们简单来看P2P技术它的应用领域已经非常广泛了从流媒体到点对点通讯、从文件共享到协同处理多种领域都有它的身影出现。
同样的P2P的网络协议也有很多比较常见的有BitTorrent、ED2K、Gnutella、Tor等也就是我们常说的BT工具和电驴。
比特币、以太坊等众多数字货币都实现了属于自己的P2P网络协议但是这种模式并不同于以上讨论的P2P网络协议所以我们今天讨论的重点主要是区块链技术的P2P技术也就是比特币和以太坊的P2P网络。
由于区块链的P2P网络技术知识繁多我们主要提炼其中的四个内容进行讲解区块链的网络连接与拓扑结构、节点发现、局域网穿透与节点交互协议。
希望读完本篇可以让你对目前成熟的区块链P2P网络的拓扑结构以及运行原理有个大体的认知。
## 网络连接与拓扑结构
### 1.网络连接
除去少数支持UDP协议的区块链项目外绝大部分的区块链项目所使用的底层网络协议依然是TCP协议。
所以从网络协议的角度来看区块链其实是基于TCP/IP网络协议的这与HTTP协议、SMTP协议是处在同一层也就是应用层。
在“区块链的常见误区”这篇文章中我们提到了“区块链是否会颠覆互联网”这一说法如果要是认真分析的话它颠覆的层面其实最多只到HTTP协议不能再多了。
以HTTP协议为代表的、与服务端的交互模式在区块链上被彻底打破了变更为完全的点对点拓扑结构这也是以太坊提出的Web3.0的由来。
比特币的P2P网络是一个非常复杂的结构考虑到矿池内部的挖矿交互协议与轻节点。我们仅仅讨论全节点这种场景下的P2P网络发现与路由。
比特币的P2P网络基于TCP构建主网默认通信端口为8333。
以太坊的P2P网络则与比特币不太相同以太坊P2P网络是一个完全加密的网络提供UDP和TCP两种连接方式主网默认TCP通信端口是30303推荐的UDP发现端口为30301。
### 2.拓扑结构
P2P网络拓扑结构有很多种有些是中心化拓扑有些是半中心化拓扑有些是全分布式拓扑结构。
比特币全节点组成的网络是一种全分布式的拓扑结构,节点与节点之间的传输过程更接近“泛洪算法”,即:交易从某个节点产生,接着广播到临近节点,临近节点一传十十传百,直至传播到全网。
![](https://static001.geekbang.org/resource/image/09/28/09275293ad4cbd85950e4b1191775228.png)
(比特币全球节点图,图来自网络)
全节点与SPV简化支付验证客户端之间的交互模式更接近半中心化的拓扑结构也就是SPV节点可以随机选择一个全节点进行连接这个全节点会成为SPV节点的代理帮助SPV节点广播交易。
## 节点发现
节点发现是任何区块链节点接入区块链P2P网络的第一步。这与你孤身一人去陌生地方旅游一样如果没有地图和导航那你只能拽附近的人问路“拽附近的人问路”的这个动作就可以理解成节点发现。
节点发现可分为初始节点发现,和启动后节点发现。初始节点发现就是说你的全节点是刚下载的,第一次运行,什么节点数据都没有。启动后发现表示正在运行的钱包已经能跟随网络动态维护可用节点。
### 1.初始节点发现
在比特币网络中,初始节点发现一共有两种方式。
第一种叫做DNS-seed又称DNS种子节点DNS就是中心化域名查询服务比特币的社区维护者会维护一些域名。
比如seed.bitcoin.sipa.be这个域名就是由比特币的核心开发者Sipa维护的如果我们通过nslookup会发现大约二十多个A纪录的IPv4主机地址。
我们通过nc命令尝试连接域名下的某个主机的8333端口会发现连接成功运行结构如下。
```
✘ chenhao@chenhaodeMacBook-Pro ~ nc -nvv 149.202.179.35 8333
found 0 associations
found 1 connections:
1: flags=82<CONNECTED,PREFERRED>
outif en0
src 192.168.1.104 port 62125
dst 149.202.179.35 port 8333
rank info not available
TCP aux info available
Connection to 149.202.179.35 port 8333 [tcp/*] succeeded!
```
好的,到目前为止我们已经手动做了一遍初始节点发现的工作,这些操作是由比特币的代码完成的。
第二种方式就是,代码中硬编码( hard-code 了一些地址这些地址我们称之为种子节点seed-node当所有的种子节点全部失效时全节点会尝试连接这些种子节点。
用在以太坊中思路也大致相同也是在代码中硬编码hard-code了一些种子节点做类似的工作。
### 2.启动后节点发现
在Bitcoin 的网络中,一个节点可以将自己维护的对等节点列表(peer list)发送给临近节点,所以在初始节点发现之后,你的节点要做的第一件事情就是向对方要列表:“快把你的节点列表给我复制一份。”
所以在每次需要发送协议消息的时候它会花费固定的时间尝试和已存的节点列表中的节点建立链接如果有任何一个节点在超时之前可以连接上就不用去DNS seed 获取地址,一般来说,这种可能性很小,尤其是全节点数目非常多的情况下。
而在以太坊网络中,也会维护类似的一个节点列表(NodeTable)但是这个节点列表与比特币的简单维护不同它采用了P2P网络协议中一个成熟的算法叫做Kademlia网络简称KAD网络。
它使用了DHT来定位资源全称Distributed Hash Table中文名为分布式哈希表。KAD网络会维护一个路由表用于快速定位目标节点。由于KAD网络基于UDP通信协议所以以太坊节点的节点发现是基于UDP的如果找到节点以后数据交互又会切换到TCP协议上。
### 3.黑名单与长连接
公有区块链面临的网络环境是非常开放的任何人只要下载好钱包打开运行就进入了这个P2P网络这也会带来被攻击的可能。
所以在比特币的代码中会有一段去控制逻辑你可以手动将你认为可疑的节点移除并加入禁止列表同时去配置可信的节点。当然以上并不属于客户端的标准协议的一部分任何人都可以实现属于自己的P2P网络层。
以太坊上有针对账户进行的黑名单处理,但是这属于业务层。我没有找到很详尽的资料,所以你有兴趣的话,可以自己尝试一下。
不过总的来说,黑名单我们也可以通过操作系统的防火墙去处理,这并不算一个特别棘手的问题。
## 局域网穿透
前面我们说到了区块链的P2P网络结构是一种全分布式的拓扑结构。但是如今我们的网络环境是由局域网和互联网组成的。也就是说当你在局域网运行一个区块链节点在公网是发现不了的公网上的节点只能被动接受连接并不能主动发起连接。
如果这个局域网是你可以控制的那么很好说咱们只需要在VPC网络中配置路由将公网IP和端口映射到局域网中你的IP和端口即可。
这个条件是非常苛刻的那么到底有没有一种方案可以自行建立映射呢答案是就是NAT技术和UPnP协议。
NAT技术非常常见这里使用的是源NAT简而言之就是替换TCP报文中的源地址并映射到内网地址。
UPnP是通用即插即用Universal Plug and Play的缩写它主要用于设备的智能互联互通所有在网络上的设备马上就能知道有新设备加入。
这些设备彼此之间能互相通信更能直接使用或者控制它一切都不需要人工设置。有关UPnP的资料比较多这里就不赘述了你可以自行搜索相关的信息。
比特币和以太坊均使用了UPnP协议作为局域网穿透工具只要局域网中的路由设备支持NAT网关功能、支持UPnP协议即可将你的区块链节点自动映射到公网上。
## 节点交互协议
一旦节点建立连接以后,节点之间的交互是遵循一些特定的命令,这些命令写在消息的头部,消息体写的则是消息内容。
命令分为两种,一种是请求命令,一种是数据交互命令。
节点连接完成要做的第一件事情叫做握手操作。这一点在比特币和以太坊上的流程是差不多的,就是相互问候一下,提供一些简要信息。
比如先交换一下版本号,看看是否兼容。只是以太坊为握手过程提供了对称加密,而比特币没有。
握手完毕之后无论交互什么信息都是需要保持长连接的在比特币上有PING/PONG这两种类型的消息这很明显就是用于保持节点之间长连接的心跳而设计的而在以太坊的设计中将PING/PONG协议移到了节点发现的过程中。
请求命令一般分为发起者请求,比如比特币中的 getaddr 命令是为了获取对方的可用节点列表inv命令则提供了数据传输消息体中会包含一个数据向量。
我们说区块链最重要的功能就是同步区块链而同步区块恰巧是最考验P2P网络能力的。区块同步方式分为两种第一种叫做HeaderFirst它提供了区块头先同步同步完成以后再从其他节点获得区块体。
第二种叫做BlockFirst这种区块同步的方式比较简单粗暴就是从其他节点获取区块必须是完整的。第一种方案提供了较好的交互过程减轻了网络负担。这两种同步方式会直接体现在节点交互协议上他们使用的命令逻辑完全不同。
## 总结
今天我与你分享了区块链的P2P网络结构与节点交互过程一般P2P网络技术要解决两个主要问题第一是资源定位第二是资源获取这一篇文章也是主要围绕这两点展开其中节点发现和局域网穿透是属于资源定位问题节点交互协议是属于资源获取问题。
在这一篇文章中,我仅以比特币和以太坊为例进行分享,虽然区块链项目比较多,但是他们要做的事情大多是类似的,比如以太坊是改进版的实现,而比特币使用了简单版实现。
P2P网络模块作为所有区块链的最底层模块直接决定了整个区块链网络的稳定性。区块链网络是一个网状分布式的结构与互联网结构有点相似那么亲爱的读者我们是不是可以设计一个节点爬虫去爬全网节点呢你可以给我留言我们一起讨论。
感谢你的收听,我们下次再见。
参考链接:[https://bitnodes.earn.com/](https://bitnodes.earn.com/)