# 13 | 区块链+新基建:数字社会的四驾马车 你好,我是自游。 在国家的“十四五”规划中,区块链技术首次被列入数字产业新基建行列,与之并列的还有云计算、大数据、人工智能以及网络安全等,这里面每一项都对应着数字社会基础设施建设的特定方向。 虽然它们是相对独立的特定领域,但这不代表它们之间毫无关联。其实,这四个方向对应着数字网络构建的不同侧重模块,只有彼此组合在一起形成技术结合体,才能挥动新基建这杆大旗。 这一讲,我们就一起探讨云计算、大数据、区块链及人工智能,看看这四驾马车是如何拉动社会数字前进的。 ## 云计算 如果现在有人问你双11是什么日子?我想你会毫不犹豫地回答:购物狂欢节。 的确,这已经成为了我国的一个约定俗成的节日。每当临近双11,我们都会往购物车中疯狂加购,而在双11的凌晨,所有的人都争先恐后地下单并完成支付。那你有没有想过,平台方是如何应对这突如其来的下单请求的呢? 电商平台之所以能够支撑海量的业务请求,背后离不开**云计算技术**作为基础支撑。如果要投票选择,过去10年里全世界任意领域中最重要的基础设施建设,我会毫不犹豫给云计算投上一票。 云计算利用虚拟化技术将物理服务器、存储和网络等硬件设备以服务的形式提供给用户使用,用户只需要通过互联网,以按需服务的形式购买计算资源,无需自行采购、配置或者管理这些硬件资源,只需要为实际使用的资源付费。 同时,借助云计算,我们不需要过多考虑业务峰值来临时,因资源不够而造成的服务崩溃。我们可以根据业务需求的变化立即扩展或者缩减这些资源,用最小化的成本抵抗住最凶猛的业务请求。依托于云计算平台庞大的计算资源池与自动伸缩技术,双11时我们才能狂欢购物。 因此我们可以说**云计算技术是数字社会的生产工具**,是数字社会新基建中的基建。 ### 区块链+云计算 了解完云计算的基础知识,你想到区块链要怎样跟云计算结合了么?云计算技术主要可以支撑起区块链的网络部署。 区块链节点这个概念,虽然貌似听上去有种很大很复杂的感觉,但如果从服务部署的角度讲,其实一个区块链节点实质就是几个应用程序而已,它与一般化的网站服务也并没有什么不同,都需要一定的计算、存储及网络资源。 对于公有链,情况要稍微简单些,网络中的节点间的关系相对松散,你部署你的节点并不需要考虑我的节点是如何部署的,我与你两个节点间的联系仅限通过网络通信进行数据传递而已。换句话说,公有链的节点部署并不需要统一标准,只需满足最低资源要求,就可以在任意时间、任意地点部署。 但联盟链的部署就大不一样了,因为技术选型的原因,联盟链网络部署的初期就需要协调各节点程序,使其保持步调的一致,是典型的**分布式系统构建方式**。 比如前面讲过联盟链中用到的拜占庭容错共识算法,就需要至少4个节点才能构建一个区块链网络。云计算的出现,让区块链复杂的组网过程有了统一简化的可能,通过统一协调制定节点资源的使用,规范制定区块链参数配置,就能快速部署联盟链网络。 在此基础上,为了不仅能够快速标准化部署多种类联盟链网络,还能够对其进行管理,监控等运维操作,**区块链与云计算的结合催生出区块链即服务平台**,也就是BaaS,Blockchain as a Service的缩写,灵感来源于云计算中的IaaS、PaaS、SaaS的理念。 比如[腾讯云的TBaaS](https://cloud.tencent.com/product/tbaas),[华为云的BCS](https://www.huaweicloud.com/product/bcs.html)等,都是国内现在比较优秀的公有云BaaS平台。 ## 大数据 讲解完云计算在区块链里的应用,我们再来看看大数据。大数据我们常常挂在嘴边,到底是什么是大数据呢? 其实它指的是非常庞大、复杂且大量非结构化的数据集,其规模之大,我们用传统的处理手段已经无法处理,因此需要借助新的技术辅助,以便帮助我们解决棘手的业务难题。 另外,大数据的特性我们可以用5个V来概括,V取自于每个特性的英文首字母,我们一起来看一看: * 大量(Volume):所谓大数据,首先肯定是数据量大,在实际场景中,大数据的数据量通常是以TB,PB来计算,什么概念呢?我们的手机现在一般能存储128G的数据,而1024G数据才等于1TB,1024TB才等于1PB。 * 高速(Velocity):大数据需要用较高的速度接收甚至是处理数据。数据通常是直接在内存中,而不是写入磁盘,这样就可以满足实时数据分析的需求。 * 多样化(Variety):多样化是指大数据的数据源很多,且大多数属于非结构化的数据,比如图片、音频、视频等等,因此需要经过预处理才能发挥数据的价值。 * 价值(Value):大数据所面对的数据是海量的,但并不是所有的数据都有价值,因此我们需要通过数据清洗,过滤出有价值的数据。 * 真实(Veracity):与价值特性一样,需要保证数据的真实性、准确性,才能提高数据质量,这样最终的结果才值得信赖。 现阶段,大数据技术已经被广泛应用。移动互联网、社交网络、物联网等领域的兴起,都产生了源源不断的大数据样本,而云计算又为大数据提供了稳健的计算及存储资源支撑,通过对不同数据源的数据采集、预处理、分析及挖掘,最终将结果反馈输出至数据源,进而反向指导应用的发展。 比如,我们现在每天刷抖音津津有味,越喜欢什么越给你推荐什么,这背后其实就有大数据的功劳。大数据的运用,无疑可以创造巨大的经济及社会价值。可以说,**大数据是数字社会的生产资料**。 ### 区块链+大数据 那区块链与大数据的结合又能碰撞出什么样的火花呢?总的来说,我们可以有两类融合的切入点。 回想区块链+5G物联网课程中的知识,要想解决区块链上链数据的真实性问题,我们可以通过在数据源与区块链节点间建立直通的数据上链通道,最大限度排除人为的干扰。5G物联网为我们提供了一种解决办法,而大数据技术又为我们提供了另一种思路。 细心的你或许已经发现了解决思路,面对海量杂乱无序的原始数据,我们可以利用大数据技术进行**预处理清洗**,分析挖掘出其中真实的具有特定价值的数据,之后再将处理后的数据通过区块链节点以交易的形式上链,这会在很大程度上解决数据真实性的问题。 另一个切入点,对于已经上链的区块链数据,我们可以用大数据技术分析,以此评估区块链的真实运作情况。那可供分析的数据有哪些呢?毫无疑问,结合区块链存储章节的知识点,数据不外乎是交易、区块及状态。 交易跟区块是固定格式的数据,相对来说比较容易分析,而状态对于不同的区块链来说,对应着不同的状态模型,且智能合约更加剧了状态数据的不确定性,分析难度较大。但是我们还是可以分析标准智能合约产生的相对结构化的数据,对大数据技术来说,无非是需要增加新的数据采集规则。 讲到这里,你是否已经能够猜到基于区块链的大数据分析应用呢?不卖关子,这其实就是区块链浏览器的技术原理。 通过对区块链数据的分析,为用户提供直观的、可以查看区块链网络运行的平台,比如我们经常提到的以太坊的区块浏览器[EtherScan](https://etherscan.io/),通过它,你可以实时了解以太坊网络的运行状况。 ![](https://static001.geekbang.org/resource/image/78/0a/78c645cc5014954268c2a8c1baa2bf0a.png?wh=1366x696 "EtherScan示意图") ## 人工智能 要说最近几年什么技术最火,80%的人估计都会回答人工智能。从谷歌的AlphaGo战胜韩国围棋世界冠军李世石开始,关于人工智能的讨论不绝于耳。人工智能试图了解人类智能的本质,并以此为基础,期望能够制造出一种能以人类智能相似方式做出反应的行为模式系统,包括但不限于与之匹配的软件及硬件系统。 这无疑是一个很宏伟的目标,但从现阶段看,任重而道远,能够完全模拟人类智能的系统暂时还不存在。因此,现阶段人工智能采用逐个击破的方式,分别探索不同的领域,包括语言识别、图像识别、自然语言处理等等。随后将各个领域的成果加以整合,形成相对智能的产品推向市场,比如最近大火的自动驾驶技术等等。 其实人工智能技术能有如此快速的发展不仅是技术的优越,同时也依赖多种技术的协同。 云计算技术将GPU等资源整合,为人工智能提供强有力的资源辅助,提升人工智能在训练阶段的效率,同时也为人工智能应用面向用户提供了便捷的途径;而依托于大数据技术,我们才能在海量繁杂的数据中通过采集、处理、分析等过程,获得有价值的数据,为人工智能的训练提供足够多的样本,提升机器学习的精准度。可以说**人工智能有云计算及大数据等技术的辅助,极大提升了数字社会的生产力**。 ### 区块链+人工智能 我们知道,在数字社会数据作为一种新型的生产资料已成共识,但区别于其他生产资料的一点就是个人数据隐私需要被保护,这是法律层面的约束;但数据又需要开放共享才能与人工智能结合,使得价值最大化。这时就产生了新问题,如何在数据隐私保护与开放共享之间寻求平衡呢? 为此,人工智能领域诞生了一种新的机器学习模式,那就是联邦学习。在数据足不出户的情况下(简单说就是数据源不离开原来的企业),也能让各企业的人工智能学习平台联合起来进行模型训练及预测。可以看到,联邦学习涉及到了多企业间的分工协助,而**一旦涉及多方协作,区块链就有了用武之地**。 那区块链的加入具体可以给联邦学习带来何种优势呢?我认为主要有两点: 其一,利用区块链的不可篡改特性及可追溯性,对恶意参与方进行跟踪惩罚。联邦学习平台可以利用区块链技术作为学习阶段的元数据共享通道,当发现遭受恶意或者惰性攻击时,就可以依据区块链历史数据对相关责任方进行确认,从而采取有效惩罚措施,保持联邦学习平台的平稳健康发展。 其二,利用区块链的去中心化特性可以积极拥抱监管。在实际参与联邦学习的合作方之外,可将相关的监管审查机构作为独立自主的第三方节点,接入区块链网络,因此监管审查机构就可以实时地监控联邦学习平台的运作情况,如有违规操作,可以在短时间内制止。 ## 总结 在数字社会的今天,每一种技术并不是孤立地存在,而是彼此依存的有机组合。云计算技术是数字社会的生产工具,是新基建中的基建,为其他技术的应用提供稳固的底层支撑。而大数据技术从繁杂无序的海量数据中挖掘真实且有价值的数据,为数字社会提供生产资料。而在云计算及大数据等技术的加持下,人工智能释放了巨大的生产力。 ![](https://static001.geekbang.org/resource/image/7d/f4/7d4802210614d3a1161dfffd7539b3f4.jpg?wh=680x379 "数字社会示意图") 而区块链技术自公链圈与联盟链圈割裂以后,联盟链技术也逐渐与主流技术体系融合,迸发出激烈的火花。可以说,区块链技术是数字社会的生产关系,只要涉及到多方协助,区块链就有存在的价值。 云计算是生产工具,大数据是生产资料,区块链是生产关系,人工智能是生产力。他们齐力协同,共同组成数字社会的四驾马车,推动数字社会的发展。 ![](https://static001.geekbang.org/resource/image/c2/56/c2e0aa982cf0bc6385a08eb8041caa56.jpg?wh=1500x1798) ## 讨论 关于区块链与云计算、大数据及人工智能的结合切入点,你认为还有哪些呢? 欢迎你在留言区跟我互动,主动思考、积极交流会让你更有收获。如果这一讲对你有帮助,也欢迎你分享给自己的朋友、同事。