You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

189 lines
11 KiB
Markdown

2 years ago
# 第16讲 | 深入区块链技术(八): UTXO与普通账户模型
我们在第2讲“区块链到底是怎么运行”一文中提到了村长给张三转账的例子那里村长的例子就是UTXO模型的一个简化版本。
评论区里有不少留言在问:“为什么不直接记余额呢?”看来很多人都对这个问题很感兴趣,今天我们就来聊一聊这个话题。
区块链网络中有两种记账模式除了UTXO模型还有 Account Based 结构,也就是普通账户模型,也叫账户余额模型,前者在比特币系的数字货币中被广泛使用,后者更多是用在智能合约型的区块链上。
## 普通账户模型
我们先从传统的账户模型出发来聊聊是如何记账的假设我们现在有一个支付系统在这个支付系统中有村长和张三两个账户村长账户里有100万现在要转账给张三10万这其中涉及的操作是这样的
1. 检查村长的账户余额是否大于10万
2. 把村长的账户扣除10万变成90万然后发送一笔转账消息给张三的账户
3. 张三的账户接受到转账消息将张三的账户余额加10万。
我们可以发现,无论是村长还是张三,都具有一个余额作为状态,即当前余额是记录在某个地方的,只需要读出来即可,这种设计我们叫做账户余额模型。
如果以上三个步骤是在一个中心化系统中,甚至在同一个数据库中,那将非常简单,会直接退化成一个事务,我们见到的银行账户、信用卡系统、证券交易系统、各种电商类应用,理财类应用基本都是一个中心化系统中的,最多也就是跨表跨数据库。
想必这类场景下的设计,各位工程师对此应该是了如指掌的。
如果以上的步骤中村长和张三的账户分属两个不同的系统例如从A银行到B银行就需要经过人民银行支付系统即可信任的中心化第三方来做中介。
你可能发现了在跨行转账的这种情况下是没有办法做事务的所以1和3是不同步的如果3操作失败还需要从2倒退到1的状态这个情况叫做冲正交易。
普通账户模型具有自定义数据类型的优点但是却需要自己设计事务机制就是上述所说的冲正交易。而接下来所讲的UTXO模型则恰恰相反。
## UTXO模型
UTXO全称是“Unspent Transaction Output”这指的是未花费的交易输出。这里面三个单词分别表示 “未花费的”“交易”“输出”接下来我来详细讲解一下UTXO的含义。
UTXO的核心设计思路是无状态它记录的是交易事件,而不记录最终状态,也就是说只记录变更事件,用户需要根据历史记录自行计算余额。
有点像MySQL中的Binlog主从模式的情况下按照Binlog来更新数据Redis的AOF模式备份模式也是如此UTXO也是类似的思路。
下面我们按照按照普通账户中的例子来重新讲解一遍。
如果要记录交易本身,那么我们可以构造一笔交易,这笔交易中村长转账10万给张三的同时90万转给自己。
如下所示:
村长 100万 --> 张三 10万
 
        --> 村长 90万
这里其实有三条子记录,左边一条,右边两条,左边叫做输入,右边叫做输出。
输入和输出组成了交易,输入和输入需要满足一些约束条件:
1. 任意一个交易必须至少一个输入、一个输出;
2. 输入必须全部移动,不能只使用部分,所以才产生了第二个输出指向村长自己;
3. 输入金额 = 输出金额之和 + 交易手续费,这里必须是等式。
对于村长来说首先构造交易的输入输出满足上述条件然后广播到全网接收方自行判断交易是否属于自己。这里满足约束条件构成的交易模型也就是村长记录的三条转账事件就是UTXO模型。
## 账户余额模型与UTXO的比较
我们可以归纳出UTXO与普通账户模型的一些区别。
1. 存储空间UTXO占用空间比账户模型高因为账户模型只记录最终状态。
2. 易用性UTXO比较难处理账户模型简单容易理解。例如UTXO在使用上还需要配合高效的UTXO组装算法这个算法要求尽可能降低输入输出的个数还要让“零钱“归整算法的复杂度相比账户余额无疑要高。
3. 安全性UTXO比账户模型要高UTXO本身具备ACID的记账机制而账户模型需要自行处理例如重放攻击。
普通账户模型具有较高的自由度可以让智能合约有更好的发挥空间并且它避免了UTXO的复杂组装逻辑精度控制上也更为得心应手。
UTXO似乎天然是为数字货币设计的具有较高频次跨账户转移场景都使用UTXO会比较好考虑到智能合约的普适性UTXO与智能合约并不能很好地兼容但是这也对开发者的自身水平提出了更高的要求。
## 区块链中的UTXO模型
我们借用比特币开发者文档中UTXO模型的图示来看看UTXO实际的构造形式。
![](https://static001.geekbang.org/resource/image/76/1a/76b8045f3b23c2397b31b263f9e3521a.png)
上图中所有的交易都可以找到前向交易例如TX5的前向交易是TX2TX2中的Output1作为TX5中的Input0。
意思就是TX2中的付款人使用了Output1中指向的比特币转移给 TX5 中的收款人接着TX5中的人又把收到的比特币转移给了TX6中的收款人成为了TX6中 Output0。
我们也可以发现TX6中的收款人还没有产生TX7交易也就是说Output0还没有被花费这时候我们终于得到了UTXO的真正语义Unspent Transaction Output未花费的交易输出。
我们这时候可以发现UTXO也同样能表示余额不过是重演计算的方式它用不同的方式表达了余额我们把一个地址上所有的UTXO全部找出来,就是这个地址总的余额了。
我们还可以发现无论是TX5还是TX2都已经成为历史交易它们都忠实客观地记录了两笔交易,这两笔交易代表的是事件,而不是余额状态转移,这是我们看到的最直观的区别。
我们再来看看一个真实的交易例子。
![](https://static001.geekbang.org/resource/image/e3/f3/e33ad9fe34f60d9254f9616565800cf3.png)
这是区块链上一笔真实交易的例子它记录了一笔450ETP的转账记录。
左边是输入,右边是两笔输出,其中第二个输出是给自己的账户,这和我们村长转账给张三的例子是一样的。
下图是交易解码为JSON格式的样子可以看到Previous\_output是放到Inputs数组里的意思就是前向输出作为本次的输入。
```
{
"hash" : "89e80e14db07c4904a57e2c1efb689bccbbf43942103c1a92166d5c0f27ea3d2",
"height" : 1093399,
"inputs" :
[
{
"address" : "MLWtmjwCtmK44FMwJMSfAkHaEvnnb2N6HX",
"previous_output" :
{
"hash" : "770a72f35d3e3a78bd468949bad649f03b241cf7e2a84cc2d6fdabacdcc47f06",
"index" : 0
},
"script" : "[ 304402202b21d7a79276985dc99777b70fd5095796dad58f35e29a019d2cb6cca5df481802205ffab088a6047f5b6382ba02a0eed4e78ab7950fe264d3774e8b0b357a7593d101 ] [ 03ea3462dc01e7b5569e89737211887035f8f1e99e1fe4332181d83daccaa6d917 ]",
"sequence" : 4294967295
}
],
"lock_time" : "0",
"outputs" :
[
{
"address" : "MGz9yjLLn4AqyraRjSpiP2GmTWKnT3yfiL",
"attachment" :
{
"type" : "etp"
},
"index" : 0,
"locked_height_range" : 0,
"script" : "dup hash160 [ 63ab0013d183f2592e4b46a358df01e88a09c0b8 ] equalverify checksig",
"value" : 45000000000
},
{
"address" : "MLWtmjwCtmK44FMwJMSfAkHaEvnnb2N6HX",
"attachment" :
{
"type" : "etp"
},
"index" : 1,
"locked_height_range" : 0,
"script" : "dup hash160 [ 8a63941b392771c40f1c15e4374808f6bb464cba ] equalverify checksig",
"value" : 118082150283
}
],
"version" : "2"
}
```
我们再看看比特币上的例子:
![](https://static001.geekbang.org/resource/image/75/02/754ac55278597b78be616aea2a561d02.png)
这一笔比特币交易包含6个输入几十个输出交易一共3.5kb,交易的输入输出会影响交易大小,比特币的交易费是根据字节收费的,交易尺寸越大越贵,而交易尺寸主要和输入输出的个数有关,也就是说,算法上并不规定输入输出的个数,而只有区块尺寸限制。
在比特币中将小于100kb的交易称为标准交易超过100kb的称为非标准交易。它的前向input以及生成一个out约占用161~250 bytes 。所以在比特币中大约的inputs/ouputs的最大数目限制为 100KB/161B ~= 600个。
## UTXO的特性及缺点
从计算的角度来说UTXO具有非常好的并行支付能力也就是我们上文中所说的如果没有尺寸限制一笔交易可以包含任意笔输入输出同时也没有次序要求在一笔交易中哪一个UTXO在前哪个在后面不影响最终结果。
从存储的角度来说UTXO具有较好的可裁剪特性可裁剪性指的是UTXO类型的交易如果从最老的那一笔UTXO开始截断数据库那么之前的数据可以删除掉了。
如果想进一步压缩数据尺寸,可以在任意位置截断记录UTXO对应的交易哈希即可然后从其他节点获取并校验UTXO这也是SPV轻钱包工作的基础之一。
以太坊中并没有使用比特币的这种UTXO设计这与以太坊的宗旨有关以太坊的目标是构建通用计算而比特币是数字货币需求不同导致设计的不同。
V神指出了UTXO的缺陷一共有三类。
### 1.可表达的状态少 。
UTXO只能是已花费或者未花费状态这就没有给需要任何其它内部状态的多阶段合约或者脚本留出生存空间这也意味着UTXO只能用于建立简单的、一次性的合约UTXO更像是一种二进制控制位。
### 2.区块链盲点Blockchain-blindness
UTXO的脚本只能看到自己这条历史轨迹无法看到区块链的数据的全貌这导致了功能性扩展受到了限制我们在花费比特币的过程中需要小心翼翼的组合UTXO这也导致了系统状态逻辑复杂不适合设计成智能合约的基础结构。
### 3.价值盲点Value-blindness
UTXO脚本不能提供非常精细的金额控制基于账户模型的余额在花费过程中可以任意的按值存取它仅取决于程序能表示的最小精度。
而UTXO要求必须全部移动如果要满足一个目标值金额对组合UTXO算法的要求会比较高采用许多有不同面值的UTXO一方面要求尽可能地精确,另一方面又要求输入输出的数量尽可能的小。
UTXO是比特币上的原生设计在区块链以前是没有这种逻辑数据结构UTXO的出现给了人们看待数据转移的不同视角但UTXO不是所有区块链所必需的公链开发过程中的是否选用UTXO模型可以根据业务场景进行判断。
## 总结
好了今天我们分别介绍了普通账户模型和UTXO模型并从不同角度比较了二者的优劣。
从技术选择上来看,比特币选择UTXO是为了满足支付的安全性以太坊选择普通账户模型是为了智能合约的自由度。
最后留给你一个问题历史上UTXO或账户模型是否引发过比较严重的使用缺陷呢你可以给我留言我们一起讨论感谢你的收听我们下期再见。