此文我們會深入討論以太坊數據存儲層。我們會介紹區塊鏈“狀態”的概念。同時也會討論Patricia前綴樹結構背后的理論,使用谷歌的leveldb數據庫演示以太坊前綴樹的具體實現。
在存儲層中,我們存儲的是什么?
首先我們需要理解為了讓區塊鏈系統運行,我們需要存儲的東西。讓我們簡單地看下關于Alice給Bob轉賬10美金的例子。
我們可以看出,通過執行轉賬可以改變其中的狀態。
我們必須要追蹤余額以及不同人(狀態)的其他細節,還有在區塊鏈之間發生的細節(轉賬)。不同的平臺會有不同地處理方法。我們可以看出,比特幣和以太坊是如何處理的。
比特幣
比特幣的狀態是通過UTXO來實現的。比特幣價值轉移是通過轉賬實現的。更特別地是,比特幣用戶可以通過創建轉賬花費1個或多個UTXO,并且將他們的UTXO作為轉賬輸入。
UTXO模型讓比特幣和以太坊不同。我們可以看這些例子來理解其中的區別。
首先,比特幣UTXO不能部分花費。如果比特幣用戶花費0.5個比特幣(使用他們僅有的UTXO,價值1比特幣),他們需要特意地發回0.5個比特幣。如果他們不發送這部分,那么這個0.5比特幣就會丟失,并且給到挖出轉賬的礦工。
其次,在最基本的層面,比特幣沒有包含用戶賬戶余額。通過比特幣,用戶可以簡單地持有私鑰,在任何時間點都可以進行一個或者多個UTXO。數字錢包看起來像是讓比特幣區塊鏈能夠自動地存儲和管理用戶賬戶余額,其實不是這樣。
比特幣的UTXO系統工作的很好,這是由于數字錢包能夠完成大多數轉賬任務。其中包括,但是不限于:
a) 處理UTXO
b) 存儲秘鑰
c) 設置轉賬費用
d) 提供返回地址
e)描述UTXO狀態(展示可行性,待轉賬以及全部的余額)
UTXO模型中的轉賬可以類比為紙幣轉賬。每個賬戶都會追蹤錢包添加的賬單(UTXO)。當我們想要花錢的時候,我們會使用一個或者多個賬單(現在的UTXO),這已經足夠來承擔花銷,或許還會得到一些找零。(新的UTXO)。每個賬單只能花費一次,一旦消費,UTXO就會從資金池移走。
總結下來,我們知道:
? 比特幣區塊鏈不會持有賬戶余額
? 的秘鑰
? 如果包含在轉賬中,完整的UTXO會被消費(有時候,部分會得到新的UTXO作為找零)
以太坊
和以上的信息相反,以太坊的狀態能夠管理賬戶余額,以及更多信息。以太坊的狀態并不是個抽象的概念。它是以太坊底層協議的部分。根據黃皮書中的描述,以太坊是一個基于轉賬的狀態機器;基于狀態機器的轉賬技術能夠被創建。
我們從頭開始來講述。和其他區塊鏈一樣,以太坊區塊鏈也是從創世區塊開始的。從那時候起,例如轉賬,合約和挖礦之類的事情,都會陸續改變以太坊區塊鏈的狀態。在以太坊中,舉例來說就是賬戶余額(存儲在狀態樹中),這會隨著轉賬而改變,同時和賬戶相關連。
重要地是,例如賬戶余額之類的數據并不是直接存儲在以太坊區塊鏈的區塊中。只有根節點哈希的轉賬,狀態數據和回執數據是直接存儲在區塊鏈上的。可以根據下圖看出。
也許你也注意到了,從上面的圖表中,存儲樹的根節點哈希(所有的智能合約數據存儲在其中)其實都是指向狀態樹的,從而指向區塊鏈。接下來,我們會討論更多細節。
以太坊中有兩種不同的數據類型:永久數據和暫時數據。永久數據的例子就是轉賬。一旦轉賬確認,就會在區塊鏈中記錄;然后就再也不可以更改。暫時數據的例子就是特定以太坊賬戶地址的余額。賬戶的余額就會存儲在狀態樹中,并且當有特定賬戶轉賬的時候,就會改變。永久數據是有意義的,就好像挖礦轉賬,暫時數據,就例如賬戶余額,應該被分開存儲。以太坊會使用數據樹結構來管理數據。
以太坊的數據記錄就好像在銀行。類似使用ATM機器和存儲卡。銀行會追蹤每個借記卡來確保在在完成轉賬之前,有足夠的余額。
UTXO和賬戶方案之間的對比
UTXO模型的好處:
? 擴容性 – 因為可以同時處理多個UTXO,所以能夠完成同步轉賬并且鼓勵擴容創新。
? 隱私 – 盡管比特幣并是不完全的匿名系統,但是UTXO可以提供更高層次的隱私性,只要用戶使用為每個轉賬提供新的地址。如果有需要提高隱私性,更多復雜的結構,例如環形結構,也可以考慮使用。
賬戶/余額模式的好處:
? 簡單化- 以太坊使用的模型,可以幫助開發者來進行復雜的智能合約,特別是需要狀態信息或者包含多方的。
舉例來說,追蹤狀態的智能合約,并且基于它處理不同的任務。UTXO的無狀態模型會讓轉賬包含狀態信息,而且這也不必要地符合合約的設計。
? 效率- 除了簡單化,賬戶/余額模型更加有效,因為每個轉賬都只需要來驗證發出金額的賬戶是否有足夠的余額來支付轉賬。
賬戶/余額模型的缺陷是雙花攻擊。可以增加遞增的隨機數來抵消這種類型的攻擊。在以太坊中,每個賬戶都有空開可見的隨機數,每次進行轉賬的時候,隨機數就會增加。這可以幫助防止同樣的轉賬會進行兩次。(注意,這個隨機數并不是工作量證明中的隨機數,這是個隨機數字)
和大多數計算機架構相同,這兩個模型都有自己的好處和壞處。有些區塊鏈,例如超級賬本,也應用了UTXO,因為他們從比特幣區塊鏈中獲得創新。接下來,我們來看看更多的基于這兩個模型的技術。
以太坊中的數據樹結構是什么?
我們來深入看看,狀態,存儲和轉賬的樹結構是怎樣的。
狀態前綴樹- 是唯一和獨特的。
在以太坊中,只有唯一的網絡狀態前綴樹。
這個網絡狀態前綴樹會實時更新。
網絡狀態前綴樹包含秘鑰和每個賬戶的價值對,這些是在以太坊網絡上。
秘鑰是單個160字節的認證器(以太坊賬戶的地址)。
網絡狀態前綴樹的“數值”是通過對以太坊賬戶以下賬戶細節的編譯得出的:
-隨機數
-余額
-storageRoot
-codeHash
狀態前綴樹的根節點(某個時間點,整個網絡狀態前綴樹的哈希)是用來保證狀態前綴樹的安全和唯一;網絡狀態前綴樹根節點是基于整個內部網絡狀態前綴樹數據進行加密。
存儲前綴樹,智能合約數據存儲的地方
存儲前綴樹是智能合約數據存儲的地方。每個以太坊賬戶都有自己的存儲前綴樹。存儲前綴樹根節點是256字節的哈希值,作為storageRoot的數值存儲在網絡狀態前綴樹。
轉賬前綴樹- 每個區塊都有一個
每個以太坊區塊都有自己獨立的轉賬前綴樹。一個區塊會包含很多轉賬。區塊中的轉賬順序當然是由礦工來決定的。對于轉賬前綴樹中的特殊轉賬路徑,是通過這個轉賬在區塊中的位置因子。挖礦區塊不會更新;轉賬在區塊中的位置不會改變。這意味著一旦你在區塊轉賬前置樹中定位了轉賬,你可以返回到同樣的路徑來獲得同樣的結果。
分析以太坊數據庫
在以太坊區塊鏈中,有很多的MPT(Merkle Patricia Tries)(代表每個區塊):
? 狀態前綴樹
? 存儲前綴樹
? 轉賬前綴樹
? 回執前綴樹
為了得到某個特定區塊中的MPT,我們需要獲得它的跟哈希,作為參考。以下的命令可以讓我們獲得狀態,轉賬和創世區塊中回執的根哈希。
注意:如果你想得到最新區塊(而不是創世區塊)的根哈希,請使用以下命令。
安裝npm,節點,level和ethereumjs
我們會使用nodejs,level和ethereumjs 的結合來檢測leveldb數據庫。以下的命令可以幫助我們準備測試環境。
cd ~
sudo apt-get update
sudo apt-get upgrade
curl -sL https://deb.nodesource.com/setup_9.x | sudo -E bash - sudo apt-get install -y nodejs
sudo apt-get install nodejs
npm -v
nodejs -v
npm install levelup leveldown rlp merkle-patricia-tree --save
git clone https://github.com/ethereumjs/ethereumjs-vm.git
cd ethereumjs-vm
npm install ethereumjs-account ethereumjs-util --save
從這時候開始,運行以下代碼會得到以太坊賬戶秘鑰(會存儲在以太坊網絡的狀態根部)。代碼和以太坊leveldb數據庫連接,進入以太坊的狀態(從區塊鏈的區塊中使用stateRoot數值),并且然后可以使用秘鑰進入到以太坊網絡中的所有賬戶。
//Just importing the requirements
var Trie = require(‘merkle-patricia-tree/secure’);
var levelup = require(‘levelup’);
var leveldown = require(‘leveldown’);
var RLP = require(‘rlp’);
var assert = require(‘assert’);
//Connecting to the leveldb database
var db = levelup(leveldown(‘/home/timothymccallum/gethDataDir/geth/chaindata’));
//Adding the “stateRoot” value from the block so that we can inspect the state root at that block height.
var root = ‘0x8c77785e3e9171715dd34117b047dffe44575c32ede59bde39fbf5dc074f2976’;
//Creating a trie object of the merkle-patricia-tree library
var trie = new Trie(db, root);
//Creating a nodejs stream object so that we can access the data
var stream = trie.createReadStream()
//Turning on the stream (because the node js stream is set to pause by default)
stream.on(‘data’, function (data){
//printing out the keys of the “state trie”
console.log(data.key);
});
有趣地是,一旦轉賬發生了,以太坊中的賬戶只是添加到狀態樹中(和那個特定賬戶相關的)。例如,使用“geth account new”創建新的賬戶不會包含在狀態樹中包含那個賬戶;甚至在很多區塊被挖出后。但是,如果成功的轉賬(花費燃料費并且已經包含在挖礦區塊)是記錄在賬戶中,然后只有它會出現在狀態樹中。這是很聰明的邏輯,因為會保護欺詐者無法連續創建新的賬戶以及使得狀態樹堵塞。
對數據解碼
你已經注意到,查詢leveldb可以回復解碼的結果。這是由于,以太坊使用了自己特定的“修改版的MPT(Merkle Patricia Trie)”,用來和leveldb進行交互。以太坊Wiki提供了設計和部署以太坊MPT(Merkle Patricia Trie)和RLP(Recursive Length Prefix)解碼的信息。簡單地說,以太坊已經在前綴樹數據結構擴展。例如,修改版的MPT(Merkle Patricia Trie)包含一種通過“extension”節點,來創建快捷方式的方法。
在以太坊中,單個的修改版的MPT(Merkle Patricia Trie)節點是:
? 空的字節(對應NULL)
? 包含17個對象的數組(對應分支)
? 包含2個對象的數組(對應樹葉)
? 包含2個對象的數組(對應擴展)
以太坊前綴樹是通過固定的規則來設計和創建的,最好的檢測方法是使用電腦代碼。接下來的例子使用了ethereumjs。Ethereumjs很容易安裝和使用;它是完美地可以快速對接到以太坊leveldb數據庫。
下面的代碼(當提供一個特定的區塊stateRoot以及以太坊賬戶地址)會以可讀的形式返回賬戶的正確余額。
//Mozilla Public License 2.0
//As per https://github.com/ethereumjs/ethereumjs-vm/blob/master/LICENSE
//Requires the following packages to run as nodejs file https://gist.github.com/tpmccallum/0e58fc4ba9061a2e634b7a877e60143a
//Getting the requirements
var Trie = require(‘merkle-patricia-tree/secure’);
var levelup = require(‘levelup’);
var leveldown = require(‘leveldown’);
var utils = require(‘ethereumjs-util’);
var BN = utils.BN;
var Account = require(‘ethereumjs-account’);
//Connecting to the leveldb database
var db = levelup(leveldown(‘/home/timothymccallum/gethDataDir/geth/chaindata’));
//Adding the “stateRoot” value from the block so that we can inspect the state root at that block height.
var root = ‘0x9369577baeb7c4e971ebe76f5d5daddba44c2aa42193248245cf686d20a73028’;
//Creating a trie object of the merkle-patricia-tree library
var trie = new Trie(db, root);
var address = ‘0xccc6b46fa5606826ce8c18fece6f519064e6130b’;
trie.get(address, function (err, raw) {
if (err) return cb(err)
//Using ethereumjs-account to create an instance of an account
var account = new Account(raw)
console.log(‘Account Address: ’ + address);
//Using ethereumjs-util to decode and present the account balance
console.log(‘Balance: ’ + (new BN(account.balance)).toString());
})
結論
我們已經表現出以太坊有能力來管理狀態。這種超前的設計有很多好處。
可移動性
假設移動設備和物聯網設備是很普遍的,未來電商就取決于安全,穩定和快速的移動應用。
我們認知到了可移動性的優勢,我們也知道區塊鏈大小的逐漸增加是難以置信的。將整個區塊鏈存儲在移動設備是不可能的。
快速,并且不會損失安全性
以太坊狀態的設計以及對于修改版的MPT(Merkle Patricia Trie)的使用,提供了很多機會。以太坊前綴樹上的每個功能都使用了加密哈希。而且,前綴樹根據節點的特殊加密哈希可以用來證明前綴樹沒有被欺詐。
例如,任何對于前綴樹的修改,都會完全改變根部哈希。這個加密功能會為輕客戶端提供一個機會(那些沒有存儲整個區塊鏈的設備),從而可以快速地訪問區塊鏈。也就是說,賬戶“0x … 4857”是否有足夠的資金來完成對于區塊高度“5044866”的轉賬?
速度限制
以太坊描述了個很有趣的問題,就是存儲賬戶的概念。想象這種場景,兩個用戶都可以每天從賬戶中拿出全部余額的1%。這個觀點只在未來規劃中提到,但是它卻獲得了很多興趣,因為理論上來說,它可以作為以太坊基礎協議層的一部分(和必須要作為第二層和第三方錢包相反)。也許你想起了我們之前討論的比特幣UTXO。UTXO對于區塊鏈數據是盲目的,比特幣區塊鏈沒有存儲用戶的賬戶余額。因此,比特幣的底層協議層基本上不可能完成任何類型的每日速度限制。
消費者的信心
我們看到了關于輕客戶端的很多開發,更為特別地是,安全、穩定、快速的移動應用,可以和區塊鏈技術交互。
電子商務的區塊鏈成功部署,一定會支持速度,安全和可用性。這能夠提高消費者的信心,同時也通過聰明的設計,提供更高的可用性,安全性和性能,進而提高了主流的接受能力。
評論
查看更多