編者按
未來第六代無線網絡(6G)需要依賴豐富的數據實現網絡智能化和自動化。為滿足6G對數據管理的需求,基于區塊鏈的去中心化的數據管理被認為是實現跨網絡域的透明數據操作的潛在解決方案之一。然而,在6G網絡中,不斷增加的數據量和嚴格的數據隱私保護需求為平衡基于區塊鏈的去中心化數據管理的透明、效率以及隱私需求帶來巨大的技術挑戰。
中國工程院外籍院士沈學民研究團隊在中國工程院院刊《Engineering》2022年第1期發表《下一代無線網絡中基于區塊鏈的透明數據管理》一文,研究了面向6G的基于區塊鏈的數據管理,強調其去中心化和透明兩大優點。針對識別效率和隱私方面的挑戰,探討了數據管理構架設計、數據管理利益相關者的認證與授權以及基于區塊鏈的數據處理。首先,文章探索區塊鏈的共識協議和可擴展機制,并討論區塊鏈構架下如何管理利益相關者的角色;其次,探討針對數據管理利益相關者的認證與授權需求;再次,歸類數據管理的隱私需求,并研究基于區塊鏈的協同數據處理機制;隨后,從上述三個方面探討面向6G的基于區塊鏈數據管理的研究問題和潛在解決方案;最后,總結并討論了未來的研究方向。
一、引言
無線網絡的普及提供了無處不在的網絡覆蓋和無縫鏈接,這極大地影響了我們的生活和工作方式。伴隨無線網絡的不斷發展,第六代無線網絡(6G)將進一步整合異構接入和網絡切片技術,以支持具有動態服務質量需求的各類服務。更重要的是,網絡智能不僅在改善網絡資源利用方面扮演重要角色,同時在提供定制化服務和提升用戶體驗方面也意義重大。
(一)面向6G的數據管理
豐富的用戶數據和人工智能(AI)技術的進步是面向6G智能的核心。伴隨大量終端設備被部署和連接,無線網絡中的數據量越來越多,規模越來越大。通過基于AI的數據處理,這些大數據對面向6G的高效網絡管理具有重要價值。例如,可以利用不同接入點的用戶軌跡和關聯歷史進行基于AI的網絡流量預測和邊緣內容緩存,以實現動態的網絡資源分配。因此,如何有效且高效地管理用戶數據——數據管理(DM),包括在用戶數據生命周期內從數據生成到刪除的多種數據操作——成為未來網絡智能的關鍵推動因素。然而,6G的高動態性和異構性對數據管理提出四個需求。
(1)去中心化:數據管理需要多方數據利益相關者的協作,包括不同用戶和設備(數據來源)、提供數據收集和傳輸服務的移動運營商以及提供數據存儲和處理服務的技術供應商(如邊緣/云服務提供商)。這些利益相關者通常來自不同的網絡域,他們很難僅通過單一數據管理權威進行協商,達成一致。因此,對于數據利益相關者來說,構建一個可以協同管理用戶數據生命周期事件的去中心化構架十分必要。
(2)透明:由于數據利益相關者之間缺乏相互信任,因此數據管理過程應該是透明且可驗證的。數據擁有者應該知道執行在他們數據上的任何操作。出于管理的目的,參與協作處理數據的利益相關者的“各自的責任”應該被明確界定且透明。
(3)效率:數據管理利益相關者的異構性、不斷增加的用戶數據量和數據生命周期事件的復雜性引發對分布式構架設計、數據管理利益相關者的認證與授權(AA)管理以及數據處理機制三個方面的效率保障的廣泛關注。
(4)隱私:數據管理中的隱私保護涉及數據利益相關者的身份隱私和個人數據的內容機密性。盡管具體的隱私需求隨不同數據操作變化,但最新的隱私規范,比如歐盟通用數據保護規范(GDPR),規定了通用隱私保護條款。例如,用戶可以完全控制對具有其可識別信息的數據的任何操作。此外,應該提前制定用于定義利益相關者責任的數據使用協議并嚴格遵守。
目前,實現滿足效率和隱私需求的去中心化透明數據管理仍然是一個艱巨的任務。
(二)基于區塊鏈的數據管理
區塊鏈由一個存儲點到點(P2P)交易的賬本組成。區塊鏈由網絡分布式節點維護,每個(全)節點維護一個該賬本的拷貝。從功能角度來看,區塊鏈與傳統的分布式數據庫具有一些共同特征,但區塊鏈利用安全共識協議維護互不信任節點的賬本的一致性。此外,區塊鏈利用可編程性和智能合約技術控制賬本更新。
區塊鏈對于面向6G的數據管理是一項潛力十足的技術,因為它滿足其去中心化和透明的需求。首先,數據管理利益相關者可以將區塊鏈作為可信共享存儲來記錄關鍵的數據管理事件。每個數據管理利益相關者都可以維護一個共享賬本的拷貝,無需依賴中心化的實體。其次,共享賬本是透明的,且賬本更新對相關區塊鏈節點是可驗證的。數據管理利益相關者可以設計智能合約進行各種數據操作的協同處理。區塊鏈的優點引發了許多基于區塊鏈數據管理方案的最新討論,這些方案著眼于未來智能網絡以及其他應用,如信息中心網絡、供應鏈管理、物聯網(IoT)和智能醫療。
鑒于區塊鏈的去中心化和透明特性,基于區塊鏈的解決方案可能導致實現數據管理效率和隱私保護需求的復雜性。首先,在區塊鏈節點上進行分布式數據存儲會增加整體存儲開銷。為了維護共享賬本的一致性,數據管理利益相關者通過共識協議進行交易和區塊認證,這可能限制交易的吞吐量,增加數據處理負荷。其次,區塊鏈存儲透明導致鏈上數據對于相關區塊鏈節點是可視的,這與用戶數據的隱私需求相矛盾。為了解決效率和隱私問題,新的基于區塊鏈的數據管理方案設計和實際應用還需要更多的探索。
(三)文章結構
本文中,我們討論面向6G的基于區塊鏈的數據管理。為了解決效率和隱私問題,我們總結了最新的研究進展和潛在解決方案。本文結構如下。
第2節研究針對數據管理的區塊鏈構架設計。我們總結現有的區塊鏈機制,比如高效的共識協議和混合鏈設計。此外,通過對比最新的基于區塊鏈數據管理方案,我們討論數據管理利益相關方如何作為區塊鏈的組成部分。第3節,我們探索基于區塊鏈的認證與授權機制,實現對數據管理利益相關方進行高效且隱私保護的身份管理。第4節,我們探討基于區塊鏈的數據處理機制。在明確基于區塊鏈數據處理的隱私需求后,我們討論鏈上/鏈下計算模型。同時,我們總結具有特定隱私保護需求的數據操作的研究成果,包括數據共享和數據分析。第5節,我們詳細討論基于區塊鏈數據管理的構架設計、認證與授權以及數據處理方面的研究問題和潛在解決方案。最后,我們對本文進行總結并討論未來研究方向。
二、基于區塊鏈數據管理的構架設計
區塊鏈作為去中心化的透明構架可以用于面向6G的數據管理。然而,將區塊鏈作為黑盒應用于數據管理并非易事。首先,區塊鏈的特征是維護分布式節點存儲和狀態更新的一致性。實際應用中,由于節點之間的信任度差異極大,因此區塊鏈可以支持不同的構架以平衡賬本的安全和可擴展性。當區塊鏈應用于數據管理時,有必要區分不同數據管理應用場景的需求。其次,由于參與數據管理的利益相關者的能力和動機各不相同,基于區塊鏈的構架包含各種角色,比如礦工和客戶。但目前如何在區塊鏈中管理數據管理利益相關者的角色仍不清楚。
為了解決這一難題,我們探索兩個基本問題:①適用于數據管理的區塊鏈構架應該是怎樣的?②數據管理利益相關者在該構架中扮演什么角色?我們首先回顧現有的區塊鏈構架在數據管理中的特點,然后討論兩個典型的基于區塊鏈數據管理的應用場景:車聯網(V2X)和云/邊緣計算。
(一)區塊鏈構架
區塊鏈構架可以粗略地分為兩類:非許可鏈和許可鏈。非許可鏈主要由兩類實體組成:礦工和客戶。非許可鏈使用加密貨幣激勵實體在公共網絡中進行自我組織。相反,許可鏈是一種自頂向下的構架,它主要包括三類實體:權威、礦工和客戶。通常情況下,工業組織可以形成聯盟,該聯盟作為許可鏈的控制實體。礦工和客戶在加入區塊鏈之前必須獲得現有聯盟實體的同意。上述兩種構架中,共識機制是維護賬本一致性的基本要素。
在共識協議方面,非許可鏈相較于許可鏈必須抵御更多的惡意參與者。如果擁有絕大多數計算能力的礦工誠實地遵守工作量證明(PoW)共識協議,比特幣中區塊鏈設計已經被證明是安全的。然而,當礦工數量很大時,該構架可能出現低交易吞吐率和高交易確認延遲的問題。許可鏈,比如Hyperledger Fabric,依賴聯盟委員會來提供成員管理和交易驗證服務。這種自頂向下的構架對共識協議限制較少,可以采用實用的拜占庭容錯協議(PBFT)或Raft協議。近來,為了進一步改善區塊鏈可擴展性,新型區塊鏈構架被提出。對于非許可鏈,Prism和OHIE是兩種新型區塊鏈構架,支持并行交易處理。它們將單鏈分解成多鏈,將礦工細分為多個角色以執行不同的任務。
盡管非許可鏈和許可鏈具有不同的性質,但大部分都支持兩個極具吸引力的功能:分布式存儲和智能合約。這意味著,計算機程序可以在分布式環境(區塊鏈)下執行,這使得區塊鏈適用于構建面向6G的數據管理平臺。
(二)基于區塊鏈數據管理的應用場景
下面,我們提出兩個典型的基于區塊鏈數據管理的應用場景:車聯網(V2X)和邊緣/云計算。我們主要關注數據管理利益相關方如何參與維護區塊鏈構架。
1. 車聯網的基于區塊鏈數據管理
車聯網衍生出許多車載應用,比如車載信息娛樂和基于位置的服務。為了為車聯網中的行人和司機提供更加有效且高效的服務,車聯網服務提供商必須協同通信并交換部分用戶隱私信息。然而,該需求在當前車聯網系統中并不容易得到滿足,因為車輛相關數據由車聯網服務提供商獨立管理,且不恰當的數據共享可能導致嚴重的隱私信息泄露,違背隱私規范要求。為了解決這個問題,區塊鏈被引入車聯網系統。這使得大量車聯網服務提供商可以建立去中心化信任。特別是,車輛信息交換可以記錄在區塊鏈上。區塊鏈允許第三方審計員追蹤相關信息流動,預防潛在信息泄露。此外,對于不同的車聯網服務,區塊鏈記錄的信息是不同的。這些信息可能包括車輛保險信息、司機駕照信息、車速和位置等。
一個基本的基于區塊鏈的車聯網包含以下利益相關方:車輛、路側單元(RSU)、基站、服務提供商、邊緣節點和云服務器。對于車聯網服務來說,基于非許可鏈的數據管理構架和基于許可鏈的數據管理構架的最大區別在于構建區塊鏈的利益相關方不同。部分現有方案依靠公有鏈作為車聯網服務的第三方,例如,基于公鑰基礎設施(PKI)的車聯網安全通信方案就依賴于公有鏈平臺。該方案中,車輛和其他利益相關方是以太坊的用戶。它們可以從公有賬本中讀取/寫入信息并觸發已部署的智能合約。這種情況下,原始車聯網的網絡構架及其利益相關方不需要明顯改變,但利益相關方需要與外部公有鏈進行通信。盡管基于非許可鏈的數據管理構架被認為是簡單且有效的,但由于系統可擴展性和隱私方面的要求,無法適用于所有的車聯網服務。非許可鏈平臺是公開的,可以被任意一方訪問。因此,部分數據可以發布在區塊鏈上,如公鑰證書和證書撤銷列表(CRL),而其他數據應該受到保護,如個人駕駛記錄。此外,非許可鏈平臺數據處理延遲高,這使得非許可鏈構架很難適用于對時延要求高的車聯網服務。
為了解決這些問題,許多研究將許可鏈引入車聯網服務。在這些解決方案中,區塊鏈由車聯網利益相關者自己維護。根據車聯網的應用場景,維護區塊鏈的利益相關方可以是車輛、路側單元和云服務器。例如,移動邊緣節點和路側單元可以作為全節點維護許可鏈,因為它們具備強大的計算和存儲能力。車輛通常作為輕節點,因為它們移動性強但資源有限。相較于基于非許可鏈的構架,基于許可鏈的構架通過控制區塊鏈的礦工數量和采用混合共識協議實現更強的可擴展性,其代價是復雜的構架設計和安全模型。具體來說,大多數先進的構架都有一個前提,即車聯網系統中存在根信任權威來初始化系統。
2. 云/邊緣計算的基于區塊鏈數據管理
基于云/邊緣計算的數據管理構架建立在集中模型之上,具體來說,后端云服務提供商整合前端接口(比如移動電話)實現簡單有效的數據處理和數據共享。然而,由于第三方服務提供商缺乏過程的透明性,這種構架對于內部攻擊來說是脆弱的。因此,云/邊緣計算必須有一個更加透明的數據管理框架。該框架中,所有數據處理操作都能被審計,甚至惡意的內部攻擊者可以被檢測到。為了獲得具有監控和審計能力的透明數據管理,區塊鏈可以被引入基于云/邊緣的數據管理架構。
在分層邊緣計算或云際構架中,區塊鏈對于管理多域協作具有很大前景。近來,許多針對云計算的基于區塊鏈數據管理的解決方案被提出,包括基于非許可鏈或許可鏈。一個基本的針對云計算的基于區塊鏈數據管理主要包括以下利益相關方:用戶、云服務器和應用服務提供商,而數據管理操作包括數據審計、數據共享、數據完整性檢測和數據搜索。
大多數基于非許可鏈的云數據管理構架采用外部區塊鏈平臺,因為它們對數據處理的吞吐量和時延沒有很高的要求。區塊鏈主要作為誠信賬本存儲額外信息,而大數據則被存儲在云服務器上。由于在非許可鏈上處理數據代價較高,非許可鏈上不能執行復雜的數據操作,僅可執行輕量級操作,比如數據時間戳和操作記錄追蹤。鏈下數據管理操作僅在執行后被記錄在鏈上。此外,數據加密是保護云存儲數據或區塊鏈存儲數據隱私的通用方法。
針對基于許可鏈的云數據管理架構,區塊鏈由授權的利益相關方管理,比如云服務器、邊緣節點甚至用戶。許可鏈可以提升不同利益相關者的跨域信任。由于許可鏈的鏈上操作開銷較低,因此鏈上可以執行較復雜的數據操作。此外,其數據隱私保護機制不局限于數據加密。由于授權的利益相關者控制鏈上數據,因此它們可以制定鏈上數據的訪問策略。盡管這種構架具有很多優點,但它依賴于作為區塊鏈管理者的授權利益相關者的可信度。如果這些利益相關者信任度下降,那么該構架的安全與隱私不能得到保障。
適用于數據管理的區塊鏈構架如圖1所示?;诓煌墓沧R協議、分布式賬本存儲和智能合約,基于區塊鏈的數據管理支持各種車聯網和云/邊緣應用。表1總結了適用于上述應用場景數據管理的區塊鏈構架。
圖1. 基于區塊鏈的數據管理。PoS:持有量證明;PoA:權威證明;PoET:已用時間證明。
表1基于區塊鏈的數據管理構架——應用場景
三、基于區塊鏈數據管理中的認證和授權
(一)數據管理利益相關者的認證與授權需求
認證與授權是基于區塊鏈數據管理必不可少的組成要素。它解決了數據管理的兩個基本問題:你是誰和你能做什么。首先,數據管理可以有多個參與者,比如用戶、存儲節點和計算節點。認證幫助數據管理系統確認數據管理利益相關者的身份和準確的角色。其次,根據各自的角色,數據管理利益相關者被授以可執行的操作,比如讀取數據和修改數據狀態。除了上述基本功能,認證與授權還可以進一步幫助數據管理利益相關者建立安全機密的通信信道。此外,在任何爭議中,基于認證與授權的不可否認性是確定數據管理利益相關者責任的關鍵。
面向6G的基于區塊鏈數據管理對認證與授權機制提出了新的需求。
(1)分布式管理:由于不存在單一權威,數據管理的認證與授權機制應該由一組權威以透明的方式執行。
(2)效率和隱私:由于數據管理利益相關者的角色可以動態變化,因此基于區塊鏈的認證與授權機制應該支持高效的證書更新和撤銷。同時,為了實現條件的隱私保護,必要情況下,數據管理利益相關者的真實身份應該對特定應用場景保密。接下來,我們討論現有的實現了透明、高效且隱私保護的基于區塊鏈數據管理的認證與授權的研究工作。
(二)基于區塊鏈的認證與授權
在復雜的數據管理環境中,不同利益相關者都可以為其用戶生成身份,為對應數據操作進行授權,如圖2所示。這種模型中,由于利益相關者之間信息交換頻繁,需要實現跨域認證與授權。但每個利益相關者都有自己的證書管理權威(CA),因此協同證書管理可能成為一個難題。部分利益相關者可能存在安全隱患,進而發布或使用假證書進行數據操作。為了減少跨域認證與授權的管理開銷和安全風險,可以引入一個管理者進行集中身份管理,比如單一登入服務提供商,如圖2所示。然而,該模型需要數據管理利益相關者協商出統一的管理者,這在6G中并不總是適用。如圖3所示,基于區塊鏈的去中心化身份管理,可以使利益相關者以透明的分布式的方式協同管理用戶身份、認證用戶和更新授權策略。具體來說,區塊鏈由聯盟委員會管理,它可以為外部服務提供商提供認證與授權服務。即使部分利益相關者存在安全隱患,對所有鏈上的成員更新和撤銷操作仍然可追蹤和可負責。
圖2. 身份管理的演變——從獨立到去中心化。(a)數據管理中的獨立管理;(b)數據管理中的集中式身份管理;(c)數據管理中的去中心化身份管理。
圖3. 基于區塊鏈的認證與授權的一般過程。
目前,已經有大量研究運用區塊鏈增強認證與授權系統。相較于傳統的基于證書的認證與授權機制,基于區塊鏈的機制被提出,以保證基于區塊鏈數據管理的證書透明和撤銷透明。具體來說,證書權威向利益相關者和用戶發布證書,同時一組利益相關者在公有鏈上更新自己的證書。鏈上證書的有效性不僅依賴于證書權威的安全,也依賴于這組利益相關者,大多數利益相關者必須是誠實的。除了關注證書透明,其他工作將區塊鏈視為公開的、不可更改的證書生成、更新和撤銷日志服務器,以解決利益相關者之間認證與授權管理的審計問題。
與基于證書的認證與授權系統相反,自主身份管理是一種基于區塊鏈的身份管理機制。具體來說,該機制代替了依靠證書權威管理用戶身份,用戶自己可以通過區塊鏈創建、存儲、轉發和撤銷自己的身份證書。這種方式大大降低單一權威的單點故障風險。為了實現細粒度的數據訪問控制,區塊鏈可以結合基于屬性的認證與授權機制,如基于屬性的加密(ABE),將用戶屬性嵌入賬本或智能合約中。用戶通過自身屬性可以訪問數據,取回解密密鑰。此外,區塊鏈結合變色龍哈希函數可以實現區塊鏈中的動態屬性更新。
區塊鏈在管理用戶身份方面具有很大優勢,它可以滿足數據管理的不同安全屬性。然而,區塊鏈也可能導致隱私問題,因為所有存儲在區塊鏈上的信息都是透明的。因此,基于區塊鏈的認證與授權方案可以結合隱私保護機制為數據管理提供隱私保護。其中,假名化是一個基本的機制。每個用戶都可以為了認證與授權保留大量假名。區塊鏈數據共享系統Ghostor隱藏了用戶身份,但允許用戶對遠程存儲數據進行完整性驗證。匿名可以通過“匿名分布式共享能力”技術實現。由于假名被用戶存儲在本地,如果數據較大時,管理將會很困難,因此考慮采用其他機制來保護基于區塊鏈數據管理的用戶身份隱私,比如群簽名和環簽名。通過群/環簽名生成的用戶的匿名身份可以被存儲在用戶端,用于跨應用的認證與授權。這種身份隱私保護機制已經被一些區塊鏈平臺所采用,如Moreno。
群/環簽名方案是在Fiat-Shamir方法的基礎上建立的,它可以用于區塊鏈上的自主身份管理。匿名證書可以被授予不同的等級,從而激發更多的數據管理應用[69]。在這種情況下,該方案不僅可以保護身份隱私,也可以履行追蹤惡意用戶的責任。例如,在某些嚴格的條件下,基于區塊鏈的認證與授權方案可以追蹤用戶身份。單個或多個利益相關者可以利用零知識證明技術為其用戶生成匿名證書。當用戶表現出惡意行為時,利益相關者可以相應地追蹤其身份。通過這種方式,隱私和問責需求同時得到滿足。針對區塊鏈的基于屬性的訪問控制,通用的隱私保護方法是通過設計屬性隱藏的基于屬性的加密方案隱藏訪問策略。該方法不同于以往的機制,它保護的是數據屬性和策略而非用戶身份。
四、基于區塊鏈數據管理中的數據處理
數據處理指在數據生命周期內的一系列操作。在基于區塊鏈的數據管理中,我們主要關注需要與多個數據管理利益相關者交互的數據操作,包括數據共享和協同數據分析。本節中,我們首先討論一般隱私保護模型和計算模型的需求。針對這些需求,我們總結關于基于區塊鏈的數據共享和數據分析的現有工作。
(一)隱私需求和隱私模型
針對在區塊鏈數據管理中的數據處理,一般的隱私需求是控制數據泄露。具體來說,數據泄露可以由以下問題描述。
(1)數據的敏感性怎么樣?首先,根據應用程序的不同,數據的敏感性可能存在很大差異。例如,金融應用中的用戶身份數據具有較高的機密性,任何身份數據泄露都可能導致經濟損失。其次,數據敏感性隨數據量變化。例如,單次用戶位置暴露可能導致的損失是有限的,但用戶位置的持續暴露可能揭露用戶的日常生活規律。再次,數據敏感性隨時間變化。許多類型的數據,比如法律文件,存在“密封期”。數據在“密封期”內不應該被暴露。“密封期”結束后,該數據可以被公眾或特定群體訪問。
(2)數據泄露給誰?數據處理可能涉及各種各樣的實體,它們可以被粗略地分為內部/外部參與者和區塊鏈。內部參與者指參與數據處理的數據管理利益相關者。相反,外部參與者指不參與數據處理的實體,如外部攻擊者。在基于區塊鏈的數據管理中,區塊鏈的參與者具有共享視野。對此,區塊鏈可以被看成一個用于數據公開的特殊實體。
從上述兩個問題出發,基于區塊鏈數據管理的隱私需求可以被劃分為四個等級。
(1)來自用戶匿名的隱私:數據處理前,要求將用戶身份信息從數據庫中分離出來。然而,具有強知識背景的數據處理器(比如,執行數據處理操作的實體)極有可能從數據庫中恢復出用戶身份信息。
(2)對外部參與者保密:敏感性較低的數據可以被數據處理器以明文的形式處理,但是不能暴露給外部參與者。該需求依賴于數據處理器的可信度。
(3)對內部參與者保密:對于敏感性高的數據,數據處理過程應該盡可能少地向數據處理器暴露信息,包括數據內容、用戶身份和數據訪問模式。
(4)對區塊鏈保密:敏感數據不應該直接存儲在區塊鏈上。類似地,敏感數據操作不應該被智能合約執行。
在基于區塊鏈的數據管理中,不同數據管理應用的隱私需求會隨著數據敏感性和數據利益相關者的角色發生顯著變化。因此,GDPR沒有規定具體的隱私需求,而是定義一般性原則。具體來說,它要求用戶能夠完全控制自身數據上的數據管理操作。
內部參與者,比如數據管理者和數據處理器,必須與用戶就數據使用規則達成一致,并在數據處理過程中嚴格遵守該協議。同時,禁止向外部參與者共享未經授權的數據。
由于隱私需求有時是模糊的,因此必須設計隱私模型。隱私模型可以幫助用戶、數據管理系統設計者和監管者以可執行和可實現的方式理解隱私規范。數據流圖是一種優秀的數據管理建模方法。數據流圖與軟件工程中的過程流程圖類似,它可以整合GDPR元素和數據生命周期事件。不同于基于數據生命周期事件的模型,數據管理利益相關者的資源和能力需求可以被用于實現符合GDPR的數據管理。此外,基于區塊鏈的數據管理中,可以采用可執行隱私模型自動管理智能合約涉及的云數據操作。
(二)效率需求和計算模型
關于區塊鏈數據管理中的數據共享和數據分析,一個簡單的方法是一切存儲和計算都在鏈上進行。這意味著,需要將整個數據庫存儲在區塊鏈上,并通過智能合約進行數據處理。這需要驚人的存儲空間,并且會給區塊鏈參與者帶來沉重的計算負荷。為了解決這個問題,可以引入鏈下存儲/計算節點。它們可以更高效地存儲和處理數據,并僅將關鍵信息上傳到區塊鏈上。這一范式被稱為鏈上/鏈下模型。
對于一般的鏈上/鏈下模型,外部數據存儲提供商可以將數據的散列值存儲在區塊鏈上。由于鏈上的散列值不能被修改,因此該模型可以確保所有鏈下數據存儲的完整性。此外,該方法還可以避免將隱私數據直接暴露在區塊鏈上。散列法依賴于外部數據存儲提供商的可信的數據操作。在基于區塊鏈的數據管理中,允許為存儲提供商設置更弱的安全假設,為驗證鏈下數據操作的正確性設計更靈活的鏈上驗證系統。例如,多個數據記錄的聚合可以通過鏈下云服務器計算,然后僅將可驗證的計算結果發送至區塊鏈。下面我們討論關于構建鏈上/鏈下模型的相關研究工作。鏈上/鏈下模型的主要需求是具備可驗證的鏈下執行,可以通過零知識簡潔的非交互式證明(SNARG)和可信執行環境(TEE)構建鏈上/鏈下模型。
在SNARG系統中,證明者可以說服驗證者,使其相信存在一個適用于公共關系的秘密。這種關系可以用代數電路表示,用于一般可驗證計算。
SNARG的驗證過程是高效的,并且該過程不會直接暴露計算的輸入和輸出,可以做到隱私保護。因此,SNARG被廣泛地應用于為基于區塊鏈的數據管理構建鏈上/鏈下計算模型。其驗證效率的代價是公共參數的可信建立和證明者的昂貴計算開銷。因此,有必要為SNARG合理地設置通用的或可更新的公共參數,或者使用安全多方計算協議為SNARG系統生成公共參數。此外,針對惡意的內部參與者,SNARG無法保證數據隱私。數據處理器必須能夠訪問原始數據,這對于數據管理應用來說并不總是可行。
可驗證執行環境(TEE),比如英特爾軟件防護擴展(SGX),提供了另一種證明計算的方法。TEE中,代碼在執行之前被加載到一個安全的enclave,enclave是具有受保護內存的安全硬件。為了保證加載的代碼和數據可信,SGX提供遠程證明服務,即TEE生成一個對遠程證明服務的證明請求,以保證代碼執行的完整性和準確性。不同于SNARG,TEE不需要公共參數的可信建立,它可以更高效地生成計算證明。因此,TEE作為一個可信且被認證的鏈下計算單元,可以協助設計鏈上/鏈下計算模型。此外,通過集成密鑰管理器,基于TEE的解決方案可以在enclave和外部環境之間實現經過認證和加密的通信,從而抵御惡意的數據處理器,提供隱私保護。然而,TEE在實際應用中存在一些挑戰:首先,TEE的全面的形式化安全分析仍處于討論中;其次,遠程證明很大程度上依賴于服務提供商,該服務提供商可能是區塊鏈環境中的單一信任節點。
除了使用SNARG或TEE證明計算結果以外,也可以使用博弈論在多個鏈下資源提供者之間建立競爭關系,以達到消除欺騙的目的。例如,給兩個云服務器分配相同的計算任務。通過設置適當的金錢獎勵和懲罰,可以激勵兩個云服務器正確地完成計算任務。
(三)基于區塊鏈的數據處理機制
基于SNARG/TEE/雙服務器模型的鏈上/鏈下模型為數據處理任務提供了一般性解決方法。然而,對于特定的任務,需要特殊的設計策略(如新型數據結構)以滿足隱私和效率需求。
1. 數據共享
在基于區塊鏈的數據管理中收集和存儲數據時,數據共享和數據交易對于支持數據密集型應用來說十分重要。
使用不同的技術可以實現數據共享不同的隱私需求。數據擁有者和接收者的身份隱私可以通過假名或基于群簽名的匿名證書實現。數據加密機制和密鑰管理技術可以用于保護鏈上數據的機密性。對于數據共享中的細粒度訪問控制,可以使用基于屬性的加密和功能加密。數據加密密鑰或密文可以決定訪問策略。不同于基于加密密鑰管理的方法,信任評價管理也可以集成到數據共享中。在信任評價管理中,數據發送者和接收者可以評價數據共享過程。累計評價分數可以作為訪問評估的標準。例如,研究者為邊緣數據共享設計了一種協作證明共識協議。該協議中,基于協作的名譽被量化。近來,研究者也在考慮數據共享中GDPR需求。具體來說,一個基于區塊鏈的解決方案可以使用戶完全控制自己的個人數據,這滿足基于許可的數據管理的GDPR需求。
數據擁有者經常將自身數據外包給第三方存儲提供商,比如云服務器,依賴存儲提供商管理自身數據。在這種模型中,區塊鏈可以作為數據共享過程中的可信審計者。為了降低數據擁有者的密鑰管理開銷,可以采用一個可信的密鑰管理器進行數據加密和解密。門限密碼,如(t,n) Paillier密碼(其中,t是閾值,n是共享秘密的數量)可以用于保護云存儲數據和區塊鏈共享數據。與此同時,必須安全地選擇一組委員會成員進行密鑰管理。區塊鏈可以用于管理云存儲上的數據修改,修改過程由信任權威(TA)和智能合約共同完成。
除了數據共享,數據交易可以進一步挖掘數據價值。比如,有研究者提出了一種適用于金融機構的基于區塊鏈的身份交換方案。該方案中,SNARG以一種隱私保護的方式證明身份的真實性。TEE則可以用于建立一個數據交易平臺,該平臺既維護買賣雙方的公平性,又保障鏈上數據處理的隱私。
2. 數據分析
區塊鏈可以支持智能6G中的各種數據分析任務。有研究提出一種基于區塊鏈的學習框架,它結合Paillier門限算法實現模型參數更新的安全計算。另一種重要的數據分析機制是支持靈活的查詢。對于存儲在區塊鏈上的數據,查詢應該是高效的,其正確性可以被低代價的方式驗證,其中,針對區塊間或跨區塊查詢,可以生成認證的數據結構。為了維護區塊鏈上的數據隱私,可以使用可搜索加密鏈上的數據,然后構建智能合約進行索引查詢,其查詢結果可驗證。當搜索基于位置的數據時,可以建立基于范圍的可搜索索引。當數據存儲在鏈下時,數據擁有者可以通過SNARG或密碼累加器建立數據索引的鏈上認證系統。通過這種方法,查詢操作可以在鏈下執行,查詢結果可以在鏈上認證。結合數據庫查詢技術可以支持更多可驗證的查詢。
由于區塊鏈的透明性和不可變性,它本質上可以作為一個日志系統。這意味著,存儲在區塊鏈上的數據可以用于事件驅動的系統調試和分析。為了支持細粒度的數據溯源操作,可以在原始區塊鏈數據的基礎上建立數據索引。同時,可以利用區塊鏈為數據管理構建日志系統。已有研究提出輕量級的區塊鏈日志記錄機制,該機制采用一種面向數據密集型應用的新型日志存儲結構。為了實現跨鏈通信,跨鏈互操作性得到了進一步研究。相較于直接將區塊鏈應用于日志存儲,鏈下存儲敏感日志數據可以減少鏈上開銷,防止隱私泄露。特別是,有研究團隊提出的一種物聯網數據溯源方案。利用SNARG可以將溯源數據簡潔地存儲在每個網絡管理員處,同時結合簡潔的區塊鏈認證系統進行跨域網絡溯源查詢。密碼累加器可以作為單獨的日志服務器為正確的日志更新提供證明,正如文獻[114]中關于證書透明的討論一樣。表2總結了基于區塊鏈的隱私保護數據處理的相關工作。
表2區塊鏈中的隱私保護數據處理概要
NA: not applicable.
五、研究問題和潛在解決方案
盡管基于區塊鏈的解決方案對于研究面向6G的數據管理具有很大的潛力,但仍存在許多尚未解決的研究挑戰。本節中,我們從三個方面詳細討論基于區塊鏈數據管理的研究問題和潛在解決方案,包括基于區塊鏈數據管理的構架設計、認證與授權以及數據處理。
(一)基于區塊鏈數據管理的構架設計
雖然目前已經有許多針對數據管理的區塊鏈構架,但大多數都是為應用設計的,而且與數據管理構架設計相關的各種挑戰仍然存在,如下所示。
(1)激勵和管理機制設計:非許可鏈對參與者采用金錢激勵,而許可鏈則依賴于聯盟委員會管理程序。事實上,面向6G的數據管理利益相關者是高度異構的,它們可以擁有不同的能力、利益考慮和管理架構。因此,如何為基于非許可鏈的數據管理設計激勵機制,以及為基于許可鏈的數據管理設計管理規則仍然是一個具有挑戰性的問題。多項技術,如博弈論和門限密碼,可以被用于提供有效的群體和組織行為管理。
(2)區塊鏈構架與網絡切片:網絡功能虛擬化(NFV)支持在通信網絡中相同物理基礎設施下的資源靈活共享。NFV被認為將在未來無線網絡中扮演重要角色。在NFV中,一個網絡切片可以包含來自多個物理資源提供商的一組虛擬化功能。網絡切片可以由本地或集中式軟件定義網絡(SDN)控制器管理,這使得數據管理變得更加復雜。為了管理虛擬化的網絡功能中的數據流動,數據管理構架設計應該考慮新的6G利益相關者角色,比如第三方資源提供商和基于云的切片管理者。隨著支持NFV的6G業務模式和實施細節在未來變得更加清晰,它們對數據管理構架設計的影響值得被進一步研究。
(3)混合區塊鏈構架設計:針對數據管理的區塊鏈構架是基于許可鏈或非許可鏈設計的。這兩種構架都具有自身的優勢與劣勢,它們的核心組成部分是共識協議,共識協議影響系統的安全和可擴展性。為了在滿足安全需求的情況下進一步提高系統可擴展性,應該采用靈活的混合區塊鏈構架,該構架支持根據數據管理中的不同應用需求切換共識協議。此外,由于區塊鏈在面向6G的數據管理的新信息基礎設施中發揮著關鍵作用,因此區塊鏈可以成為提供插件式數據管理構架設計的一種潛在解決方案,該框架集成了新興技術,如輕量級客戶和無狀態區塊鏈。
(4)高效的跨鏈互操作與隱私保護:當前的數據管理構架僅基于單個賬本設計,沒有充分考慮跨鏈互操作。對于多個應用的數據管理,可采用異構區塊鏈構架。每個應用都可以構建自己的子鏈,管理自己的數據,實現隱私保護。這種方式與許可鏈中的秘密信道概念類似。未來需要進一步研究支持高效的跨鏈互操作的新型數據管理區塊鏈構架,尤其是從隱私保護的角度出發。分層的區塊鏈構架可以提供不同的共識協議,實現跨鏈通信管理。此外,還可以設置跨鏈操作的代理節點。通過對代理節點的身份管理,促使跨鏈通信安全進行。
(二)基于區塊鏈數據管理的認證與授權
盡管基于區塊鏈的認證與授權機制有許多優點,但也帶來了一些有待解決的效率和隱私問題。
(1)輕量級的認證與授權:基于區塊鏈的認證與授權方案和傳統的認證與授權方案的主要不同點在于用戶僅需上傳必要信息至區塊鏈就可以自主維護身份信息。在多個利益相關者共存的復雜數據管理構架中,具有有限計算能力和存儲能力的用戶可能在不同的應用場景中擁有不同的身份證書。與此同時,區塊鏈的存儲資源和計算資源十分昂貴。因此,如何實現基于區塊鏈的輕量級身份管理成為面向6G的數據管理的重要課題。一個可能的解決方案是利用外部證書服務器進行證書管理。為了使用戶能夠完全控制自己的證書,還應該實現額外的安全保障,如基于密碼累加器的可驗證證書更新和基于TEE的證書管理。
(2)分布式認證與授權和動態更新:為了進一步消除對單一實體的信任需求,關鍵的認證與授權操作應該由一組密鑰管理器執行,比如分布式證書分發和撤銷。這種模式涉及密鑰管理器之間的大量通信,并且需要有效的激勵機制來管理它們的行為。
門限密碼可以用于降低密鑰管理器的計算負荷。同時,密鑰管理器的成員資格可以隨時間變化,因此需要經常更新。當密鑰管理器集發生變化時,應該保證身份證書的前向安全和后向安全。這意味著,如何實現安全高效的密鑰管理器更新成為一個具有挑戰性的問題。一個潛在的解決方案是主動秘密共享技術。該方案中,密鑰管理器之間的共享秘密可以經常更新。關鍵的管理操作也可以在安全的硬件執行環境下進行。
(3)平衡認證與授權中的隱私和責任:數據管理中的身份隱私可以有細粒度的分級,僅在隱私規范的要求下顯示必要的身份信息,如組織成員資格和利益相關者屬性。對于不同的數據管理應用場景,靈活的隱私保護建模可以結合智能合約來實現認證與授權中的隱私管理。然而,在面向6G的數據管理中,身份隱私保護不應該是無條件的。當發生爭議時,基于區塊鏈的認證與授權機制應該能恢復利益相關者的真實身份,這可以通過門限加密技術實現。在這種情況下,需要一個明確的標準用于決定恢復利益相關者身份的條件和方式。可以使用專門的監督框架設計一個分層的身份管理委員會。
(三)基于區塊鏈數據管理中的數據處理
目前,對于基于區塊鏈的數據管理已經有了廣泛研究,包括基于SNARG/TEE的通用計算解決方案以及針對數據共享和數據分析的專門設計。然而,對于面向6G的基于區塊鏈的數據管理,如何平衡功能、效率和隱私的問題,仍然存在以下技術挑戰。
(1)鏈上過程設計:區塊鏈為數據管理利益相關者提供一個可信賴的數據管理過程的共享視角。由于鏈上的存儲和計算資源有限且可能導致的隱私問題,數據管理利益相關者必須謹慎決定共享什么信息。應該共享和不應該共享的信息可能存在非常細微的差別,這些信息可能包含用于完整性驗證的原始數據散列值、數據管理生命周期事件的日志或者僅僅是數據管理操作的存在證明??紤]到效率和隱私問題,應該只共享關鍵信息,而且這些信息應該選擇性地暴露給必要參與者。同時,也存在鏈上數據需要被移除的情況??删庉媴^塊鏈技術是處理該情況的一種潛在方案。
(2)隱私模型設計:基于區塊鏈的數據管理因其在各種應用中的異構的動態的參與者而變得復雜,這可能導致隱私需求快速變化。因此,應考慮在隱私規范下進行隱私建模和評估,以便在區塊鏈上實現靈活的隱私管理。
(3)數據處理的模塊化設計:許多現有設計可以為不同數據管理操作提供隱私保護。例如,SNARG可以支持實現簡潔的鏈上可驗證的一般代數計算,TEE可以高效地進行可驗證哈希計算,可搜索加密可以為不同的查詢操作提供專門的設計。事實上,一個數據管理實例可能導致多個數據操作,基于單一技術的解決方案不能同時滿足效率和隱私需求。模塊化設計策略是一個潛在的解決方法,它將數據操作,如關鍵字查詢和身份管理,通過不同技術進行有效實例化。該策略需要全面了解不同的可驗證計算系統的特點。通用的可組合安全模型可以用于分析系統安全。
(4)自動化VS透明與責任:隱私保護條款規定,用戶有權反對關于自身數據的自動決策,這可能與區塊鏈自動化特性和基于AI的決策相違背。然而,對于基于區塊鏈數據管理中的AI輔助決策過程,通常很難實現透明和問責。一個可能的解決方案是設計高效的算法直接評估自動化過程的輸出。同時,應該向用戶明確解釋自動過程對用戶數據的影響,并授予用戶反對的權利,以防范隱私問題。對于協同數據處理,重要的是通過建立數據管理操作溯源機制和取證機制,實現對所涉及的數據管理利益相關者進行聯合管理。
六、結論
本文中,我們研究了面向6G的基于區塊鏈的數據管理,強調其去中心化和透明兩大優點。針對識別效率和隱私方面的挑戰,我們專注于探討數據管理構架設計、數據管理利益相關者的認證與授權以及基于區塊鏈的數據處理。
為了探索在基于區塊鏈的去中心化數據管理中平衡透明、效率和隱私要求的潛在解決方案,以下問題值得進一步研究。①可以討論網絡虛擬化對數據管理構架設計的影響?;趨^塊鏈的數據管理需要一個靈活且通用的構架,該構架具有高效的共識協議、鏈間可操作性和快速的面向服務的配置。②需要進一步設計可動態更新的輕量級分布式認證與授權機制,從而在基于區塊鏈數據管理的認證與授權中,取得隱私和安全的平衡。③應該實現一個滿足不同數據管理操作中的隱私需求的可執行隱私模型,并在該隱私模型下探討隱私保護的數據處理技術的模塊化集成。
-
數據管理
+關注
關注
1文章
290瀏覽量
19609 -
無線網絡
+關注
關注
6文章
1426瀏覽量
65889 -
區塊鏈
+關注
關注
110文章
15560瀏覽量
105802
原文標題:下一代無線網絡中基于區塊鏈的透明數據管理丨Engineering
文章出處:【微信號:CloudBrain-TT,微信公眾號:云腦智庫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論