精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Julia語言進(jìn)行基于同態(tài)加密數(shù)據(jù)機器學(xué)習(xí)的全過程

倩倩 ? 來源:機器之心Pro ? 2020-04-15 16:25 ? 次閱讀

最近,「區(qū)塊鏈」、「聯(lián)邦學(xué)習(xí)」等概念受到了空前的關(guān)注。而在這些概念背后,少不了一項技術(shù)的影子——「同態(tài)加密」。本文介紹了使用 Julia 語言進(jìn)行基于同態(tài)加密數(shù)據(jù)機器學(xué)習(xí)的全過程,對于入門者具有極大的參考價值。

注意:本文討論了最前沿的密碼學(xué)技術(shù),旨在提供一種利用「Julia Computing」進(jìn)行研究的視角。請不要將文中的任何示例用于生產(chǎn)應(yīng)用程序。在使用密碼學(xué)之前一定要咨詢專業(yè)的密碼學(xué)專家。

引言

假設(shè)你開發(fā)了一個酷炫的新機器學(xué)習(xí)模型,現(xiàn)在你想將部署該模型,為用戶提供服務(wù)。應(yīng)該怎么做呢?最簡單的方法可能是直接把模型發(fā)布給用戶,然后讓他們使用自己的數(shù)據(jù)在本地運行這個模型。但這種方法存在一些問題:

機器學(xué)習(xí)模型一般都很大,而用戶的設(shè)備實際上可能沒有足夠的存儲空間或算力來運行模型機器學(xué)習(xí)模型一般都會頻繁地更新,你可能不會想在網(wǎng)絡(luò)上頻繁傳輸這么大的模型開發(fā)機器學(xué)習(xí)模型需要大量時間和計算資源,你可能會想通過向使用該模型的用戶收費來收回成本

接下來,常用的解決方案是將模型作為應(yīng)用程序接口(API)在云上公開。在過去幾年間,這些「機器學(xué)習(xí)即服務(wù)」產(chǎn)品如雨后春筍般涌現(xiàn),每個主要的云平臺都會為企業(yè)級開發(fā)者提供這樣的服務(wù)。

但這類產(chǎn)品的潛在用戶所面對的困境也是顯而易見的——處理用戶數(shù)據(jù)的遠(yuǎn)程服務(wù)器可能并不可信。這樣就會存在明確的倫理和法律的分歧,從而限制這種解決方案的有效范圍。在受監(jiān)管的產(chǎn)業(yè)(尤其是醫(yī)療業(yè)和金融業(yè))中,一般是不允許將病患或金融數(shù)據(jù)發(fā)送給第三方進(jìn)行處理的。我們可以做得更好嗎?

事實證明,我們可以!最近,密碼學(xué)方面取得的突破可以在無需進(jìn)行解密的情況下,直接計算加密數(shù)據(jù)。在我們的例子中,用戶可以將加密數(shù)據(jù)(例如圖像)傳遞給云 API,以此運行機器學(xué)習(xí)模型,并返回加密的答案。整個過程中都沒有解密用戶數(shù)據(jù),尤其是云服務(wù)商既不能訪問原始圖像,也不能解碼計算得到的預(yù)測值。這是怎么做到的呢?本文通過構(gòu)建一個進(jìn)行加密圖像的手寫識別(來自 MNIST 數(shù)據(jù)集)的機器學(xué)習(xí)模型為大家揭秘背后的原理。

同態(tài)加密(Homomorphic Encryption,HE)的一般解釋

一般而言,對加密數(shù)據(jù)進(jìn)行計算的能力被稱為「安全計算」,這是一個相當(dāng)大的研究領(lǐng)域,針對大量不同的場景要用不同的密碼學(xué)方法和技術(shù)解決問題。在本例中,我們將關(guān)注所謂的「同態(tài)加密」技術(shù)。在同態(tài)加密系統(tǒng)中,我們一般要進(jìn)行以下操作:

pub_key, eval_key, priv_key = keygen()encrypted = encrypt(pub_key, plaintext)decrypted = decrypt(priv_key, encrypted)encrypted′ = eval(eval_key, f, encrypted)

前三步非常直觀,之前使用過任何非對稱加密技術(shù)的人都會對此感到很熟悉(就像通過安全傳輸層協(xié)議(TLS)連接到本文)。最后一步才是神奇之處。它使用加密數(shù)據(jù)評估了 f,并返回了另一個與基于加密值評估 f 的結(jié)果對應(yīng)的加密值。這一性質(zhì)正是我們將這種技術(shù)稱為「同態(tài)加密」的原因。評估操作與下面的加密操作等價:

f(decrypt(priv_key, encrypted)) == decrypt(priv_key, eval(eval_key, f, encrypted))

(同樣地,可以基于加密值評估任意的同態(tài) f)

支持哪些函數(shù) f 取決于加密方案和支持的運算。如果只支持一種函數(shù) f(比如 f=+),我們可以將這種加密方案稱為「部分同態(tài)」。如果 f 是可以建立任意電路的完整的門的集合,如果電路大小有限,稱之為「有限同態(tài)」(Somewhat Homomorphic Encryption, SHE);如果電路大小不受限制,稱之為「全同態(tài)」(Fully Homomorphic Encryption, FHE)。一般可以通過自助法(bootstrapping),將「有限」同態(tài)轉(zhuǎn)換為「全」同態(tài),但這個問題已經(jīng)超過了本文所討論的內(nèi)容。

全同態(tài)加密是最近的研究,Craig Gentry 在 2009 年發(fā)表了第一個可行(但不實際)的方。現(xiàn)在陸續(xù)出現(xiàn)了一些更新也更實際的 FHE 方案。更重要的是,還有一些可以高效地實現(xiàn)這一方案的軟件包。最常用的兩個軟件包是 Microsoft SEAL和 PALISADE。此外,我最近還開源了這些算法的 Julia 實現(xiàn)(https://github.com/JuliaComputing/ToyFHE.jl)。出于我們的目的,我們將使用后者中實現(xiàn)的 CKKS 加密。

高級 CKKS

CKKS(以 Cheon-Kim-Kim-Song 的名字命名,他在 2016 年的論文「Homomorphic Encryption for Arithmetic of Approximate Numbers」提出)是一種同態(tài)加密方案,可以對以下基本操作進(jìn)行同態(tài)評估:

長度為 n 的復(fù)數(shù)向量的對應(yīng)元素相加長度為 n 的復(fù)數(shù)向量的對應(yīng)元素相乘向量中元素的旋轉(zhuǎn)(通過循環(huán)移位實現(xiàn))向量元素的復(fù)共軛

這里的參數(shù) n 取決于需要的安全性和準(zhǔn)確性,該值一般都比較高。在本例中,n=4096(值越高越安全,但是計算開銷也更大,時間復(fù)雜度大致會縮放為 nlog^n)。

此外,用 CKKS 計算是有噪聲的。因此,計算結(jié)果一般都只是近似值,而且要注意確保評估結(jié)果足夠準(zhǔn)確,不會影響結(jié)果的正確性。

也就是說,對機器學(xué)習(xí)程序包的開發(fā)者而言,這些限制并不罕見。像 GPU 這樣有特殊用途的加速器,也可以處理數(shù)字向量。同樣,許多開發(fā)者會因算法選擇的影響、多線程等原因,認(rèn)為浮點數(shù)噪聲太多(我要強調(diào)的是,有一個關(guān)鍵的區(qū)別是,浮點算法本身是確定性的,盡管因為實現(xiàn)的復(fù)雜性,它有時不會展現(xiàn)出這種確定性,但 CKKS 原語的噪聲真的很多,但這也許可以讓用戶意識到噪聲并沒有第一次出現(xiàn)時那么可怕)。

考慮到這一點,我們再看看如何在 Julia 中執(zhí)行這些運算(注意:這里有一些非常不安全的參數(shù)選擇,這些操作的目的是說明這個庫在交互式解釋器(REPL)中的用法)。

julia》 using ToyFHE# Let‘s play with 8 element vectorsjulia》 N = 8;# Choose some parameters - we’ll talk about it laterjulia》 = NegacyclicRing(2N, (40, 40, *40*))/(x + 1)# We‘ll use CKKS julia》 params = CKKSParams()CKKS parameters# We need to pick a scaling factor for a numbers - again we’ll talk about that laterjulia》 Tscale = FixedRational{2^40}FixedRational{1099511627776,T} where T# Let‘s start with a plain Vector of zerosjulia》 plain = CKKSEncoding{Tscale}(zero())8-element CKKSEncoding{FixedRational{1099511627776,T} where T} with indices 0:7:0.0 + 0.0im0.0 + 0.0im0.0 + 0.0im0.0 + 0.0im0.0 + 0.0im0.0 + 0.0im0.0 + 0.0im0.0 + 0.0im# Ok, we’re ready to get started, but first we‘ll need some keysjulia》 kp = keygen(params)CKKS key pairjulia》 kp.privCKKS private keyjulia》 kp.pubCKKS public key# Alright, let’s encrypt some things:julia》 foreach(i-》plain[i] = i+1, 0:7); plain8-element CKKSEncoding{FixedRational{1099511627776,T} where T} with indices 0:7:1.0 + 0.0im2.0 + 0.0im3.0 + 0.0im4.0 + 0.0im5.0 + 0.0im6.0 + 0.0im7.0 + 0.0im8.0 + 0.0imjulia》 c = encrypt(kp.pub, plain)CKKS ciphertext (length 2, encoding CKKSEncoding{FixedRational{1099511627776,T} where T})

# And decrypt it againjulia》 decrypt(kp.priv, c)8-element CKKSEncoding{FixedRational{1099511627776,T} where T} with indices 0:7:0.9999999999995506 - 2.7335193113350057e-16im1.9999999999989408 - 3.885780586188048e-16im3.000000000000205 + 1.6772825551165524e-16im4.000000000000538 - 3.885780586188048e-16im4.999999999998865 + 8.382500573679615e-17im6.000000000000185 + 4.996003610813204e-16im7.000000000001043 - 2.0024593503998215e-16im8.000000000000673 + 4.996003610813204e-16im# Note that we had some noise. Let‘s go through all the primitive operations we’ll need:julia》 decrypt(kp.priv, c+c)8-element CKKSEncoding{FixedRational{1099511627776,T} where T} with indices 0:7:1.9999999999991012 - 5.467038622670011e-16im3.9999999999978817 - 7.771561172376096e-16im6.00000000000041 + 3.354565110233105e-16im8.000000000001076 - 7.771561172376096e-16im9.99999999999773 + 1.676500114735923e-16im12.00000000000037 + 9.992007221626409e-16im14.000000000002085 - 4.004918700799643e-16im16.000000000001346 + 9.992007221626409e-16imjulia》 csq = c*cCKKS ciphertext (length 3, encoding CKKSEncoding{FixedRational{1208925819614629174706176,T} where T})julia》 decrypt(kp.priv, csq)8-element CKKSEncoding{FixedRational{1208925819614629174706176,T} where T} with indices 0:7:0.9999999999991012 - 2.350516767363621e-15im3.9999999999957616 - 5.773159728050814e-15im9.000000000001226 - 2.534464540987068e-15im16.000000000004306 - 2.220446049250313e-15im24.99999999998865 + 2.0903753311370056e-15im36.00000000000222 + 4.884981308350689e-15im49.000000000014595 + 1.0182491378134327e-15im64.00000000001077 + 4.884981308350689e-15im

這很簡單!敏銳的讀者可能已經(jīng)注意到了 csq 和之前的密文看起來有點不同。尤其是,它是「長度為 3」的密文,范圍也更大。要說明它們是什么,以及它們是做什么用的有點太過復(fù)雜。我只想說,在進(jìn)一步計算之前,我們要得讓這些值降下來,否則我們會盡密文中的「空間」。幸運的是,有一種方法可以解決這兩個問題:

# To get back down to length 2, we need to `keyswitch` (aka# relinerarize), which requires an evaluation key. Generating# this requires the private key. In a real application we would# have generated this up front and sent it along with the encrypted# data, but since we have the private key, we can just do it now.julia》 ek = keygen(EvalMultKey, kp.priv)CKKS multiplication keyjulia》 csq_length2 = keyswitch(ek, csq)CKKS ciphertext (length 2, encoding CKKSEncoding{FixedRational{1208925819614629174706176,T} where T})

# Getting the scale back down is done using modswitching.julia》 csq_smaller = modswitch(csq_length2)CKKS ciphertext (length 2, encoding CKKSEncoding{FixedRational{1.099511626783e12,T} where T})

# And it still decrypts correctly (though note we‘ve lost some precision)julia》 decrypt(kp.priv, csq_smaller)8-element CKKSEncoding{FixedRational{1.099511626783e12,T} where T} with indices 0:7:0.9999999999802469 - 5.005163520332181e-11im3.9999999999957723 - 1.0468514951188039e-11im8.999999999998249 - 4.7588542623100616e-12im16.000000000023014 - 1.0413447889166631e-11im24.999999999955193 - 6.187833723406491e-12im36.000000000002345 + 1.860733715346631e-13im49.00000000001647 - 1.442396043149794e-12im63.999999999988695 - 1.0722489563648028e-10im

此外,modswitching(模轉(zhuǎn)換:modulus switching 的簡寫)減少了密文模的大小,所以我們不能無限地這么做下去。(用上文提到的術(shù)語來說,我們在這里使用的是 SHE 方案):

julia》 # Remember the ring we initially created/(x + 1)julia》 ToyFHE.ring(csq_smaller) # It shrunk!/(x + 1)

我們要做的最后一步運算是:旋轉(zhuǎn)。就像上文的密鑰轉(zhuǎn)換(KeySwitching),在這里也需要評估密鑰(也稱為伽羅瓦(galois)密鑰):

julia》 gk = keygen(GaloisKey, kp.priv; steps=2)CKKS galois key (element 25)julia》 decrypt(circshift(c, gk))decrypt(kp, circshift(c, gk))8-element CKKSEncoding{FixedRational{1099511627776,T} where T} with indices 0:7:7.000000000001042 + 5.68459112632516e-16im8.000000000000673 + 5.551115123125783e-17im0.999999999999551 - 2.308655353580721e-16im1.9999999999989408 + 2.7755575615628914e-16im3.000000000000205 - 6.009767921608429e-16im4.000000000000538 + 5.551115123125783e-17im4.999999999998865 + 4.133860996136768e-17im6.000000000000185 - 1.6653345369377348e-16im# And let’s compare to doing the same on the plaintextjulia》 circshift(plain, 2)8-element OffsetArray(::Array{Complex{Float64},1}, 0:7) with eltype Complex{Float64} with indices 0:7:7.0 + 0.0im8.0 + 0.0im1.0 + 0.0im2.0 + 0.0im3.0 + 0.0im4.0 + 0.0im5.0 + 0.0im6.0 + 0.0im

好了,我們已經(jīng)了解了同態(tài)加密庫的基本用法。在思考如何用這些原語進(jìn)行神經(jīng)網(wǎng)絡(luò)推斷之前,我們先觀察并訓(xùn)練我們需要使用的神經(jīng)網(wǎng)絡(luò)。

機器學(xué)習(xí)模型

如果你不熟悉機器學(xué)習(xí)或 Flux.jl 機器學(xué)習(xí)庫,我建議你先快速閱讀一下 Flux.jl 文檔或我們在 JuliaAcademy 上發(fā)布的免費機器學(xué)習(xí)介紹課程,因為我們只會討論在加密數(shù)據(jù)上運行模型所做的更改。

我們將以 Flux 模型空間中卷積神經(jīng)網(wǎng)絡(luò)的例子為出發(fā)點。在這個模型中,訓(xùn)練循環(huán)、數(shù)據(jù)預(yù)處理等操作都不變,只是輕微地調(diào)整模型。我們要用的模型是:

functionreshape_and_vcat(x) lety=reshape(x, 64, 4, size(x, 4)) vcat((y[:,i,:] for i=axes(y,2))。..) endendmodel = Chain( # First convolution, operating upon a 28x28 image Conv((7, 7), 1=》4, stride=(3,3), x-》x.^2), reshape_and_vcat, Dense(256, 64, x-》x.^2), Dense(64, 10),)

該模型與「安全外包矩陣的計算及其在神經(jīng)網(wǎng)絡(luò)上與應(yīng)用」(Secure Outsourced Matrix Computation and Application to Neural Networks)文中所用的模型基本相同,它們用相同的加密方案演示了相同的模型,但有兩個區(qū)別:(1)他們加密了模型而我們(為簡單起見)沒有對模型加密;(2)我們在每一層之后都有偏置向量(這也是 Flux 的默認(rèn)行為),我不確定這種行為對本文評估的模型是否是這樣。也許是因為(2),我們模型的準(zhǔn)確率才略高(98.6% vs 98.1%),但這也可能僅僅是因為超參數(shù)的差異。

「x.^2」激活函數(shù)也是一個不尋常的特征(對那些有機器學(xué)習(xí)背景的人來說)。這里更常用的選擇可能是「tanh」、「relu」或者其他更高級的函數(shù)。然而,盡管這些函數(shù)(尤其是 relu)可以更容易地評估明文值,但評估加密數(shù)據(jù)的計算開銷則相當(dāng)大(基本上是評估多項式近似值)。幸運的是,「x.^2」可以很好地滿足我們的目的。

其余的訓(xùn)練循環(huán)基本上是相同的。我們從模型中刪除了「softmax」,取而代之的是「logitcrossentropy」損失函數(shù)(當(dāng)然也可以保留它,在客戶端解密后再評估「softmax」)。訓(xùn)練模型的完整代碼見 GitHub,在近期發(fā)布的 GPU 上只需要幾分鐘就可以完成訓(xùn)練。

代碼地址:https://github.com/JuliaComputing/ToyFHE.jl/blob/master/examples/encrypted_mnist/train.jl

高效地計算

好了,現(xiàn)在已經(jīng)明確了我們需要做什么,接下來看看我們要做哪些運算:

卷積 元素平方 矩陣乘法

我們在上文中已經(jīng)看到了,元素平方操作是很簡單的,所以我們按順序處理剩下的兩個問題。在整個過程中,假設(shè)批處理大小(batch size)為 64(你可能注意到了,我們有策略地選擇模型參數(shù)和批處理大小,從而充分利用 4096 元素向量的優(yōu)勢,這是我們從實際的參數(shù)選擇中得到的)。

卷積

讓我們回顧一下卷積是如何工作的。首先,取原始輸入數(shù)組中的一些窗口(本例中為 7*7),窗口中的每個元素跟卷積掩模的元素相乘。然后移動窗口(本例中步長為 3,所以將窗口移動 3 個元素)。重復(fù)這個過程(用相同的卷積掩模)。下面的動畫說明了以(2,2)的步長進(jìn)行 3*3 卷積的過程(藍(lán)色數(shù)組是輸入,綠色數(shù)組是輸出)。

另外,我們將卷積分成 4 個不同的「通道」(這意味著用不同的卷積掩模,將卷積又重復(fù)了 3 次)

好了,現(xiàn)在我們已經(jīng)知道了要做什么,接下來考慮一下該如何實現(xiàn)。幸運的是,卷積是我們模型中的第一步運算。因此,可以在加密數(shù)據(jù)之前(無需模型權(quán)重)先在客戶端上預(yù)處理,來節(jié)省一些工作。具體而言,我們將執(zhí)行以下操作:

預(yù)先計算每個卷積窗口(即從原始圖像中提取 7*7 的窗口),從每個輸入圖像中得到 64 個 7*7 的矩陣(注意要在步長為 2 的情況下得到 7*7 的窗口,要評估 28*28 的輸入圖像的話,要計算 8*8 的卷積窗口) 將每個窗口中的相同位置收集到一個向量中,即對每張圖來說,都會有包含 64 個元素的向量,或當(dāng)批處理大小為 64 時,會得到 64*64 的元素向量(即,共有 49 個 64*64 的矩陣) 加密

然后卷積就變成了整個矩陣和適當(dāng)掩碼元素的標(biāo)量乘法,對這 49 個元素求和,得到了卷積的結(jié)果。這個方案是這樣實現(xiàn)的(在明文上):

function public_preprocess(batch) ka = OffsetArray(0:7, 0:7) # Create feature extracted matrix I = [[batch[i′*3 .+ (1:7), j′*3 .+ (1:7), 1, k] for i′=ka, j′=ka] for k = 1:64] # Reshape into the ciphertext I = [[I[k][l.。.][i,j] for k=1:64, l=product(ka, ka)] for i=1:7, j=1:7]endI = public_preprocess(batch)# Evaluate the convolutionweights = model.layers[1].weightconv_weights = reverse(reverse(weights, dims=1), dims=2)conved = [sum(I[i,j]*conv_weights[i,j,1,channel] for i=1:7, j=1:7) for channel = 1:4]conved = map(((x,b),)-》x .+ b, zip(conved, model.layers[1].bias))

這樣的實現(xiàn)(對維度重新排序的模)給出了相同的答案,但是用了這樣的操作:

model*.*layers[*1*](batch)

加入加密操作后,我們得到:

I = public_preprocess(batch)C_I = map(I) do Iij plain = CKKSEncoding{Tscale}(zero(plaintext_space(ckks_params))) plain 。= OffsetArray(vec(Iij), 0:(N÷2-1)) encrypt(kp, plain)endweights = model.layers[1].weightconv_weights = reverse(reverse(weights, dims=1), dims=2)conved3 = [sum(C_I[i,j]*conv_weights[i,j,1,channel] for i=1:7, j=1:7) for channel = 1:4]conved2 = map(((x,b),)-》x .+ b, zip(conved3, model.layers[1].bias))conved1 = map(ToyFHE.modswitch, conved2)

注意,由于權(quán)重是公開的,所以不需要密鑰轉(zhuǎn)換,因此沒有擴展密文的長度。

矩陣乘法

接下來看看矩陣乘法是如何實現(xiàn)的。我們利用這樣的事實——可以旋轉(zhuǎn)向量中的元素,來重排序乘法索引。特別是,要考慮向量中矩陣元素的行優(yōu)先排序。然后,如果以行大小的倍數(shù)移動向量,就可以得到列旋轉(zhuǎn)的效果,這可以提供充足的原語來實現(xiàn)矩陣乘法(至少是方陣)。我們不妨試一下:

function matmul_square_reordered(weights, x) sum(1:size(weights, 1)) do k # We rotate the columns of the LHS and take the diagonal weight_diag = diag(circshift(weights, (0,(k-1)))) # We rotate the rows of the RHS x_rotated = circshift(x, (k-1,0)) # We do an elementwise, broadcast multiply weight_diag .* x_rotatedendendfunction matmul_reorderd(weights, x) sum(partition(1:256, 64)) dorange matmul_square_reordered(weights[:, range], x[range, :]) endendfc1_weights = model.layers[3].Wx = rand(Float64, 256, 64)@assert (fc1_weights*x) ≈ matmul_reorderd(fc1_weights, x)

當(dāng)然,對于一般的矩陣乘法,我們可能需要更好的方法,但是在本例中,現(xiàn)在這種程度就已經(jīng)足夠了。

優(yōu)化代碼

至此,我們設(shè)法將所有內(nèi)容整合在一起,而且也確實奏效了。這里提供了代碼作為參考(省略了參數(shù)選擇等設(shè)置):

ek = keygen(EvalMultKey, kp.priv)gk = keygen(GaloisKey, kp.priv; steps=64)I = public_preprocess(batch)C_I = map(I) do Iij plain = CKKSEncoding{Tscale}(zero(plaintext_space(ckks_params))) plain 。= OffsetArray(vec(Iij), 0:(N÷2-1)) encrypt(kp, plain)endweights = model.layers[1].weightconv_weights = reverse(reverse(weights, dims=1), dims=2)conved3 = [sum(C_I[i,j]*conv_weights[i,j,1,channel] for i=1:7, j=1:7) for channel = 1:4]conved2 = map(((x,b),)-》x .+ b, zip(conved3, model.layers[1].bias))conved1 = map(ToyFHE.modswitch, conved2)Csqed1 = map(x-》x*x, conved1)Csqed1 = map(x-》keyswitch(ek, x), Csqed1)Csqed1 = map(ToyFHE.modswitch, Csqed1)function encrypted_matmul(gk, weights, x::ToyFHE.CipherText) result = repeat(diag(weights), inner=64).*x rotated = x for k = 2:64 rotated = ToyFHE.rotate(gk, rotated) result += repeat(diag(circshift(weights, (0,(k-1)))), inner=64) .* rotated end resultendfq1_weights = model.layers[3].WCfq1 = sum(enumerate(partition(1:256, 64))) do (i,range) encrypted_matmul(gk, fq1_weights[:, range], Csqed1[i])endCfq1 = Cfq1 .+ OffsetArray(repeat(model.layers[3].b, inner=64), 0:4095)Cfq1 = modswitch(Cfq1)Csqed2 = Cfq1*Cfq1Csqed2 = keyswitch(ek, Csqed2)Csqed2 = modswitch(Csqed2)function naive_rectangular_matmul(gk, weights, x) @assert size(weights, 1) 《 size(weights, 2) weights = vcat(weights, zeros(eltype(weights), size(weights, 2)-size(weights, 1), size(weights, 2))) encrypted_matmul(gk, weights, x)endfq2_weights = model.layers[4].WCresult = naive_rectangular_matmul(gk, fq2_weights, Csqed2)Cresult = Cresult .+ OffsetArray(repeat(vcat(model.layers[4].b, zeros(54)), inner=64), 0:4095)

雖然代碼看起來不是很清晰,但是如果你已經(jīng)進(jìn)行到這一步了,那你就應(yīng)該理解這個流程中的每一步。

現(xiàn)在,把注意力轉(zhuǎn)移到可以讓這一切更好理解的抽象上。我們先跳出密碼學(xué)和機器學(xué)習(xí)領(lǐng)域,考慮編程語言設(shè)計的問題。Julia 可以實現(xiàn)強大的抽象,我們可以利用這一點構(gòu)建一些抽象。例如,可以將整個卷積提取過程封裝為自定義數(shù)組類型:

using BlockArrays“”“ ExplodedConvArray{T, Dims, Storage} 《: AbstractArray{T, 4}Represents a an `nxmx1xb` array of images, but rearranged into aseries of convolution windows. Evaluating a convolution compatiblewith `Dims` on this array is achievable through a sequence ofscalar multiplications and sums on the underling storage.”“”struct ExplodedConvArray{T, Dims, Storage} 《: AbstractArray{T, 4} # sx*sy matrix of b*(dx*dy) matrices of extracted elements # where (sx, sy) = kernel_size(Dims) # (dx, dy)=output_size(DenseConvDims(。..)) cdims::Dims x::Matrix{Storage} function ExplodedConvArray{T, Dims, Storage}(cdims::Dims, storage::Matrix{Storage}) where {T, Dims, Storage} @assert all(==(size(storage[1])), size.(storage)) new{T, Dims, Storage}(cdims, storage) endendBase.size(ex::ExplodedConvArray) = (NNlib.input_size(ex.cdims)。.., 1, size(ex.x[1], 1))function ExplodedConvArray{T}(cdims, batch::AbstractArray{T, 4}) where {T} x, y = NNlib.output_size(cdims) kx, ky = NNlib.kernel_size(cdims) stridex, stridey = NNlib.stride(cdims) kax = OffsetArray(0:x-1, 0:x-1) kay = OffsetArray(0:x-1, 0:x-1) I = [[batch[i′*stridex .+ (1:kx), j′*stridey .+ (1:ky), 1, k] for i′=kax, j′=kay] for k = 1:size(batch, 4)] I = [[I[k][l.。.][i,j] for k=1:size(batch, 4), l=product(kax, kay)] for (i,j) in product(1:kx, 1:ky)]

ExplodedConvArray{T, typeof(cdims), eltype(I)}(cdims, I)endfunction NNlib.conv(x::ExplodedConvArray{《:Any, Dims}, weights::AbstractArray{《:Any, 4}, cdims::Dims) where {Dims《:ConvDims} blocks = reshape([ Base.ReshapedArray(sum(x.x[i,j]*weights[i,j,1,channel] for i=1:7, j=1:7), (NNlib.output_size(cdims)。..,1,size(x, 4)), ()) for channel = 1:4 ],(1,1,4,1)) BlockArrays._BlockArray(blocks, BlockArrays.BlockSizes([8], [8], [1,1,1,1], [64]))end

注意,如原始代碼所示,這里用 BlockArrays 將 8*8*4*64 的數(shù)組表示成 4 個 8*8*1*64 的數(shù)組。所以現(xiàn)在,我們已經(jīng)得到了第一個步驟更好的表征(至少是在未加密數(shù)組上):

julia》 cdims = DenseConvDims(batch, model.layers[1].weight; stride=(3,3), padding=(0,0,0,0), dilation=(1,1))DenseConvDims: (28, 28, 1) * (7, 7) -》 (8, 8, 4), stride: (3, 3) pad: (0, 0, 0, 0), dil: (1, 1), flip: falsejulia》 a = ExplodedConvArray{eltype(batch)}(cdims, batch);julia》 model(a)10×64 Array{Float32,2}:[snip]如何將這種表征帶入加密的世界呢?我們需要做兩件事:如何將這種表征帶入加密的世界呢?我們需要做兩件事:

1. 我們想以這樣的方式加密結(jié)構(gòu)體(ExplodedConvArray),以致于對每個字段(field)都能得到一個密文。然后,通過查詢該函數(shù)在原始結(jié)構(gòu)上執(zhí)行的操作,在加密的結(jié)構(gòu)體上進(jìn)行運算,并直接進(jìn)行相同的同態(tài)操作。

2. 我們希望攔截某些在加密的上下文中以不同方式執(zhí)行的操作。

幸運的是 Julia 提供了可以同時執(zhí)行這兩個操作的抽象:使用 Cassette.jl 機制的編譯器插件。它是如何起作用的,以及如何使用它,都有些復(fù)雜,本文中不再深入介紹這部分內(nèi)容。簡言之,你可以定義上下文(即「Excrypted」,然后定義在這樣的上下文中,運算是如何起作用的規(guī)則)。例如,第二個要求可以寫成:

所有這一切的最終結(jié)果是,用戶可以以最少的手工工作,寫完整個內(nèi)容:

當(dāng)然,就算經(jīng)過了以上處理,代碼也不是最優(yōu)的。加密系統(tǒng)的參數(shù)(例如 環(huán),什么時候模轉(zhuǎn)換,什么時候密鑰轉(zhuǎn)換等)表現(xiàn)出了在答案的準(zhǔn)確性、安全性以及性能之間的取舍,而且參數(shù)很大程度上取決于正在運行的代碼。一般來說,人們希望編譯器能分析將要運行的加密代碼,為給定的安全等級和所需精度提出參數(shù)建議,然后用戶以最少的人工操作來生成代碼。

結(jié)語

對于任何系統(tǒng)來說,安全地自動執(zhí)行任意計算都是一項艱巨的任務(wù),但 Julia 的元編程功能和友好的語法都讓它成為合適的開發(fā)平臺。RAMPARTS 系統(tǒng)已經(jīng)做了一些嘗試,將簡單的 Julia 代碼編譯到 PALISADE FHE 庫中。「Julia Computing」正在與 RAMPARTS 背后的專家在 Verona 平臺上合作,最近已經(jīng)發(fā)布了下一代版本。在過去的一年中,同態(tài)加密系統(tǒng)的性能才達(dá)到能以實際可用的速度評估有趣計算的程度。一扇嶄新的大門就此打開。隨著算法、軟件和硬件的進(jìn)步,同態(tài)加密必然會成為保護(hù)數(shù)百萬用戶隱私的主流技術(shù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3174

    瀏覽量

    48720
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8378

    瀏覽量

    132425
  • 加密數(shù)據(jù)
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    6446
收藏 人收藏

    評論

    相關(guān)推薦

    自然語言處理與機器學(xué)習(xí)的區(qū)別

    在人工智能的快速發(fā)展中,自然語言處理(NLP)和機器學(xué)習(xí)(ML)成為了兩個核心的研究領(lǐng)域。它們都致力于解決復(fù)雜的問題,但側(cè)重點和應(yīng)用場景有所不同。 1. 自然語言處理(NLP) 定義:
    的頭像 發(fā)表于 11-11 10:35 ?362次閱讀

    學(xué)習(xí)go語言過程踩過的坑

    作為一個5年的phper,這兩年公司和個人都在順應(yīng)技術(shù)趨勢,新項目慢慢從php轉(zhuǎn)向了go語言,從2021年到現(xiàn)在,筆者手上也先后開發(fā)了兩個go項目。在學(xué)習(xí)go語言過程中也
    的頭像 發(fā)表于 11-11 09:22 ?112次閱讀

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學(xué)習(xí)

    今天來學(xué)習(xí)語言模型在自然語言理解方面的原理以及問答回復(fù)實現(xiàn)。 主要是基于深度學(xué)習(xí)和自然語言處理技術(shù)。 大
    發(fā)表于 08-02 11:03

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)篇

    這個程序不需要程序員編寫,而是由計算機自動生成。因此,人工編程方法依賴程序員思考的規(guī)則,而自動編程是計算機算法通過分析數(shù)據(jù)自行創(chuàng)建規(guī)則。 作者通過類比學(xué)生準(zhǔn)備高考的過程來說明機器學(xué)習(xí)
    發(fā)表于 07-25 14:33

    天合光能獲“全過程功率測量控制評估認(rèn)證”證書

    ? 近期,天合光能成為首批獲得鑒衡認(rèn)證中心“光伏組件制造商全過程功率測量控制評估認(rèn)證”證書的光伏企業(yè)之一,其卓越的質(zhì)量控制流程和功率測試穩(wěn)定性再次獲得業(yè)內(nèi)權(quán)威認(rèn)可,充分展現(xiàn)了天合光能強大的制造能力
    的頭像 發(fā)表于 07-15 17:15 ?591次閱讀

    紅豆Cat 1開源 項目四: 從0-1設(shè)計一款TCP版本DTU產(chǎn)品的軟硬件全過程

    定義、硬件設(shè)計分析、軟件設(shè)計分析,并詳細(xì)講解單一功能點功能模塊的驗證過程和測試驗證方法。通過學(xué)習(xí)本內(nèi)容,初學(xué)者可以在 1-2 天內(nèi)完成一款 Cat 1 DTU產(chǎn)品的開發(fā)全過程,快速提升物聯(lián)網(wǎng)產(chǎn)品開發(fā)的實踐能力。本文也是紅豆開源產(chǎn)
    的頭像 發(fā)表于 07-12 14:43 ?297次閱讀
    紅豆Cat 1開源 項目四: 從0-1設(shè)計一款TCP版本DTU產(chǎn)品的軟硬件<b class='flag-5'>全過程</b>

    紅豆Cat 1開源 項目三: 從0-1設(shè)計一款HTTP版本RTU 支持GNSS 產(chǎn)品的軟硬件全過程

    、硬件設(shè)計分析、軟件設(shè)計分析,并詳細(xì)講解單一功能點功能模塊的驗證過程和測試驗證方法。通過學(xué)習(xí)本內(nèi)容,初學(xué)者可以在 1-2 天內(nèi)完成一款 Cat 1 產(chǎn)品的開發(fā)全過程,快速提升物聯(lián)網(wǎng)產(chǎn)品開發(fā)的實踐能力。本文也是紅豆開源產(chǎn)品的一個實
    的頭像 發(fā)表于 07-12 14:31 ?278次閱讀
    紅豆Cat 1開源 項目三: 從0-1設(shè)計一款HTTP版本RTU 支持GNSS 產(chǎn)品的軟硬件<b class='flag-5'>全過程</b>

    紅豆Cat 1開源 項目二: 從0-1設(shè)計一款MQTT版本DTU 支持GNSS 產(chǎn)品的軟硬件全過程

    的軟硬件定義、硬件設(shè)計分析、軟件設(shè)計分析,并詳細(xì)講解單一功能點功能模塊的驗證過程和測試驗證方法。通過學(xué)習(xí)本內(nèi)容,初學(xué)者可以在 1-2 天內(nèi)完成一款 Cat 1 DTU產(chǎn)品的開發(fā)全過程,快速提升物聯(lián)網(wǎng)產(chǎn)品開發(fā)的實踐能力。本文也是紅
    的頭像 發(fā)表于 07-12 14:30 ?299次閱讀
    紅豆Cat 1開源 項目二: 從0-1設(shè)計一款MQTT版本DTU 支持GNSS 產(chǎn)品的軟硬件<b class='flag-5'>全過程</b>

    紅豆Cat 1開源 項目一: 從0-1設(shè)計一款TCP版本RTU 支持Modbus+GNSS 產(chǎn)品的軟硬件全過程

    的軟硬件定義、硬件設(shè)計分析、軟件設(shè)計分析,并詳細(xì)講解單一功能點功能模塊的驗證過程和測試驗證方法。通過學(xué)習(xí)本內(nèi)容,初學(xué)者可以在 1-2 天內(nèi)完成一款 Cat 1 產(chǎn)品的開發(fā)全過程,快速提升物聯(lián)網(wǎng)產(chǎn)品開發(fā)的實踐能力。本文也是紅豆開源
    的頭像 發(fā)表于 07-10 17:36 ?380次閱讀
    紅豆Cat 1開源 項目一: 從0-1設(shè)計一款TCP版本RTU 支持Modbus+GNSS 產(chǎn)品的軟硬件<b class='flag-5'>全過程</b>

    解讀PyTorch模型訓(xùn)練過程

    PyTorch作為一個開源的機器學(xué)習(xí)庫,以其動態(tài)計算圖、易于使用的API和強大的靈活性,在深度學(xué)習(xí)領(lǐng)域得到了廣泛的應(yīng)用。本文將深入解讀PyTorch模型訓(xùn)練的全過程,包括
    的頭像 發(fā)表于 07-03 16:07 ?939次閱讀

    深度學(xué)習(xí)模型訓(xùn)練過程詳解

    詳細(xì)介紹深度學(xué)習(xí)模型訓(xùn)練的全過程,包括數(shù)據(jù)預(yù)處理、模型構(gòu)建、損失函數(shù)定義、優(yōu)化算法選擇、訓(xùn)練過程以及模型的評估與調(diào)優(yōu)。
    的頭像 發(fā)表于 07-01 16:13 ?1096次閱讀

    機器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是一個經(jīng)典數(shù)據(jù)
    的頭像 發(fā)表于 06-27 08:27 ?1578次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    精準(zhǔn)到毫米:H9激光切管機鋁材切割與打孔全過程解析

    H9激光切管機在鋁材切割與打孔的全過程包括設(shè)定參數(shù)、啟動切割、監(jiān)控質(zhì)量、完成取件和檢查效果等。H9激光切管機鋁材切割與打孔的全過程可以詳細(xì)解析如下:一、操作準(zhǔn)備檢查H9激光切管機各部件是否齊全,并
    的頭像 發(fā)表于 06-20 11:14 ?623次閱讀
    精準(zhǔn)到毫米:H9激光切管機鋁材切割與打孔<b class='flag-5'>全過程</b>解析

    物聯(lián)網(wǎng)與醫(yī)療廢物處置全過程電子信息化跟蹤管理系統(tǒng)研究

    與醫(yī)療廢物處置全過程電子信息化跟蹤管理系統(tǒng)(以下簡稱“醫(yī)廢跟蹤管理系統(tǒng)”)的研發(fā)理念、技術(shù)構(gòu)成、功能特性及其在實際應(yīng)用中的成效,尤其是翼思維醫(yī)廢收運管理系統(tǒng)的作業(yè)流程。 1. 研發(fā)理念與技術(shù)構(gòu)成 醫(yī)廢跟蹤管理系統(tǒng)的
    的頭像 發(fā)表于 04-01 16:14 ?600次閱讀

    永磁同步電機全速域矢量控制的全過程介紹

    一直都想知道永磁同步電機的轉(zhuǎn)速從零增加到極限這個過程會發(fā)生什么,這篇文章介紹一下永磁同步電機全速域矢量控制的全過程,即電機的轉(zhuǎn)速從零開始逐漸增加,如何設(shè)計電流環(huán)電流使得電機輸出恒定轉(zhuǎn)矩,且保持轉(zhuǎn)速穩(wěn)定。
    的頭像 發(fā)表于 03-15 09:29 ?1221次閱讀
    永磁同步電機全速域矢量控制的<b class='flag-5'>全過程</b>介紹