哈佛大學(xué)研究人員提出一種用寡肽分子存儲信息的新方法,信息獨(dú)立于云端之外,安全性高,數(shù)據(jù)寫入后無須額外能量即可穩(wěn)定存儲幾千年之久,檢索準(zhǔn)確率達(dá)到99.9%。
書籍可能被燒成灰,電腦可能被黑,DVD會降解無法讀取。盡管近年來信息存儲方式不斷進(jìn)步,但目前的信息存儲方式仍會遭到或簡單或復(fù)雜的威脅的影響。無論是一場洪水、一把火,還是一次復(fù)雜的網(wǎng)絡(luò)攻擊,都可能讓記錄的珍貴信息化為烏有。
哈佛大學(xué)的信息服務(wù)中心Whitesides團(tuán)隊(duì)的新化學(xué)儲存方法(如下圖所示)需要的空間更少,而且無需輸入能量就可存儲大量數(shù)據(jù)。
到目前為止,Cafferty和他的團(tuán)隊(duì)已經(jīng)用這種方法記錄、存儲并“閱讀”了物理學(xué)家Richard Feynman的著名演講、Claude Shannon(他被稱為“信息理論之父”)和葛飾北齋的畫作《神奈川沖浪里》(右下)。到2020年,全球數(shù)字化檔案估計達(dá)到44萬億Gb(是2013年的10倍),說是“數(shù)字化海嘯”馬上就要來了一點(diǎn)也不為過。
隨著數(shù)據(jù)科學(xué)的持續(xù)繁榮,越來越多的信息在越來越小的空間中實(shí)現(xiàn)交互。即使是云存儲,最終的空間也會被耗盡,無法阻擋所有黑客,同時要消耗大量能量。
蛋白質(zhì)分子存儲信息:能耗低、安全性高、保質(zhì)期超長
現(xiàn)在,哈佛大學(xué)George Whitesides團(tuán)隊(duì)提出一種存儲信息的新方法,可以將數(shù)據(jù)穩(wěn)定存儲達(dá)數(shù)百萬年之久,數(shù)據(jù)不與容易被破解的互聯(lián)網(wǎng)相連,數(shù)據(jù)一旦寫入,就不會消耗能量。這個方案只需化學(xué)家、一些廉價分子和您寶貴的信息就可實(shí)現(xiàn)。
“想想看,用一茶匙蛋白質(zhì)就能保存紐約公共圖書館的全部內(nèi)容,”Brian Cafferty博士說,他是描述該技術(shù)的論文的第一作者,目前在George Whitesides博士的實(shí)驗(yàn)室中擔(dān)任博士后研究員。同時參與該研究的還有美國西北大學(xué)的Milan Mrksich博士及其團(tuán)隊(duì)。該團(tuán)隊(duì)在ACS Central報告了他們的新方法。
“至少在現(xiàn)階段,我們認(rèn)為這種方法還不會與現(xiàn)有的數(shù)據(jù)存儲方式處于競爭關(guān)系,”Cafferty說。“我們認(rèn)為這個方法是對現(xiàn)有技術(shù)的補(bǔ)充,從初步目標(biāo)來看,我們的方法非常適合長期存檔數(shù)據(jù)的存儲。”
論文一作Brian Cafferty
Cafferty的分子存儲工具可能無法取代云,但可以為DNA等生物儲存工具提供一種誘人的替代方案。最近,科學(xué)家們發(fā)現(xiàn)了DNA編碼的不僅僅是眼睛的顏色。研究人員現(xiàn)在能夠通過合成DNA鏈來記錄任何信息。
但是,雖然DNA與計算機(jī)芯片相比較小,但放在分子世界中來看,DNA的個頭就很大了。而且DNA的合成需要熟練且時常重復(fù)的勞動。如果存儲每條消息都需要從頭開始設(shè)計,那么大分子存儲可能會成為一種耗時長、成本高的方式。
不同分子量的寡肽注入“微孔”,以二進(jìn)制編碼區(qū)分
“我們開始探索一種未從生物學(xué)中借鑒的新策略,”Cafferty說。“通過使用有機(jī)化學(xué)和分析化學(xué)中常見技術(shù),開發(fā)出一種使用低分子量的分子來編碼信息的方法。”
只需一次合成就可以生成足夠的小分子,一次編碼多個視頻,這種方法比基于DNA的方法更省力,更便宜。團(tuán)隊(duì)選擇了寡肽(兩個或多個結(jié)合在一起的肽),因?yàn)槠浞肿恿亢艿停覍儆谛再|(zhì)穩(wěn)定的常見化合物,其分子比DNA,RNA都要小。
由于組成寡肽的氨基酸數(shù)量和類型不同,它們的分子質(zhì)量是有差異的。當(dāng)不同的寡肽分子混合在一起時,這種差異可以實(shí)現(xiàn)相互區(qū)分,就像字母表中的不同字母一樣。
將這些“字母”組成單詞會有點(diǎn)復(fù)雜:將不同質(zhì)量的寡肽存儲在384個“微孔”中,然后將寡肽混合物放置在金屬板的表面上,就像將墨水吸收存儲在書頁中一樣。如果想要讀取“寫下”的內(nèi)容,可以通過質(zhì)譜儀查看其中一個微孔,按質(zhì)量對分子進(jìn)行分類。看看這個孔中存在哪些寡肽、不存在哪些寡肽:即實(shí)現(xiàn)不同存儲內(nèi)容的區(qū)分。
然后,為了將混亂的分子翻譯成字母和單詞,團(tuán)隊(duì)使用二進(jìn)制編碼。例如,儲存字母“M”可以使用八種可能的寡肽中的四種,每種寡肽具有不同的質(zhì)量。微孔中存在的四種寡肽讀為“1”,而缺失的四種讀為“0”。這些分子二進(jìn)制代碼分別指向相應(yīng)的字母,如果存儲的信息是圖像,則指向相應(yīng)的像素。
使用寡肽存儲的32bits信息原理示意圖
使用這種方法,八種寡肽的混合物可以存儲一個字節(jié)的信息; 32種寡肽的混合物可以存儲四個字節(jié),以此類推。
現(xiàn)在,這種存儲方式的檢索準(zhǔn)確率為99.9%。平均“寫入”速度為每秒8bits,“讀取”速度每秒20 bits。盡管“寫入”速度遠(yuǎn)遠(yuǎn)超過了用合成DNA書寫的速度,但對于大分子而言,“讀取”速度可能更快、更便宜。
分子存儲方式無須耗能,獨(dú)立于互聯(lián)網(wǎng)之外,安全性更高
未來,還可以通過引入不同類別的分子,提高存儲的穩(wěn)定性和容量,并降低成本。實(shí)驗(yàn)中使用寡肽是定制的,因此價格較貴。但未來的圖書館可以購買更便宜的分子(如烷硫醇),只需1美分就可以記錄1億比特的信息。
寡肽等分子具備復(fù)原能力。“在適當(dāng)?shù)臈l件下,寡肽可以在數(shù)百年甚至數(shù)千年的時間內(nèi)保持穩(wěn)定性。”在高溫和干旱的情況下,這些分子可以在沒有光或氧的情況下存活下來。而且,黑客無法像攻破云存儲那樣竊取分子存儲的內(nèi)容,分子存儲只能通過人工訪問。即使“小偷”發(fā)現(xiàn)數(shù)據(jù)藏匿,也需要一點(diǎn)化學(xué)知識才能實(shí)現(xiàn)代碼檢索。
Cafferty團(tuán)隊(duì)的可擴(kuò)展的分子存儲庫是一種穩(wěn)定的、零能耗、抗腐蝕的存儲可選方案,可用于未來的信息存儲。因此,當(dāng)未來一旦書被燒了、計算機(jī)被黑了,DVD讀不出來了,這些分子可能還會繼續(xù)存在,以提醒未來的人類,我們曾經(jīng)是多么喜歡那些萌萌的貓咪視頻。
該研究由美國國防部高級研究計劃局(DARPA)資助。
-
存儲
+關(guān)注
關(guān)注
13文章
4263瀏覽量
85671 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
8610瀏覽量
61639 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
165瀏覽量
10045
原文標(biāo)題:保質(zhì)幾千年!哈佛大學(xué)新研究用蛋白質(zhì)分子存儲數(shù)據(jù),比云更安全
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論