全球每年產生的數據需要4180億個1TB硬盤才能放下,若是把如此龐大的數據放到DNA上,只需 1kg DNA就夠了!最近一家公司將16G的維基百科存儲在了一個DNA分子上讓人驚嘆,DNA存儲已成為最受關注的新興技術之一,“我,就是數據”時代即將來臨。
“我,就是數據”時代悄然將至。
在科幻大片《超體》中,“女超人”Lucy憑借藥物的作用,大腦不斷被開發,獲得了包括心靈感應、瞬間吸收知識等技能。當大腦開發到100%時,已然達到了“I am everywhere”的至高境界。
Lucy最終化身為超級“U盤”
而目前我們正處于數據爆炸增長的時代,現存的硬盤、3D內存芯片等數據存儲方式已然出現“負荷過重”的跡象。若是要存儲全球的數據似乎是一件較為棘手的事情,更不要提做到像Lucy那般集“全宇宙數據于一身”了。
一種新的方式便應運而生——DNA數據存儲。
其實,這種嘗試早就已經開始了。
去年年底,法國一位16歲高中生Locatelli便將《古蘭經》和《圣經》中的部分內容注入到了自己體內。把希伯來語和阿拉伯語的字符轉換成DNA堿基的特定組合,然后用購買的病毒編輯到DNA鏈里,最后用注射器注入自己的大腿(詳細內容見文末附錄)。
除了這位高中生之外,上周,一家位于波士頓的初創公司Catalog宣布,他們將維基百科英文版一共16G的所有文本存儲在了一個DNA分子上!
里面就是儲存了16G維基百科的DNA
他們相信生物分子的壽命將比最新的計算機存儲技術長得多。
16G的維基百科,只需一個DNA分子便可輕松存儲
計算機存儲技術已經從帶磁鐵的電線變成了硬盤,變成了3D存儲芯片。但是下一代存儲技術可能會使用與地球上的生命一樣古老的方法:DNA。
初創企業Catalog近日宣布,維基百科英文版的所有文本都被塞進了我們身體使用的相同基因分子中。也就是說,他們將維基百科英文版一共16G的所有文本存儲在了一個DNA分子上!
Catalog用它的第一臺DNA書寫器完成了這項壯舉。
Catalog的DNA寫入機可以以每秒4兆比特的速度寫入數據,但該公司希望使其速度至少提高1000倍。
至于說這個DNA書寫器有多大,呃,如果你先把家里的冰箱、烤箱扔掉,再打掉一部分櫥柜,這臺機器就可以很容易地安裝在你的房子里啦(機器的大小與一輛現代SUV差不多)。盡管它不太可能很快就將手機的閃存芯片推到一邊,但Catalog認為,它對一些需要存檔數據的客戶已經很有用了。
DNA鏈很小,很難管理,但是生物分子可以存儲除了控制細胞如何變成豌豆植物或黑猩猩的基因以外的其他數據。Catalog使用了比人類DNA短但更多的預制合成DNA鏈,因此它可以存儲更多的數據。
依靠DNA而不是最新的高科技小型化設備來存儲可能聽起來像是倒退了一步。但是DNA是緊密的,化學上是穩定的,而且因為它是地球生物學的基礎,它可能不會像硬盤驅動器或CD那樣過時,也不會像軟盤驅動器那樣消失。
誰在市場上購買這種存儲?Catalog有一個合作伙伴要宣布, Arch Mission基金會正試圖將人類知識儲存在不只是在地球上,甚至在太陽系的其他地方——就像SpaceX發射到軌道上的Elon Musk的Tesla Roadster一樣。除此之外,Catalog還未透露其他客戶是誰,或者是否會為其DNA寫入服務收費。
該公司在一份聲明中說:“我們正在與政府機構、產生大量測試數據的主要國際科學項目、石油天然氣、媒體和娛樂、金融和其他行業的主要公司進行討論。”
總部位于波士頓的Catalog擁有自己的設備,可以在DNA中每秒記錄4兆比特的數據。優化的速度應該是當前速度的三倍,讓人們在一天內記錄125千兆字節——大約相當于高端手機可以存儲的容量。
傳統的DNA測序產品已經在生物技術市場上銷售,可以讀取DNA數據。“我們認為這一全新的序列技術用例將有助于(大大)降低成本,”Catalog認為計算業務是一個潛在的巨大市場。
Catalog首席執行官Hyunjun Park和首席技術創新官Nathaniel Roquet于2016年創立了這家公司。當時,Park是麻省理工學院的博士后,Roquet是哈佛大學的研究生。
Catalog使用尋址系統,這意味著客戶可以使用大型數據集。即使DNA以長序列存儲數據,目錄也可以使用分子探針讀取存儲在任何地方的信息。換句話說,它是一種像硬盤一樣的隨機存取存儲器,而不是像半個世紀前大型計算機鼎盛時期的磁帶盤那樣的順序存取。
盡管DNA數據可能會被宇宙射線破壞,但Catalog認為它是一種比其他方法更穩定的介質。畢竟,我們有幾千年前滅絕動物的DNA。我們打個賭,你抽屜里的U盤在25年后還會用嗎?
DNA存儲數據的意義何在?
近日,《科學美國人》與世界經濟論壇聯合發布了2019年全球十大新興技術,其中一項就是用DNA儲存數據。那么,用DNA存儲數據的意義何在呢?
據軟件公司Domo稱,2018年,谷歌每分鐘進行388萬次搜索,人們在YouTube上觀看了433萬個視頻,發送了159362760封電子郵件,推特了47.3萬次,在Instagram上發布了49000張照片。
到2020年,全球人均每秒將產生大約1.7兆字節的數據,假設世界人口為78億,這相當于每年約418個zettabytes。這么多的數據如果放在容量為1TB的硬盤上,需要4180億個硬盤才能放下!
如果是這樣的話,目前的數據存儲系統通撐不過一個世紀。此外,運行數據中心需要消耗大量的能量。簡而言之,我們將面臨一個嚴重的數據存儲問題,隨著時間的推移,這個問題將變得更加嚴重!
因此,硬盤存儲的一種替代方案——基于DNA的數據存儲才顯得尤為重要。由核苷酸A,T,C和G的長鏈組成的DNA是生命的信息存儲材料。數據可以按照這些字母的順序存儲,從而將DNA轉變為一種新的信息技術形式。
它已經過常規排序(讀取),合成(寫入)并且可以輕松準確地復制。DNA也是非常穩定的,正如生活在50多萬年前的化石馬的完整基因組測序所證明的那樣,存儲它不需要太多能量。
但是,DNA的存儲容量是讓人驚訝的。DNA可以以遠超過電子設備的密度精確存儲大量數據。例如,根據哈佛大學George Church及其同事于2016年發表在“Nature Materials”雜志上的計算,簡單的大腸桿菌的存儲密度約為每立方厘米1019比特。
在這樣的密度下,一個邊長約一米的DNA立方體可以很好地滿足全世界一年的數據儲存需求,換個維度講,1kg DNA就能儲存全球數據。
全球數據只需1kgDNA就能儲存
DNA數據存儲的前景不僅僅是理論上的。例如,2017年,哈佛大學的Church小組采用CRISPR DNA編輯技術,將人手的圖像記錄到大腸桿菌的基因組中,并以高于90%的準確率讀出。華盛頓大學和微軟研究院的研究人員已經開發出一個完全自動化的系統,用于編寫、存儲和讀取DNA編碼的數據。包括微軟和Twist Bioscience在內的一些公司正在致力于推進DNA存儲技術。
與此同時,DNA已經被研究人員用來以不同的方式管理數據,這些研究人員努力處理海量的數據。新一代測序技術的最新進展使得數十億個DNA序列可以輕松同時讀取。有了這種能力,研究人員可以使用DNA序列的條形碼作為分子識別“標簽”,以跟蹤實驗結果。DNA條形碼正被用于大大加快化學工程、材料科學和納米技術等領域的研究步伐。例如,在佐治亞理工學院,James E. Dahlman的實驗室正在迅速確定更安全的基因療法;其他人正在研究如何對抗耐藥性和防止癌癥轉移。
使DNA數據存儲變得通用的挑戰之一是讀取和寫入DNA的成本和速度,如果要與電子存儲競爭,則需要進一步降低這些成本和速度。即使DNA沒有成為一種無所不在的存儲材料,它幾乎肯定會被用來以全新的方式生成信息,并長期保存某些類型的數據。
DNA能夠存儲數據,是否也可遺傳?
前不久,新智元報道了一篇文章——頂級學術期刊《CELL》同日連續發表兩篇重磅文章,研究人員在對線蟲的研究中發現,記憶可以被遺傳,甚至持續3-4代!
在2016年的SXSW大會上,南加州大學教授Theodore Berger宣布了一個轟動整個科技界的消息:
在對猴子、老鼠的實驗中,通過人造海馬體完成了短時記憶向長期儲存記憶“幾乎完美”的轉換,這項技術可以完成對人腦記憶的備份,并復制到其他人的大腦中。
這就意味著記憶有可能“遺傳”給后代。
而近日,愛思維爾(Elsevier)出版公司旗下的細胞出版社(Cell Press)雜志《CELL》同日發表了兩篇重磅文章——記憶居然真的可以遺傳!
文章地址:
https://www.cell.com/cell/fulltext/S0092-8674(19)30448-9
文章地址:
https://www.cell.com/cell/fulltext/S0092-8674(19)30552-5
這兩項重磅的研究結果表明:至少在線蟲(C.elegans)這樣的生物中,記憶可以被遺傳,且可以維持3-4代。堪稱顛覆認知!
記憶的遺傳,或是另一種“永生”?
縱觀歷史,有無數人在尋找著永生不死的方式——他們或修煉自己的精神世界,或求助于丹藥、或修建宏偉的寢陵,想以此實現精神的延續和永存,但無一成真。
今天,我們借助科學發現,人們對“永生”的研究也不斷在持續著。
新智元此前報道過《Nature重磅封面:復活死亡大腦!》——耶魯大學的最新研究表明,豬大腦在死亡4小時后成功復活,并維持了至少6小時。
這項研究掀起了一波道德倫理的輿論浪潮,有人擔心這是否就會是僵尸啟示錄的開始;但同時還有人認為,讓一些偉人的大腦復活,實現意識和記憶的“永生”,將具有重大的意義。
而這次科學家們的發現可謂是顛覆了我們的認知。
原來信息竟然可以通過神經代代相傳,加之這次DNA可以存儲海量數據,不知道這是不是另一種“永生”的方式呢?
附:16歲高中將《古蘭經》和《圣經》注入體內
去年年底,法國一位16歲高中生Locatelli將《古蘭經》和《圣經》中的部分內容注入到了自己體內。他將文本轉換成了DNA,并注射到了自己的大腿上。
12月3日,他還將這項實驗的文章發表到了Open Science Framwork(OSF)上。
論文地址:
https://osf.io/yj8xw/
從邏輯上來講,這項壯舉并不難。Locatelli首先用一個基本的系統將文本翻譯為構成DNA的核酸。
在圣經《創世紀》中,他將22個希伯來字母轉換成四種可能的核酸:胞嘧啶、胸腺嘧啶、鳥嘌呤或腺嘌呤。胞嘧啶和胸腺嘧啶分別代表五個字母,鳥嘌呤和腺嘌呤分別代表六個字母。
這張表是從《古蘭經》的獨立(isolated)字母中汲取靈感而開發的
在阿拉伯語文本中,Locatelli去掉了28個字母中的5個,并給了其中3個獨特的核酸,允許Ra和Sad共享胸腺嘧啶。在這兩種情況下,Locatelli都忽略空格、標點符號和變音符號。
這張表的靈感來自希伯來字母和DNA密碼表
然后,他分別從VectorBuilder和ProteoGenix公司購買了定制的DNA鏈,以及用于將新DNA插入細胞的良性病毒。他買了一些生理鹽水和注射器就出發去參加了比賽。注射后,他只出現了輕微的過敏反應。
Locatelli說:“我做這個實驗是為了宗教和科學之間和平的象征。”
但是,加州大學洛杉磯分校的生物化學家Sriram Kosuri表示,他不能確定Locatelli的方法是否真的有效;無法評估病毒載體是否成功地將合成的DNA導入了Locatelli細胞。
這位少年的研究確實表明,在DNA中存儲任何類型的信息并不是一件很難的事情。這是一種非常高效的存儲方式,這就是為什么科學家們一直把它看作是在緊湊空間中安全存儲大量數據的一種方式。
到目前為止,盡管生物技術公司正在競相尋找更便宜的方法,但制造用于數據存儲的合成DNA的成本高得令人望而卻步。
當然,商業存儲的目標是能夠將其轉換回可用的信息。從理論上講,如果新的DNA被正確地植入Locatelli的細胞中,細胞會像他自己的DNA一樣復制,也就是說他自己進行了基因編輯,那么基于文本的DNA就可以被翻譯成文本。
然而,這可能并沒有發生。最先進的醫學研究剛剛開始開發基因療法。即使人工合成的DNA被保存下來,最初的文本轉換也非常不精確,很難重現真實的文本。
-
數據
+關注
關注
8文章
6892瀏覽量
88827 -
計算機
+關注
關注
19文章
7421瀏覽量
87715 -
DNA
+關注
關注
0文章
243瀏覽量
30982
原文標題:我,就是數據:高中生把數據編入體內,1公斤DNA 未來可儲存全球數據
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論