哈佛大學研究人員提出一種用寡肽分子存儲信息的新方法,信息獨立于云端之外,安全性高,數(shù)據(jù)寫入后無須額外能量即可穩(wěn)定存儲幾千年之久,檢索準確率達到99.9%。
書籍可能被燒成灰,電腦可能被黑,DVD會降解無法讀取。盡管近年來信息存儲方式不斷進步,但目前的信息存儲方式仍會遭到或簡單或復雜的威脅的影響。無論是一場洪水、一把火,還是一次復雜的網絡攻擊,都可能讓記錄的珍貴信息化為烏有。
哈佛大學的信息服務中心Whitesides團隊的新化學儲存方法(如下圖所示)需要的空間更少,而且無需輸入能量就可存儲大量數(shù)據(jù)。
到目前為止,Cafferty和他的團隊已經用這種方法記錄、存儲并“閱讀”了物理學家Richard Feynman的著名演講、Claude Shannon(他被稱為“信息理論之父”)和葛飾北齋的畫作《神奈川沖浪里》(右下)。到2020年,全球數(shù)字化檔案估計達到44萬億Gb(是2013年的10倍),說是“數(shù)字化海嘯”馬上就要來了一點也不為過。
隨著數(shù)據(jù)科學的持續(xù)繁榮,越來越多的信息在越來越小的空間中實現(xiàn)交互。即使是云存儲,最終的空間也會被耗盡,無法阻擋所有黑客,同時要消耗大量能量。
蛋白質分子存儲信息:能耗低、安全性高、保質期超長
現(xiàn)在,哈佛大學George Whitesides團隊提出一種存儲信息的新方法,可以將數(shù)據(jù)穩(wěn)定存儲達數(shù)百萬年之久,數(shù)據(jù)不與容易被破解的互聯(lián)網相連,數(shù)據(jù)一旦寫入,就不會消耗能量。這個方案只需化學家、一些廉價分子和您寶貴的信息就可實現(xiàn)。
“想想看,用一茶匙蛋白質就能保存紐約公共圖書館的全部內容,”Brian Cafferty博士說,他是描述該技術的論文的第一作者,目前在George Whitesides博士的實驗室中擔任博士后研究員。同時參與該研究的還有美國西北大學的Milan Mrksich博士及其團隊。該團隊在ACS Central報告了他們的新方法。
“至少在現(xiàn)階段,我們認為這種方法還不會與現(xiàn)有的數(shù)據(jù)存儲方式處于競爭關系,”Cafferty說。“我們認為這個方法是對現(xiàn)有技術的補充,從初步目標來看,我們的方法非常適合長期存檔數(shù)據(jù)的存儲。”
論文一作Brian Cafferty
Cafferty的分子存儲工具可能無法取代云,但可以為DNA等生物儲存工具提供一種誘人的替代方案。最近,科學家們發(fā)現(xiàn)了DNA編碼的不僅僅是眼睛的顏色。研究人員現(xiàn)在能夠通過合成DNA鏈來記錄任何信息。
但是,雖然DNA與計算機芯片相比較小,但放在分子世界中來看,DNA的個頭就很大了。而且DNA的合成需要熟練且時常重復的勞動。如果存儲每條消息都需要從頭開始設計,那么大分子存儲可能會成為一種耗時長、成本高的方式。
不同分子量的寡肽注入“微孔”,以二進制編碼區(qū)分
“我們開始探索一種未從生物學中借鑒的新策略,”Cafferty說。“通過使用有機化學和分析化學中常見技術,開發(fā)出一種使用低分子量的分子來編碼信息的方法。”
只需一次合成就可以生成足夠的小分子,一次編碼多個視頻,這種方法比基于DNA的方法更省力,更便宜。團隊選擇了寡肽(兩個或多個結合在一起的肽),因為其分子量很低,而且屬于性質穩(wěn)定的常見化合物,其分子比DNA,RNA都要小。
由于組成寡肽的氨基酸數(shù)量和類型不同,它們的分子質量是有差異的。當不同的寡肽分子混合在一起時,這種差異可以實現(xiàn)相互區(qū)分,就像字母表中的不同字母一樣。
將這些“字母”組成單詞會有點復雜:將不同質量的寡肽存儲在384個“微孔”中,然后將寡肽混合物放置在金屬板的表面上,就像將墨水吸收存儲在書頁中一樣。如果想要讀取“寫下”的內容,可以通過質譜儀查看其中一個微孔,按質量對分子進行分類。看看這個孔中存在哪些寡肽、不存在哪些寡肽:即實現(xiàn)不同存儲內容的區(qū)分。
然后,為了將混亂的分子翻譯成字母和單詞,團隊使用二進制編碼。例如,儲存字母“M”可以使用八種可能的寡肽中的四種,每種寡肽具有不同的質量。微孔中存在的四種寡肽讀為“1”,而缺失的四種讀為“0”。這些分子二進制代碼分別指向相應的字母,如果存儲的信息是圖像,則指向相應的像素。
使用寡肽存儲的32bits信息原理示意圖
使用這種方法,八種寡肽的混合物可以存儲一個字節(jié)的信息; 32種寡肽的混合物可以存儲四個字節(jié),以此類推。
現(xiàn)在,這種存儲方式的檢索準確率為99.9%。平均“寫入”速度為每秒8bits,“讀取”速度每秒20 bits。盡管“寫入”速度遠遠超過了用合成DNA書寫的速度,但對于大分子而言,“讀取”速度可能更快、更便宜。
分子存儲方式無須耗能,獨立于互聯(lián)網之外,安全性更高
未來,還可以通過引入不同類別的分子,提高存儲的穩(wěn)定性和容量,并降低成本。實驗中使用寡肽是定制的,因此價格較貴。但未來的圖書館可以購買更便宜的分子(如烷硫醇),只需1美分就可以記錄1億比特的信息。
寡肽等分子具備復原能力。“在適當?shù)臈l件下,寡肽可以在數(shù)百年甚至數(shù)千年的時間內保持穩(wěn)定性。”在高溫和干旱的情況下,這些分子可以在沒有光或氧的情況下存活下來。而且,黑客無法像攻破云存儲那樣竊取分子存儲的內容,分子存儲只能通過人工訪問。即使“小偷”發(fā)現(xiàn)數(shù)據(jù)藏匿,也需要一點化學知識才能實現(xiàn)代碼檢索。
Cafferty團隊的可擴展的分子存儲庫是一種穩(wěn)定的、零能耗、抗腐蝕的存儲可選方案,可用于未來的信息存儲。因此,當未來一旦書被燒了、計算機被黑了,DVD讀不出來了,這些分子可能還會繼續(xù)存在,以提醒未來的人類,我們曾經是多么喜歡那些萌萌的貓咪視頻。
該研究由美國國防部高級研究計劃局(DARPA)資助。
-
存儲
+關注
關注
13文章
4332瀏覽量
85952 -
數(shù)字化
+關注
關注
8文章
8783瀏覽量
61911 -
數(shù)據(jù)科學
+關注
關注
0文章
165瀏覽量
10078
原文標題:保質幾千年!哈佛大學新研究用蛋白質分子存儲數(shù)據(jù),比云更安全
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論