據(jù)英國(guó)《自然·通訊》雜志10日發(fā)表的一項(xiàng)最新成果,美國(guó)北卡羅來(lái)納州立大學(xué)研究人員將DNA數(shù)據(jù)存儲(chǔ)方面的長(zhǎng)期挑戰(zhàn)轉(zhuǎn)化為一種實(shí)用工具——為用戶提供存儲(chǔ)數(shù)據(jù)文件的“預(yù)覽”,例如圖像文件的縮略圖版本。這使得整個(gè)DNA存儲(chǔ)系統(tǒng)數(shù)據(jù)效率大為提高,同時(shí)更具兼容性。

全球的數(shù)據(jù)量不斷增加,傳統(tǒng)的存儲(chǔ)架構(gòu),如硬盤和磁帶,越來(lái)越難以跟上數(shù)據(jù)存儲(chǔ)的需要。隨著這些裝置逐漸達(dá)到存儲(chǔ)極限,DNA被當(dāng)作一種長(zhǎng)期存儲(chǔ)方案提出來(lái),這是一項(xiàng)非常有吸引力的技術(shù),因?yàn)橹恍枰粋€(gè)小片段就可以存儲(chǔ)大量數(shù)據(jù),信息可以長(zhǎng)時(shí)間保持,又非常節(jié)能。

但是科學(xué)家們一直還無(wú)法實(shí)現(xiàn)對(duì)DNA文件中數(shù)據(jù)的“預(yù)覽”——如果你想知道文件是什么,那你必須“打開”整個(gè)文件。

據(jù)研究人員介紹,為了識(shí)別和提取指定文件,大多數(shù)系統(tǒng)使用聚合酶鏈反應(yīng)(PCR)。具體來(lái)說(shuō),使用與相應(yīng)引物結(jié)合序列匹配的小型DNA引物來(lái)識(shí)別包含所需文件的DNA鏈。然后系統(tǒng)使用PCR制作大量相關(guān)DNA鏈的副本,再對(duì)整個(gè)樣本進(jìn)行測(cè)序。該過(guò)程會(huì)復(fù)制大量目標(biāo)DNA鏈,但目標(biāo)鏈的信號(hào)比樣本的其余部分更強(qiáng),從而可以識(shí)別目標(biāo)DNA序列并讀取文件。然而,DNA數(shù)據(jù)存儲(chǔ)研究人員面臨的一個(gè)巨大挑戰(zhàn)就是,如果兩個(gè)或多個(gè)文件具有相似的文件名,PCR將無(wú)意中復(fù)制多個(gè)數(shù)據(jù)文件的片段。因此,用戶必須為文件指定非常不同的名稱,以避免產(chǎn)生數(shù)據(jù)混亂。

此次,北卡羅來(lái)納州立大學(xué)研究團(tuán)隊(duì)開發(fā)的這種技術(shù),利用相似的文件名可以打開整個(gè)文件或該文件的特定子集。這是通過(guò)在命名文件和文件的給定子集時(shí)使用特定的命名約定來(lái)實(shí)現(xiàn)的,研究人員可以PCR過(guò)程的幾個(gè)參數(shù),溫度、樣本中DNA的濃度以及樣本中試劑的類型和濃度,來(lái)選擇是“打開”整個(gè)文件還是只“打開”其“預(yù)覽”版本。

這一新技術(shù)的優(yōu)勢(shì)體現(xiàn)在效率和費(fèi)用兩大方面,該論文的第一作者、研究人員凱爾·托梅克表示,“如果你不確定哪個(gè)文件包含你想要的數(shù)據(jù),也不必對(duì)所有潛在文件中的所有DNA進(jìn)行測(cè)序,相反,還可以對(duì)DNA文件的更小部分進(jìn)行測(cè)序以作為預(yù)覽”。

研究團(tuán)隊(duì)成員表示,這一技術(shù)已展示了與其他文件類型廣泛兼容的能力,目前他們正在尋找行業(yè)合作伙伴來(lái)幫助探索該技術(shù)的商業(yè)可行性。

標(biāo)簽: 新技術(shù) DNA 存儲(chǔ)數(shù)據(jù) 文件