DNA存储的敦煌壁画。天津大学供图
DNA存储技术概念图。天津大学供图
基于德布莱英图理论设计的序列重建算法高效解决DNA断裂、降解问题。天津大学供图
科幻大片《侏罗纪公园》里讲述了这样一个故事:科学家找到一块有史前蚊子的琥珀,从蚊子血中获得了恐龙的基因,从而让已灭绝了6000多万年的恐龙复活。
恐龙的生物信息存储在DNA中,若干年后被提取并还原出来。这听上去似乎有些道理,却也让人倒吸一口凉气。
最近,天津大学一项研究成果让人们离想象又近了一些。该校合成生物学团队将10幅精选敦煌壁画存入DNA中,并通过加速老化等实验,发现这些壁画信息在常温下可保存千年,在9.4℃下可保存两万年。
“如果在合适的温度等条件下,保存千万年也是可以的。”中国科学院院士、天津大学副校长元英进说。
小小的DNA却拥有惊人的存储容量
人类文明进化史,也是一部信息存储技术发展史。
从结绳记事、仓颉造字到磁带、硬盘等现代磁光电存储技术,数据存储帮助人类延续了思想,记录下灿烂文明。造纸与印刷术的发明,让人类能够存储的数据量在几百年内获得了大约5个数量级的提升。到了计算机时代,人类产生的数据呈爆发式增长。
“全世界都在建数据中心,而数据中心的能耗是惊人的。”元英进说。人们一直在不断寻找更海量、更稳定、更安全的存储方式。
大自然鬼斧神工的绝妙之处就在于此——最好的存储器或许就藏身于生命体之中。
自地球上出现生命以来,大自然一直用DNA来存储信息,至今已有30多亿年。人类的五官在脸上如何摆放,体内的蛋白怎样合成,眼睛是什么颜色……诸如此类纷繁复杂的人类基因组信息,都记录在比细胞还小得多的DNA上,一代代沿用至今。
不同于各种人造存储设备,DNA极其精巧却又如此经久耐用,它存储了亿万年来无数生物的遗传信息,造就生命繁衍、进化演化及生物多样性。
那么,假如把海量的信息,像存入U盘、硬盘一样,“写”到小小的DNA上,岂不是一举多得?事实上,当人类发现DNA的双螺旋结构后,美俄科学家就先后提出了用DNA存储数字信息的概念。
元英进解释说,DNA存储相较于磁、光、电等常规的信息存储介质有3个最显著的优势。其中最大的优势在于存储密度高。目前,天津大学研究团队将部分经典视频片段存储在DNA中,已实现了体积存储密度比普通硬盘高出6个数量级。
与此同时,存储的信息可用时间非常长。此次研究者将10幅敦煌壁画信息存储在DNA中,结合创新的算法,可以实现DNA分子在室温下保存超过千年,在9.4℃条件下保存两万年。
这样的长期保存需要的能耗却很低。元英进认为,DNA存储被视为一种极具潜力的存储技术,已经成为应对数据存储增长挑战的新机遇。
壁画“变身”DNA需要几步
DNA信息存储的原理共分两步——信息写入和信息读取。
这个过程实际上跨越了极难逾越的鸿沟:它打破了有机与无机的界限,连起生命和信息两大系统。
DNA是脱氧核糖核酸的缩写,含有“A”“T”“C”“G”四种碱基。如果用数字中的0、1、2、3分别代表一个碱基,就组成了一个四进制的存储方式,类似于计算机采用的0和1二进制代码。
通过编码转化,“碱基四进制”和“计算机二进制”就可以实现“对话”。天津大学合成生物学前沿科学中心博士生韩明哲解释说,壁画的数字图像本质上就是二进制的比特串,“我们通过编码将这些二进制的比特串,转化为四进制的ATGC碱基序列,再通过DNA合成技术将碱基序列写入DNA中,壁画的数据图像就‘变’为DNA了。”
未经允许不得转载:j1j博客 » 中国科学家创新DNA存储算法 让敦煌壁画再“活”两万年