2024年10月23日,北京大学计算机学院-张成与定量生物学中心-钱珑联合研究团队与合作者,在国际学术期刊 Nature 上发表题为“Parallel molecular data storage by printing epigenetic bits on DNA” (https://www.nature.com/articles/s41586-024-08040-5)的研究论文,首次提出了一种基于并行写入策略的DNA存储方法。该技术不依赖于主流的“从头合成”写入路线原理,通过DNA自组装与选择性酶促甲基化的组合原理,可将“表观比特”(epi-bit,5-甲基胞嘧啶)编码的数字信息并行打印在DNA分子上。同时,研究中还成功实现了个人订制DNA存储示例,证明了便捷的分布式DNA存储应用潜力。该方法的建立,不仅为实现了快速、低成本的大规模分子数据存储奠定了技术基础,还为未来DNA存储的发展提供了全新思路。
大数据时代,全球数据洪流对数据存储技术提出了严峻挑战。DNA分子具有超高的数据存储密度和超长寿命,已成为备受瞩目的颠覆性存储介质。然而,传统DNA存储依赖“从头合成”的信息写入路线,在成本和速度上面临巨大挑战。不同于传统技术路线,张成-钱珑联合团队开发的“表观比特(epi-bit)”DNA存储利用预制的DNA模板和分子活字块,通过DNA自组装介导的分子信息排版,经选择性酶促甲基修饰转移,实现了分子级“活字印刷”信息打印。
图1. 表观比特DNA存储信息表示方法和Nature相关专题报道
团队在实验中,将中国汉代“白虎”瓦当和国宝大熊猫“飞云”的高清图片成功写入DNA分子中,数据量超过27.5万比特,相比此前发表的其他非传统DNA存储技术,数据规模提升超过300倍。信息读取使用便携式纳米孔测序仪,实现了对DNA模板上复杂表观比特信息的高通量读取,并通过单次超240种不同修饰模式的并行解析,无损还原了原始数据。实验结果验证了该创新型分子存储技术的可行性和准确性,还展示了表观比特的稳定性。
值得关注的是,团队还展示了这项技术的分布式存储应用潜力。在个人定制DNA存储实验中,邀请了北京大学、华北电力大学等单位60名背景广泛的青年志愿者,由他们在日常环境下,将私人数据亲手写入DNA并由个人保存,相关数据直到使用时才被读取,可有效保障个人数据的隐私与安全。这种分布式DNA存储方式,不仅能极大降低DNA存储的使用门槛,且保障了数据隐私,有望推动DNA存储的个人应用。
图2.表观比特DNA存储原理流程和实验结果
表观比特DNA存储框架为大规模数据存储提供了全新的解决方案,有望突破DNA存储的成本和速度壁垒。该技术的开发,还展现了非传统分子比特在数据存储中的独特优势,为未来新型分子信息处理系统的研发奠定了基础。北京大学张成研究员、钱珑研究员、欧阳颀教授和美国亚利桑那州立大学颜颢教授为本文的共同通讯作者。吴燃峰、孙法家和林艺生为本文共一作者。北京大学计算机学院和定量生物中心为本文第一通讯单位。本研究获得了德国斯图加特大学刘娜团队、成都瀚辰光翼科技有限责任公司、大连理工大学张强团队、华北电力大学杨静团队的大力支持。本研究的iDNAdrive实验获得了北京大学2024年iGEM团队的大力支持。该工作得到了国家重点研发计划、国家自然科学基金、预先研究专项等项目的资助。
Nature杂志同期news&views栏目专题报道(https://www.nature.com/articles/d41586-024-03312-6)