Молекулы ДНК представляют собой надежное устройство по хранению информации, так как они хорошо защищены от ошибок чтения и записи.
Ученые пытаются приспособить их для хранения произвольных данных с 1988 года, когда американским биоинформатикам впервые удалось записать 7,9 килобайт информации на молекулу ДНК и прочитать ее.
Группа ученых под руководством Шрирама Косури из Гарвардской медицинской школы в Бостоне (США) разработала особый компьютерный алгоритм, позволяющий сжать и подготовить для записи на молекулу ДНК практически неограниченный объем информации.
В соответствии с данной методикой, данные разбиваются на куски одинаковой длины и записываются на короткие фрагменты ДНК длиной в 159 нуклеотидов. Каждый такой блок содержит 96 бит данных, 19 битный адрес блока и два фрагмента по 22 бита, кодирующих начало и конец "пакета" информации. В каждом случае один нуклеотид кодирует один бит данных - азотистые основания аденин (А) и цитозин (С) обозначают логическую "единицу", а гуанин (G) и тимин (T) - логический ноль.
При записи информации блоки синтезируются из отдельных нуклеотидов при помощи струйного ДНК-принтера. Наличие адреса у каждого блока позволяет хранить информацию в виде смеси из коротких последовательностей нуклеотидов, а не единой цепочки ДНК. Это позволяет хранить практически неограниченный объем информации, увеличивая длину адресной части блока.
Косури и его коллеги проверили свой алгоритм в деле, "напечатав" электронную версию книги Регенезис: как синтетическая биология переизобретет природу и нас самих, написанной участником группы Джорджем Черчем и писателем Эдом Реджисом.
В общей сложности, электронная версия книги содержит в себе 5,27 мегабит (658 килобайт) информации, в том числе 53,5 тысячи слов, 11 картинок и 1 ява-скрипт.
Ученые синтезировали необходимые фрагменты ДНК, смешали их, размножили и прочитали при помощи устройства секвенирования Illumina HiSeq.
По словам биоинженеров, алгоритм кодирования оказался очень эффективным - книга была считана всего с десятью ошибками на 5,27 мегабит данных.
По словам авторов исследования, их технология имеет несколько других преимуществ, кроме неограниченной длины записи и устойчивости к ошибкам. Во-первых, использование нуклеотидов в качестве единичных битов позволяет достичь невероятно высокой плотности записи - 5,5 петабит на кубический миллиметр. Это больше аналогичной характеристики для флеш-памяти и жестких дисков в миллионы раз, и в сотни раз превышает плотность записи данных в квантовой голографии.
Ученые полагают, что такие характеристики ДНК-памяти могут помочь ей стать одним из основных способов хранения информации в архивах и для других целей, не требующих быстрого доступа к данным.
Напомним, в июне текущего года для лечения рака американские химики создали наночастицы из ДНК и РНК, "выключающие" некоторые гены опухолевых клеток.