Анализируя свойства созданного в пробирке ДНК, исследователям из Microsoft и Университета Вашингтона удалось не только закодировать и декодировать 200 Мбайт данных, но и обеспечить их долговременное хранение.

«В закодированном виде данные занимали место размером с острие карандаша», — сообщил Дуглас Кармин, куратор проекта из Microsoft.

Хранилище ДНК имеет период полураспада 500 лет даже в достаточно жестких условиях (данный параметр определяет продолжительность времени, в течение которого распадается половина связей в цепочке. — Прим. ред.).

«Представьте себе все данные большого ЦОД, сжатые в объеме маленького кубика сахара, — говорится в блоге Microsoft. — Или все данные мирового Интернета, помещенные в коробку из-под обуви. Таким может оказаться потенциал хранилища, организованного в ДНК, если удастся масштабировать технологию и преодолеть ряд технических препятствий».

Хранимые в молекулах ДНК данные включают цифровые версии произведений искусства, музыкальное видео группы OK Go! в формате высокой четкости, Универсальную декларацию прав человека, записанную более, чем на 100 языках, 100 наиболее популярных книг Проекта Гутенберга, а также базу семян некоммерческой организации Crop Trust.

Хранилище на молекулярном уровне имеет гораздо большую плотность по сравнению с жесткими дисками, твердотельными накопителями и даже новейшими технологиями наподобие памяти с изменением фазового состояния. Кроме того, системы эти через несколько лет или десятилетий деградируют, в то время как ДНК позволяет надежно хранить информацию на протяжении столетий. Вместе с тем, ДНК лучше подходит для архивных приложений, чем для систем, где доступ к файлам нужно получать немедленно.

По словам исследователей, они разработали «новый подход» к преобразованию длинных строк нулей и единиц цифровых данных в четыре основных строительных блока последовательностей ДНК — аденин (As), гуанин (Gs), цитозин (Cs) и тимин (Ts).

Цифровые данные разбиваются на фрагменты и размещаются в большом количестве крошечных молекул ДНК, которые могут быть обезвожены и храниться на протяжении длительного времени.

В закодированном виде данные заняли в пробирке место размером с острие карандаша     
Источник: Tara Brown Photography/ University of Washington

«Здесь мы видим пример того, как при хранении информации задействуются природные компоненты — ДНК, — указал доцент университета Вашингтона Луис Энрике Сез. — Вместе с тем, мы взяли кое-что и из компьютерной отрасли (способы коррекции ошибок в памяти), применив существующие наработки к природным компонентам».

Сегодня большинство данных хранятся на магнитных и оптических носителях. В последнее время плотность размещения битов на магнитных лентах заметно возросла, емкость ленточных картриджей достигла 185 Тбайт, а наибольшая плотность хранилищ коммерческих систем составляет 10 Гбайт на миллиметр. Недавние исследования показали, что емкость оптических дисков можно увеличить до 1 петабайта, в этом случае плотность записи достигает 100 Гбайт/мм. Но несмотря на столь значительный прогресс, хранение зеттабайт данных все равно потребует миллионов устройств и огромного физического пространства.

Теоретический предел ДНК составляет около одного эксабайта на миллиметр, что на восемь порядков превышает возможности магнитных лент. Кроме того, хранилище на основе ДНК сохраняет свою актуальность вечно: пока существует жизнь на основе ДНК, основания для считывания данных из ДНК и манипулирования ими никуда не исчезнут.

Благодаря Интернету вещей удвоение объемов цифровых данных происходит через каждые два года, и к 2020 году они достигнут 44 триллионов гигабайт.

Исследователи проводят эксперименты с ДНК, используемой в качестве среды хранения данных, уже больше десятка лет, и прогресс здесь достигается очень быстро. В 1999 году хранилище, созданное на базе ДНК, позволяло закодировать и восстановить сообщение длиной всего в 23 символа.

В 2013 году ученые из EMBL-European Bioinformatics Institute объявили, что закодировали в ДНК MP3-версию речи Мартина Лютера Кинга «У меня есть мечта».

«Молекула ДНК — удивительное хранилище информации, в котором закодированы данные о работе живой системы, — отметил Сез. — Мы же решили использовать это пространство для хранения цифровых данных — изображений, видео, документов. Вот важный пример потенциала, позаимствованного у природы для создания еще более эффективных компьютерных систем».