Найбільша біологічна AI-модель здатна створювати ДНК на замовлення


Вчені представили революційну штучну нейромережу Evo-2, навчену на 128 тисячах геномів різних організмів — від людини до бактерій. Модель може писати цілі хромосоми та невеликі геноми з нуля, а також аналізувати існуючі послідовності ДНК, включаючи некодуючі варіанти генів.

Ілюстративне фото, Steve Johnson
Ілюстративне фото, Steve Johnson

Дослідники з Arc Institute та Стенфордського університету в Пало-Альто спільно з компанією NVIDIA представили найпотужнішу на сьогодні модель штучного інтелекту для біології. Evo-2 стала результатом навчання на безпрецедентному масиві даних — 128 тисячах геномів, що охоплюють все дерево життя від людини до одноклітинних бактерій та архей.

Нова модель доступна науковцям через веб-інтерфейси, а її програмний код, дані та інші параметри, необхідні для відтворення моделі, можна вільно завантажити. За словами Патріка Хсу, біоінженера з Arc Institute та Каліфорнійського університету в Берклі, розробники розглядають Evo-2 як платформу, яку інші можуть адаптувати для власних потреб.

На відміну від попередніх моделей, які працювали лише з білковими послідовностями, Evo-2 навчалася на геномних даних, що містять як кодуючі послідовності, які несуть інструкції для створення білків, так і некодуючу ДНК. Ця некодуюча ДНК включає послідовності, які можуть контролювати коли, де і як активуються гени. Загальний обсяг проаналізованих даних склав 9,3 трильйона літер ДНК.

Модель продемонструвала вражаючі результати у передбаченні впливу раніше досліджених мутацій у гені BRCA1, пов'язаному з раком молочної залози. За словами розробників, вона майже не поступається найкращим біо-ІІ моделям у визначенні того, чи можуть зміни в кодуючих регіонах викликати захворювання.

Дослідники також протестували здатність моделі розшифровувати інші особливості складних геномів, включаючи геном шерстистого мамонта. «Evo-2 представляє значний крок у вивченні регуляторної граматики ДНК», — зазначає Крістіна Теодоріс, обчислювальний біолог з Інститутів Гладстона в Сан-Франциско.

Одна з найцікавіших можливостей геномних моделей, подібних до Evo-2, полягає в тому, що вони можуть генерувати нові послідовності ДНК, що відповідають не лише білкам, а й некодуючим послідовностям, які працюють з ними. Команда вже використала попередню версію моделі для створення нових генних редакторів CRISPR, які були успішно протестовані в лабораторних експериментах.

Використовуючи Evo-2, дослідники створили геноми, натхненні Mycoplasma genitalium — бактерією, яка стала першим клітинним організмом з повністю синтезованим геномом — мітохондріями людини та хромосомою дріжджів довжиною 330 000 літер ДНК. Хоча ці геноми виглядали більш реалістичними порівняно з тими, що генерувала Evo-1, розробники визнають, що «все ще є простір для вдосконалення».

Дослідники планують провести лабораторні експерименти для валідації Evo-2. Зокрема, вони розробили послідовності, які змінюють доступність згорнутої ДНК, званої хроматином — особливості, що впливає на ідентичність клітин у багатоклітинних організмах — і співпрацюють з іншою лабораторією для тестування цих розробок на ембріональних стовбурових клітинах миші.

— За матеріалами nature