19 вместо 20: ученые с помощью ИИ переписали часть генетического кода — и бактерия выжила

С помощью ИИ биологи из Колумбии и Гарварда спроектировали рибосому, которая работает без изолейцина — одной из 20 аминокислот, общих для всего живого на Земле.
В любом живом организме — от бактерии до человека — белки собраны из одного и того же набора в 20 аминокислот. Аминокислоты — это «кирпичики»: их последовательность определяет форму и функцию каждого белка, а значит, и всю биохимию клетки. Набор из 20 аминокислот настолько универсален, что биологи считают его наследием последнего общего предка всего живого. Но была ли эта двадцатка единственно возможной? Многие гипотезы предполагают, что древнейшие организмы обходились меньшим количеством. Проверить это экспериментально до недавнего времени было практически невозможно — перестроить белки вручную слишком сложно. Но за последние годы появились ИИ-модели, способные проектировать белковые структуры с нуля, и команда из Колумбийского и Гарвардского университетов решила это использовать. Результаты опубликованы в журнале Science.
Исследователи решили проверить, можно ли полностью убрать из клетки одну аминокислоту — и выбрали изолейцин. Он очень похож на две другие аминокислоты: валин и лейцин. Все три отталкивают воду и обычно оказываются в глубине белковой структуры, формируя ее внутренний каркас. При сравнении одного и того же белка у родственных видов бактерий именно изолейцин чаще других аминокислот оказывается заменен — как правило, на валин. То есть эволюция и сама нередко обходится без него в конкретных позициях, а значит, он может быть наименее «незаменимым» из двадцати.
Объектом эксперимента стала кишечная палочка E. coli — стандартный модельный организм в молекулярной биологии, одноклеточная бактерия с хорошо изученным геномом. Переписать все ее ~4 500 генов разом невозможно — такое количество изменений убило бы клетку. Поэтому исследователи сосредоточились на рибосоме. Это молекулярный комплекс из десятков белков и РНК, который отвечает за сборку всех остальных белков в клетке. Ее компоненты должны точно подходить друг к другу, как детали в механизме — а значит, если рибосома продолжит работать без изолейцина, это сильный аргумент в пользу того, что аминокислота действительно не является незаменимой.
Простая замена изолейцина на похожий валин сработала лишь в 43% случаев — остальные белки переставали работать или убивали клетку. Тогда исследователи подключили несколько ИИ-программ для проектирования белков, в том числе ESM2, MSA Transformer и ProteinMPNN, а результаты проверяли с помощью AlphaFold 2 — ИИ-системы для предсказания трехмерной структуры белков, за которую в 2024 году вручили Нобелевскую премию по химии. Перед программами стояла задача: предложить такие замены аминокислот, чтобы белок сохранил свою форму и функцию, но больше не содержал ни одного изолейцина. Через несколько итераций «спроектировать — собрать — проверить» удалось получить рабочие варианты практически для всех рибосомных белков.
Практически — но не для всех. Один ген, rplW, стал камнем преткновения. ИИ предложил для него решение, которое работало изолированно, но ломало клетку в сочетании с остальными 20 измененными белками. Рибосома — система: каждый компонент зависит от соседних, и удачная замена в одном белке может конфликтовать с удачной заменой в другом. В итоге команда решила задачу перебором: программы предложили варианты аминокислот для каждой из четырех позиций изолейцина в rplW, исследователи проверили все 16 комбинаций — и одна из них сработала. Показательно, что этот вариант rplW убивает клетку, если вставить его в геном отдельно: он жизнеспособен только в контексте всех остальных изменений рибосомы.
В финальном эксперименте исследователи собрали из 21 переписанного белка одну из двух половин рибосомы и вставили соответствующие гены в геном E. coli. Бактерия выжила и делилась со скоростью около 60% от нормальной. За 450 поколений ни одна мутация не вернула изолейцин обратно. Это означает, что клетка нашла стабильное состояние: модифицированная рибосома работает достаточно хорошо, чтобы эволюция не «требовала» изолейцин назад. Почему клетки растут медленнее — пока неизвестно: возможно, переписанная рибосома менее точна при сборке белков или работает медленнее как катализатор.
Интересно, что ИИ нередко предлагал замены, которые биолог счел бы нелогичными: например, ставил аминокислоту с электрическим зарядом туда, где раньше стояла нейтральная. При этом разные программы нередко противоречили друг другу, предлагая для одной и той же позиции совершенно разные решения. Исследователи предполагают, что модели «исследуют разные области пространства возможных последовательностей» — но точно этого не знают, потому что ИИ не раскрывает ход своих «рассуждений». Как пишет Джон Тиммер, научный обозреватель Ars Technica, «Пока эти программы — инструменты: они позволяют делать то, что без них невозможно сделать, но не помогают это понять. Думать по-прежнему приходится нейронными сетями у нас в голове».
До полностью «19-аминокислотного» организма еще далеко: пока переписана только половина рибосомы одной бактерии, и клетки растут медленнее обычного. Но за два года лабораторной работы ученые радикально изменили систему, которую эволюция выстраивала миллиарды лет. Это и демонстрация возможностей искусственного интеллекта в биологии, и фундаментальный вопрос: что еще в генетическом коде устроено не так незыблемо, как принято считать?
Миллиарды лет эволюции - и мы опять всё сломали за пару-тройку)) А если серьезно - очень круто. Лишь бы в итоге в код ДНК ненавязчиво не влезли гоблины из новости выше)) Надеюсь, будете судьбу истории дальше отслеживать, почитаем-с.