OpenAI хочет ускорить разработку лекарств и выпустила для этого отдельную модель

Модель названа в честь Розалинд Франклин — кристаллографа, чьи исследования помогли раскрыть структуру ДНК. GPT-Rosalind стала первой серией моделей OpenAI, созданной под конкретные области науки: биохимию, геномику и белковую инженерию. Доступ открыт только проверенным корпоративным клиентам в рамках программы trusted-access — среди них гиганты life sciences: Amgen, Moderna и Thermo Fisher Scientific.

OpenAI представила GPT-Rosalind — одну из самых продвинутых ИИ-моделей компании с развитыми способностями к рассуждению, созданную специально под исследования в области life sciences: так называют науки о живой природе — от биологии и генетики до фармацевтики и биомедицины. Об этом компания сообщила в четверг, 16 апреля.

Модель должна помогать ученым собирать и сопоставлять данные из научных публикаций, формулировать гипотезы, планировать эксперименты и вести научную работу, которая состоит из нескольких последовательных шагов. Всё это — в трех областях: биохимии, геномике и белковой инженерии. Для OpenAI это первая серия моделей, изначально заточенная под конкретную сферу.

Пока GPT-Rosalind доступна в формате research preview — ранней тестовой версии, которую OpenAI открывает ограниченному кругу пользователей для обкатки и сбора обратной связи. Работать с моделью можно в ChatGPT, Codex и через API OpenAI, но подключиться смогут только корпоративные клиенты из США, прошедшие отбор в программу trusted-access — это ограниченный доступ для проверенных организаций, от которых OpenAI требует жесткого соблюдения стандартов безопасности.

Модель названа в честь Розалинд Франклин — британского химика и кристаллографа, чьи рентгеновские снимки ДНК сыграли ключевую роль в открытии двойной спирали. При этом имя Франклин не прозвучало в 1962 году, когда Нобелевскую премию за это открытие получили Джеймс Уотсон, Фрэнсис Крик и Морис Уилкинс.

Выбор имени — жест осознанный. Сегодня вклад Франклин считают одним из фундаментальных для современной молекулярной биологии, а ее историю часто вспоминают, когда говорят о том, как женщин вычеркивали из научного канона.

OpenAI подает GPT-Rosalind как инструмент, который должен сократить путь от научной идеи до клинически подтвержденного результата. По оценкам компании, сегодня в США от момента, когда исследователи определяют потенциальную мишень для лекарства, до одобрения нового препарата регулятором проходит примерно 10–15 лет.

GPT-Rosalind нацелена на самые ранние этапы этого пути: она умеет работать со специализированными базами данных, разбирать научные публикации, взаимодействовать с вычислительными инструментами и предлагать новые направления для экспериментов — и всё это в рамках одного интерфейса.

Вместе с самой моделью OpenAI выпускает Life Sciences research plugin — расширение для Codex, которое связывает модели OpenAI с более чем 50 научными инструментами и источниками данных, давая исследователям программный доступ к ним напрямую из кода.

Среди партнеров запуска — уже упомянутые Amgen, Moderna и Thermo Fisher Scientific, а также Allen Institute, независимый исследовательский центр в области биомедицины. Отдельно OpenAI сотрудничает с Лос-Аламосской национальной лабораторией — работа ведется над дизайном белков и катализаторов с помощью ИИ.

OpenAI также приводит результаты бенчмарков. BixBench — это тест от компании Edison Scientific, оценивающий, насколько хорошо ИИ справляется с реальными задачами вычислительной биологии. GPT-Rosalind набрала на нем 0,751 из 1 — то есть правильно решила 75,1% задач.

На более широком исследовательском бенчмарке LABBench2 GPT-Rosalind обошла GPT-5.4 в шести задачах из одиннадцати. Самое заметное преимущество — на CloningQA: это тест, в котором нужно от начала до конца спроектировать реагенты для молекулярного клонирования.

Но самый яркий результат — независимая оценка, которую совместно с OpenAI провела Dyno Therapeutics. Эта компания из сферы генной терапии занимается проектированием капсидных белков AAV — из таких белков состоят оболочки аденоассоциированных вирусов, которые в генной терапии используются как контейнеры для доставки лечебных генов в клетки.

Чтобы исключить риск того, что модель уже «видела» тестовые данные на этапе обучения, для проверки взяли ранее не опубликованные РНК-последовательности. На них GPT-Rosalind решала две задачи: предсказать функцию по заданной последовательности и сгенерировать новую последовательность.

На каждую задачу модели давали по десять попыток, и лучшую сравнивали с результатами живых экспертов. По данным OpenAI, в предсказании GPT-Rosalind оказалась выше 95-го процентиля — то есть ее результат был лучше, чем у 95% специалистов. В генерации последовательностей — около 84-го процентиля.

У запуска есть серьезные оговорки, связанные с так называемым dual-use — когда одна и та же разработка может приносить пользу, а может использоваться во вред. Исследователи давно предупреждают: ИИ-модели, обученные на биологических данных, могут быть использованы не во благо — например, для создания опасных патогенов.

Именно поэтому OpenAI открывает доступ к GPT-Rosalind только через программу trusted-access. Чтобы туда попасть, организация должна доказать, что ее работа направлена на решение задач здравоохранения, и подтвердить, что у нее выстроены строгие процедуры безопасности и управления рисками. На время открытой для избранных тестовой фазы запросы к модели не будут расходовать уже имеющиеся у клиентов API-кредиты.

OpenAI сделала ставку на компромисс: максимально закрытый запуск с сильными ограничениями — в обмен на возможность ввести ИИ в одну из самых чувствительных научных областей.

OpenAI хочет ускорить разработку лекарств и выпустила для этого отдельную модель — GPT-Rosalind

Комментарии (0)

Комментарии (0)