«Цифровые двойники» вместо реальных пациентов: как Mantis Biotech решает проблему данных в медицине

Большие языковые модели, обученные на масштабных массивах данных, обещают многое: ускорить геномные исследования, упростить ведение клинической документации, повысить точность диагностики в реальном времени, помочь врачам в принятии решений, ускорить разработку лекарств и даже генерировать для научных экспериментов данные, имитирующие реальные.
Но на практике эти обещания часто упираются в одну и ту же проблему: за пределами хорошо структурированных данных, на которых строится современная медицина, модели работают плохо. Особенно это заметно при исследовании редких и нетипичных диагнозов, по которым надежных и репрезентативных данных попросту мало.
Нью-йоркский стартап Mantis Biotech заявляет, что работает над решением именно этой проблемы. Платформа компании собирает данные из разрозненных источников и на их основе создает синтетические датасеты — то есть сгенерированные наборы данных, имитирующие реальные, — которые используются для построения так называемых «цифровых двойников» человеческого тела. По сути, это модели анатомии, физиологии и поведения, способные делать прогнозы и построенные на основе физического моделирования — то есть учитывающие реальную биомеханику тела.
Компания позиционирует цифровых двойников как инструмент для сбора и анализа данных. Области применения широкие: изучение и тестирование новых медицинских процедур, обучение хирургических роботов, моделирование и прогнозирование проблем со здоровьем и даже поведенческих паттернов. Например, специалисты спортивного клуба могут оценить вероятность травмы ахиллова сухожилия у конкретного игрока NFL, опираясь на его показатели в последних играх, тренировочную нагрузку, питание и время без перерывов в тренировках, — объяснила основательница и CEO Mantis Джорджия Уитчел в интервью TechCrunch.
Для построения двойников платформа Mantis сначала собирает данные из разных источников: медицинских учебников, камер захвата движения, биометрических датчиков, журналов тренировок и медицинских снимков. Затем система на базе большой языковой модели проверяет, сортирует и объединяет эти потоки данных, после чего пропускает их через физический движок — он создает высокоточные визуализации, на основе которых обучаются прогностические модели.
«Мы берем все эти разрозненные источники данных и превращаем их в прогностические модели — они предсказывают, как поведет себя организм человека. По сути, каждый раз, когда нужно спрогнозировать, как будет функционировать человеческое тело, — это прямой сценарий для нашей технологии», — говорит Уитчел.
Ключевую роль в этом процессе играет так называемый физический движок — программный компонент, который симулирует поведение тела по законам физики, рассказала Уитчел TechCrunch. Именно он позволяет платформе дополнять и расширять имеющуюся информацию: синтетические данные опираются на реальную физику тела, а анатомия моделируется с учетом настоящих биомеханических закономерностей.
«Представьте, что нужно научить ИИ распознавать положение кисти руки у человека, у которого не хватает пальца. Для любой существующей модели это крайне сложная задача — просто потому, что в открытом доступе нет размеченных данных о положениях рук с отсутствующим пальцем. А мы можем сгенерировать такой датасет элементарно: берем нашу физическую модель, говорим — убрать палец X, перегенерировать модель — и готово», — объясняет она.
Поскольку платформа Mantis закрывает пробелы в данных, Уитчел видит широкий потенциал для ее применения в сфере биомедицины — там, где информация о процедурах или пациентах часто труднодоступна, не систематизирована или разбросана по разным источникам. Особенно это актуально для редких и нетипичных диагнозов: данные по ним сложно получить из-за этических и регуляторных ограничений на использование информации о пациентах в открытых датасетах и для обучения ИИ-моделей.
«Знаете, как трехлетний ребенок бегает с куклой Барби: держит ее за ногу и колотит об стол? Я хочу, чтобы люди относились к нашим цифровым двойникам именно так», — говорит Уитчел. По ее словам, цифровые двойники решают сразу две проблемы. Во-первых, они позволяют проводить с виртуальными моделями эксперименты, которые невозможны с живыми людьми по этическим соображениям. Во-вторых, снимают необходимость использовать реальные данные пациентов: «Я считаю, что данные реальных людей вообще не должны эксплуатироваться без необходимости — тем более когда есть цифровые двойники».
Пока наиболее заметных результатов Mantis добилась в работе с профессиональным спортом: там есть очевидный спрос на моделирование физических возможностей атлетов. По словам Уитчел, один из ключевых клиентов стартапа — команда NBA.
«Мы создаем цифровые модели спортсменов, которые воспроизводят, как атлет прыгал — не только сегодня, а каждый день за последний год. И как его прыжки менялись со временем в зависимости от того, сколько он спал или сколько раз поднимал руки над головой», — объясняет она.
Недавно стартап привлек 7,4 миллиона долларов инвестиций. Раунд возглавил венчурный фонд Decibel VC, среди других инвесторов — знаменитый стартап-акселератор Y Combinator и ряд частных инвесторов. Средства пойдут на расширение команды, маркетинг и продвижение продукта на рынке.
В ближайших планах Mantis, по словам Уитчел, — развивать технологию и со временем открыть платформу для широкой аудитории с акцентом на профилактическую медицину. Параллельно компания адаптирует платформу для фармацевтических лабораторий и исследователей, проводящих клинические испытания по стандартам FDA (Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США), — чтобы помочь лучше понимать, как организм пациентов реагирует на лечение.
Пока нет комментариев. Будьте первым!