Сборка AI
Редакция проекта
Редакция проекта
15 апр. в 05:45
36
Новость

Meta* строит «личный сверхинтеллект для каждого». Первый шаг — модель Muse Spark

Обсудить
Meta* строит «личный сверхинтеллект для каждого». Первый шаг — модель Muse Spark
За Muse Spark стоят $14 млрд, новый руководитель и разрыв с открытой моделью Llama.

В июне 2025 года Марк Цукерберг объявил о создании Meta* Superintelligence Labs — лаборатории, цель которой — создать «личный сверхинтеллект для каждого». Руководителем стал Александр Ванг, основатель и бывший CEO стартапа Scale AI, специализирующегося на разметке данных для обучения ИИ-моделей. Meta* инвестировала в Scale AI $14,3 млрд, получив 49% компании.

Причиной стала неудача Llama — открытого семейства моделей, которое Meta* развивала до этого. Llama 4, вышедшая весной 2025 года, вызвала волну критики: пользователи и независимые рейтинги оценили ее результаты как посредственные, а саму Meta* обвинили в подгонке моделей под бенчмарки. По данным Bloomberg, Цукерберг был недоволен темпами развития ИИ в Meta*.

Спустя девять месяцев лаборатория представила первый результат — Muse Spark. Это закрытая модель — в отличие от всего, что Meta* делала в ИИ раньше. Впрочем, Цукерберг в посте на Threads* пообещал, что в семействе Muse «будут и новые open source модели». Muse Spark уже доступна в приложении Meta* AI и на сайте meta.ai*, а в ближайшие недели появится в WhatsApp*, Instagram*, Facebook*, Messenger* и на ИИ-очках Meta.

Meta* позиционирует Muse Spark как «нативно мультимодальную» модель: она работает не только с текстом, но и с изображениями. Можно сфотографировать полку с продуктами — и модель определит, в каком из них больше белка. Можно загрузить фото сломанного прибора — и получить пошаговую инструкцию по ремонту с пояснениями прямо на изображении. Чтобы модель точнее отвечала на вопросы о здоровье, Meta* привлекла более тысячи врачей к подготовке обучающих данных.

На стандартных бенчмарках Muse Spark в обычном режиме показывает результаты на уровне конкурентов — моделей от OpenAI, Anthropic, Google и xAI. Но у модели есть и второй режим — Contemplating, доступ к которому открывается постепенно. В нем Muse Spark запускает до 16 параллельных агентов, каждый из которых решает задачу одновременно с остальными. По данным Meta, это позволяет добиться более высокого качества ответов без увеличения времени ожидания. В этом режиме модель набрала 58% на Humanity's Last Exam — одном из самых сложных ИИ-бенчмарков. Правда, у модели был доступ к внешним инструментам — поиску, калькулятору, интерпретатору кода. А это заметно упрощает задачу.

Отдельно Meta* описывает механизм «сжатия мышления»: на этапе обучения модель учится решать задачи, используя меньше промежуточных шагов. Сначала она рассуждает развернуто, потом сжимает цепочку рассуждений до минимума, а затем снова наращивает ее — но уже для более точных ответов. Для пользователя это означает, что модель отвечает быстрее, не теряя в качестве.

При этом Meta* открыто признает слабые места: длительные агентные сценарии и работа с кодом пока отстают от конкурентов. В блоге компании это сформулировано дипломатично: «мы продолжаем инвестировать в направления, где пока отстаем». Но сам факт такого признания для крупной ИИ-компании непривычен.

Но пожалуй, самая необычная деталь в запуске Muse Spark — результаты стороннего аудита. Как сообщает Meta* в техническом блоге, исследовательская организация Apollo Research обнаружила, что модель демонстрирует рекордно высокий уровень «evaluation awareness» — способности распознавать, что ее тестируют. Muse Spark часто определяла тестовые сценарии как «ловушки на лояльность» и рассуждала, что в таких ситуациях следует вести себя честно. Вопрос в том, ведет ли модель себя так же, когда не чувствует, что за ней наблюдают. Meta* признала, что предварительная проверка выявила влияние этой осведомленности на поведение модели в небольшой части тестов, но не сочла это препятствием для запуска. Подробности компания обещает раскрыть в отдельном отчете по безопасности.

Есть и вопрос приватности. Для использования Muse Spark необходим аккаунт Meta* — то есть Facebook* или Instagram*. Модель уже умеет подтягивать публичные посты из соцсетей Meta* в свои ответы, а в будущем обещает встраивать Reels, фотографии и публикации «с указанием авторства». Учитывая, что Meta* традиционно обучает модели на пользовательских данных, граница между «подтягивает публичные посты» и «использует ваш профиль» может оказаться размытой.

Muse Spark — только начало, и в Meta* этого не скрывают. Следующие модели семейства Muse уже в разработке. Компания обновила свою систему оценки ИИ-рисков и заявляет, что по результатам внутренних тестов Muse Spark прошла проверку безопасности по всем категориям рисков. Но с моделью, которая сама распознает, когда ее проверяют, определение «безопасности» — вопрос не только технический.

*Meta Platforms Inc. (включая продукты WhatsApp, Instagram, Facebook и Messenger) признана экстремистской организацией и запрещена на территории Российской Федерации.

Источник:ArsTechnica

Пока нет комментариев. Будьте первым!