От смартфонов в большие модели: Xiaomi представляет MiMo-V2-Pro и бросает вызов ценовому балансу на рынке ИИ

Китайский техногигант Xiaomi, известный прежде всего смартфонами и «умной» электроникой, неожиданно для многих заявил о себе в сегменте больших языковых моделей. Компания представила MiMo-V2-Pro — фундаментальную ИИ-модель с триллионом параметров — настраиваемых значений, от количества которых во многом зависят возможности модели, — которая по показателям тестов приближается к флагманским разработкам OpenAI и Anthropic. При этом MiMo-V2-Pro обходится пользователям API — программного интерфейса, через который разработчики подключают модель к своим продуктам — примерно в шесть-семь раз дешевле (при объеме запроса до 256 тысяч токенов). Модель уже вошла в десятку глобального рейтинга Intelligence Index от Artificial Analysis, оценивающего когнитивные способности ИИ-моделей, обозначив новый виток ценовой конкуренции на рынке ИИ.

Проект возглавляет Фули Ло — в прошлом один из ключевых участников команды DeepSeek R1, модели, которая в начале 2025 года произвела фурор как мощная и при этом недорогая альтернатива западным решениям. Сама Ло называет выпуск MiMo-V2-Pro «тихим наступлением» на передовой ИИ-разработки. Кроме того, она сообщила в публикации на платформе X, что Xiaomi планирует выложить в открытый доступ одну из версий модели — «когда она станет достаточно стабильной, чтобы этого заслуживать».

Амбиции Xiaomi, очевидно, выходят далеко за пределы привычных чат-ботов. Компания делает ставку на так называемое «пространство действий»: переход от генерации текста и кода к автономной работе ИИ-агентов, способных самостоятельно управлять цифровыми инструментами. Иными словами, речь идет не о модели, которая отвечает на вопросы, а о модели, которая выполняет задачи.

Для Xiaomi это логичное продолжение стратегии последовательного выхода в новые отрасли. Компания со штаб-квартирой в Пекине давно вышла за рамки потребительской электроники: будучи третьим крупнейшим производителем смартфонов в мире, Xiaomi в начале 2020-х совершила амбициозный рывок в автомобильную отрасль. Электромобили SU7 и недавно представленный кроссовер YU7 превратили компанию в технологического гиганта, контролирующего всю цепочку: от комплектующих до готового продукта, — и объединяющего «железо», софт и теперь технологии искусственного интеллекта.

Именно этот опыт проектирования сложных устройств, как отмечает VentureBeat, определяет архитектурную философию MiMo-V2-Pro. Модель задумана как «мозг» комплексных систем, будь то управление глобальными цепочками поставок или координация автономных программных агентов, пишущих и выполняющих код.

Технология: как устроена MiMo-V2-Pro

Главный вызов для современных ИИ-моделей, работающих в режиме автономных агентов (то есть программ, способных не просто отвечать на вопросы, а самостоятельно выполнять цепочки действий: открывать файлы, запускать команды, проверять результат и переходить к следующему шагу без участия человека), — сохранять точность рассуждений при обработке огромных объемов данных, не раздувая при этом ни время отклика, ни стоимость вычислений. MiMo-V2-Pro решает эту задачу с помощью так называемой разреженной архитектуры: из триллиона параметров модели при обработке каждого конкретного запроса задействованы лишь 42 миллиарда. Это примерно в три раза больше, чем у предшественника — MiMo-V2-Flash, — но значительно экономнее, чем если бы модель активировала все свои параметры одновременно.

За эффективность модели отвечает усовершенствованный механизм гибридного внимания, определяющий, на какие части данных стоит «смотреть» внимательнее. Обычно языковые модели, построенные на архитектуре трансформеров (она лежит в основе практически всех современных ИИ: от ChatGPT до Claude), сталкиваются с проблемой: чем длиннее контекст (то есть чем больше текста модель должна «помнить» при обработке запроса), тем быстрее растут вычислительные затраты — причем не линейно, а квадратично. MiMo-V2-Pro обходит это ограничение за счет гибридного соотношения 7:1 — на каждые семь слоев «быстрого» просмотра данных приходится один слой глубокого, ресурсоемкого анализа. В предыдущей версии Flash это соотношение составляло 5:1. Такой подход позволяет модели работать с контекстным окном в миллион токенов и при этом не терять в скорости и качестве даже при работе с очень большими объемами информации.

Работает это примерно так же, как действует опытный исследователь в огромной библиотеке: вместо того чтобы читать каждую книгу от корки до корки, он бегло просматривает около 85% материала, выхватывая общий контекст, и лишь на оставшихся 15% — наиболее значимых для текущей задачи — сосредотачивает максимальное внимание.

Дополнительно модель оснащена механизмом опережающей генерации, позволяющим предсказывать сразу несколько следующих слов за раз (Multi-Token Prediction). Если обычная модель генерирует текст по одному слову, MiMo-V2-Pro способна «предугадывать» сразу несколько следующих элементов, что существенно ускоряет работу, особенно на этапах, когда агент «размышляет» над сложной многошаговой задачей. По словам Фули Ло, эти архитектурные решения были заложены за несколько месяцев до релиза: специально с расчетом на то, что индустрия стремительно движется в сторону автономных ИИ-агентов.

Результаты тестов: что говорят независимые оценки

По результатам тестов, проведенных самой Xiaomi, модель сильна прежде всего в практических, «реальных» задачах — а не только в синтетических тестах, специально сконструированных для измерения отдельных навыков. На бенчмарке GDPval-AA, который оценивает способность модели выполнять рабочие задачи в режиме автономного агента, MiMo-V2-Pro набрала рейтинг Elo 1426, опередив крупных китайских конкурентов: GLM-5 (1406) и Kimi K2.5 (1283).

До западных лидеров модель пока недотягивает: например, Claude Sonnet 4.6 от Anthropic показывает 1633 балла в том же рейтинге. Тем не менее MiMo-V2-Pro — это наивысший зафиксированный результат среди моделей китайского происхождения в данной категории.

Эти результаты подтвердила и независимая организация Artificial Analysis, специализирующаяся на сравнительном тестировании ИИ-моделей. По ее глобальному рейтингу Intelligence Index MiMo-V2-Pro заняла 10-е место с показателем 49 баллов — на одном уровне с GPT-5.2 Codex от OpenAI и выше Grok 4.20 Beta от xAI. По оценке аналитиков, это свидетельствует о том, что Xiaomi удалось создать модель, пригодную для сложных инженерных и производственных задач, требующих глубоких рассуждений.

Сравнение с предыдущей версией — MiMo-V2-Flash, набравшей 41 балл по тому же индексу и распространяемой с открытыми весами (то есть с возможностью изучить и модифицировать внутреннее устройство модели), — показывает заметный прогресс по ключевым метрикам:

Уровень «галлюцинаций» (случаев, когда модель уверенно выдает недостоверную информацию): снижен с 48% у Flash до 30% у Pro.
Индекс полноты знаний: MiMo-V2-Pro набрала +5, опередив GLM-5 (+2) и Kimi K2.5 (−8).
Эффективность использования токенов: для прохождения полного набора тестов Intelligence Index модели потребовалось лишь 77 млн выходных токенов — заметно меньше, чем GLM-5 (109 млн) или Kimi K2.5 (89 млн). Это говорит о том, что модель рассуждает компактнее и не «тратит слова впустую».

Собственные тесты Xiaomi дополнительно подчеркивают сильные стороны модели в роли универсального и кодирующего агента. На бенчмарке ClawEval, оценивающем способность модели работать в связке с внешними инструментами, MiMo-V2-Pro набрала 61,5 балла — близко к Claude Opus 4.6 (66,3) и значительно выше GPT-5.2 (50,0). А в тестовой среде Terminal-Bench 2.0, которая имитирует работу программиста в командной строке, модель показала 86,7 — что свидетельствует о высокой надежности при выполнении практических задач по написанию и запуску кода.

Что выход MiMo-V2-Pro меняет для бизнеса

Для компаний, уже внедряющих ИИ в свои процессы, появление MiMo-V2-Pro может существенно изменить расклад в соотношении «цена — качество». VentureBeat рассматривает модель с точки зрения нескольких ключевых ролей в организации.

Для тех, кто отвечает за ИИ-инфраструктуру, главный аргумент — стоимость. По данным Artificial Analysis, полный прогон их тестового индекса на MiMo-V2-Pro обошелся всего в $348 — против $2 304 для GPT-5.2 и $2 486 для Claude Opus 4.6. Иными словами, компании получают доступ к модели из мировой десятки примерно за одну седьмую стоимости западных аналогов — серьезный стимул для того, чтобы как минимум протестировать ее на реальных производственных задачах.

Для специалистов по работе с данными ключевое преимущество — контекстное окно в миллион токенов. На практике это означает, что в один запрос к модели можно загрузить весь программный код проекта или объемный набор внутренней документации, не разбивая их на фрагменты, — что неизбежно при работе с моделями, поддерживающими меньший контекст.

Тем, кто проектирует системы оркестрации — то есть координации нескольких ИИ-агентов, работающих над общей задачей, — стоит рассмотреть MiMo-V2-Pro в роли центрального «мозга». Модель оптимизирована для работы с инструментами OpenClaw и Claude Code и способна к долгосрочному планированию и точному использованию внешних инструментов без постоянного контроля со стороны человека — проблемы, которая ограничивала возможности более ранних моделей. Высокие результаты на бенчмарке GDPval-AA подтверждают, что модель хорошо подходит для построения сложных многоэтапных рабочих процессов, выходящих за рамки простой автоматизации.

Однако у специалистов по безопасности есть основания для осторожности. Те же самые качества, которые делают модель мощным агентом, — способность работать в командной строке, открывать и редактировать файлы — одновременно создают дополнительные уязвимости: от внедрения вредоносных инструкций в запросы до несанкционированного доступа к модели. При этом, в отличие от версии Flash, веса MiMo-V2-Pro закрыты — а значит, команды безопасности не могут провести глубокий аудит внутреннего устройства модели, что иногда критически важно при развертывании в чувствительных средах. Относительно невысокий уровень «галлюцинаций» (30%) — аргумент в пользу надежности, но VentureBeat подчеркивает: любое корпоративное внедрение должно сопровождаться строгими протоколами мониторинга и проверки результатов.

Цены, доступность и перспективы

Ценовая политика MiMo-V2-Pro явно нацелена на завоевание рынка разработчиков. Тарифы зависят от объема контекста, а для часто повторяющихся запросов предусмотрены льготные условия кэширования — механизма, позволяющего не пересчитывать уже обработанные данные заново. Стоимость рассчитывается отдельно за входные токены (данные, которые пользователь отправляет модели) и выходные (ответ, который модель генерирует).

MiMo-V2-Pro (до 256K токенов): $1 за 1 млн входных токенов и $3 за 1 млн выходных токенов.
MiMo-V2-Pro (256K–1M токенов): $2 за 1 млн входных токенов и $6 за 1 млн выходных токенов.
Чтение из кэша: $0,20 за 1 млн токенов на нижнем тарифе и $0,40 на верхнем.
Запись в кэш: временно бесплатно.

Для наглядности — сравнение стоимости MiMo-V2-Pro с другими ведущими моделями на мировом рынке (за 1 млн токенов):

Модель	Вход	Выход	Итого	Разработчик / провайдер
Grok 4.1 Fast	$0,20	$0,50	$0,70	xAI
MiniMax M2.7	$0,30	$1,20	$1,50	MiniMax
Gemini 3 Flash	$0,50	$3,00	$3,50	Google
Kimi-K2.5	$0,60	$3,00	$3,60	Moonshot
MiMo-V2-Pro (≤256K)	$1,00	$3,00	$4,00	Xiaomi MiMo
GLM-5-Turbo	$0,96	$3,20	$4,16	OpenRouter
GLM-5	$1,00	$3,20	$4,20	Z.ai
Claude Haiku 4.5	$1,00	$5,00	$6,00	Anthropic
Qwen3-Max	$1,20	$6,00	$7,20	Alibaba Cloud
Gemini 3 Pro	$2,00	$12,00	$14,00	Google
GPT-5.2	$1,75	$14,00	$15,75	OpenAI
GPT-5.4	$2,50	$15,00	$17,50	OpenAI
Claude Sonnet 4.5	$3,00	$15,00	$18,00	Anthropic
Claude Opus 4.6	$5,00	$25,00	$30,00	Anthropic
GPT-5.4 Pro	$30,00	$180,00	$210,00	OpenAI

Столь решительный подход к ценам призван привлечь разработчиков, создающих ресурсоемкие приложения нового поколения — именно тот сегмент, который определит будущее индустрии. Пока модель доступна только через собственный API Xiaomi и работает исключительно с текстом: поддержки изображений и других форматов ввода нет. Это заметное ограничение на фоне тренда на мультимодальные модели, однако Xiaomi уже анонсировала отдельную версию MiMo-V2-Omni, которая должна закрыть этот пробел.

Ранний период открытого тестирования на платформе OpenRouter (так называемый «Hunter Alpha») показал, что спрос на подобное сочетание высокой производительности и низкой стоимости действительно велик. Философия Фули Ло — «скорость исследований подпитывается искренней любовью к миру, который ты строишь» — воплотилась в модели, занимающей второе место среди китайских разработок и восьмое в мире по признанным рейтингам ИИ-интеллекта.

Станет ли «тихое наступление» Xiaomi началом масштабного перераспределения сил на мировом рынке ИИ, зависит от того, как быстро разработчики сделают выбор в пользу моделей, которые не просто ведут диалог, а выполняют реальные задачи. Пока же Xiaomi как минимум задала новую планку — и сместила фокус индустрии с умения модели говорить на умение действовать.