В последние выходные лета 2026 года в мире корпоративного ИИ произошло событие, которое, возможно, войдет в историю. Китайский стартап MiniMax представил свою долгожданную большую языковую модель M3. И, судя по первым данным, эта модель не просто конкурентоспособна, а скорее всего, переписывает правила игры, превосходя по производительности на ключевых бенчмарках такие модели, как GPT-5.5 от OpenAI и Gemini 3.1 Pro от Google, при этом обходя их по стоимости на порядок.
M3: Дешевле, мощнее, доступнее
Главная новость заключается в том, что MiniMax M3 предлагает передовые возможности в области кодирования и агентской производительности, дополненные колоссальным контекстным окном в миллион токенов и нативной мультимодальностью. И все это – за смешные деньги. Стоимость подписки начинается всего от 20 долларов в месяц, а цены за использование API стартуют от 0.3 доллара за миллион входных токенов и 1.20 доллара за миллион выходных токенов (на кэшированные данные). Это составляет всего 8-20% от стоимости ведущих проприетарных моделей из США.
Более того, руководство MiniMax объявило о планах выпустить модель под лицензией с открытым исходным кодом, включая "открытые веса". Это позволит компаниям свободно скачивать модель и настраивать ее под свои нужды совершенно бесплатно, ожидается в ближайшие 10 дней.
Революция в архитектуре: MiniMax Sparse Attention (MSA)
Традиционно разработка больших языковых моделей ставила разработчиков перед выбором: либо дорогой доступ к закрытым моделям с жесткими API, либо более дешевые, но менее мощные открытые модели, которые уступают в сложных задачах кодирования и многошаговом рассуждении. MiniMax M3 ломает этот шаблон.
Ключевым элементом эффективности M3 является новая архитектура MiniMax Sparse Attention (MSA). В отличие от классических трансформеров, где вычислительные затраты растут квадратично с увеличением длины входных данных, MSA использует более эффективный подход. Это позволяет модели обрабатывать огромные объемы информации, сохраняя низкую стоимость и высокую скорость. Внутренние тесты показывают, что MSA работает более чем в 4 раза быстрее альтернативных решений, а при максимальной длине контекста в миллион токенов, требование к вычислительным ресурсам на токен снижается в 20 раз.
Нативная мультимодальность с "нулевого шага"
MiniMax M3 была разработана как изначально мультимодальная система. Вместо того чтобы объединять текстовые и визуальные модели, разработчики с самого начала интегрировали обработку текста, изображений и других визуальных компонентов. Это глубокое выравнивание данных позволяет модели переводить сложные визуальные структуры, такие как диаграммы или карты, в код без потери контекста.Производительность на тестах: впечатляющие результаты
На стандартизированных тестах M3 демонстрирует впечатляющие результаты. Модель получила 59.0% на SWE-Bench Pro, бенчмарке для автономных агентов, опередив GPT-5.5 и Gemini 3.1 Pro. На Terminal Bench 2.1 модель показала 66.0%, на MCP Atlas – 74.2%, а на BrowseComp – 83.5%, превзойдя Claude Opus 4.7 в автономном поиске и извлечении информации.
Однако, по сравнению с новейшей премиальной моделью Anthropic, Claude Opus 4.8, M3 уступает в некоторых задачах, требующих гиперсложного рассуждения. Например, в чистой модификации кода на SWE-Bench Pro, M3 (59.0%) отстает от Opus 4.8 (69.2%). Аналогичная ситуация наблюдается в автоматизированных системных средах: M3 (66.0%) уступает Opus 4.8 (74.6%) на Terminal-Bench 2.1. А в области непрерывного взаимодействия с графическим интерфейсом пользователя, M3 показала 70.0% против 83.4% у Opus 4.8.
Эти результаты подчеркивают текущие компромиссы в экосистеме ИИ: закрытые системы, как Opus 4.8, сохраняют лидерство в самых сложных задачах, но M3 предлагает мощную и доступную альтернативу для широкого спектра применений.