Z.ai нейросеть GLM 5.2: открытые веса, 753 млрд параметров и адовый дроп на GPT-5.5

Азиатские нейросети продолжают наводить шороху. Сегодня Z.ai (бывшая Zhipu AI) выкатила GLM-5.2 — это 753 миллиарда параметров чистой мощи, открытые веса и нацеленность на то, чтобы рвать автономное программирование и многозадачную инженерию. Модель уже доступна на Hugging Face, через API Z.ai и в более чем 20 средах разработки. И да, у неё стабильный контекст в 1 миллион токенов. Enterprise-подписка стартует от смешных $12.60 в месяц. Но главное: Z.ai отдала веса под открытой лицензией MIT, так что бери, донашивай, кастомизируй и запускай локально — плати только за электричество. И это очень кстати, потому что американские проприетарные монстры вроде Claude Fable 5 попали под экспортные ограничения Трампа и теперь вообще недоступны. Для тех, кто принимает решения в IT, GLM-5.2 — это путь к размещению AI уровня фронтьера у себя на серверах, в обход любых географических блокировок.

IndexShare: меньше вычислений, больше смысла

Под капотом GLM-5.2 — 753 миллиарда параметров и архитектурная оптимизация IndexShare. В стандартных гигантах пересчёт внимания на длинных документах жрёт вычислительные ресурсы безбожно. IndexShare решает проблему: один и тот же индексатор используется через каждые четыре разреженных слоя внимания. При максимальном контексте в 1 млн токенов это снижает FLOPs на токен в 2.9 раза. Ещё модель получила улучшенный слой Multi-Token Prediction для спекулятивного декодирования — длина принятых токенов увеличивается до 20% во время инференса. И бонус: Z.ai внедрила гибкие режимы мышления. Можно переключать между «Max» — выжать максимум логики, и «High» — баланс между производительностью и задержками. Идеально для чувствительных к таймингу приложений.

Бенчмарки: открытая модель наступает на пятки закрытым гигантам

На стандартных тестах GLM-5.2 обходит почти все открытые флагманы, включая DeepSeek V4, и вплотную подбирается к закрытым монстрам — GPT-5.5 и Claude Opus 4.8. Особенно силён GLM-5.2 в агентном использовании инструментов и долгоживущих инженерных задачах. Вот ключевые цифры:

— SWE-bench Pro: 62.1 — уверенно бьёт GPT-5.5 (58.6) и предшественника GLM-5.1 (58.4). — FrontierSWE (долгоживущие задачи): 74.4% — выше GPT-5.5 (72.6%) и почти вровень с Claude Opus 4.8 (75.1%). — MCP-Atlas (использование инструментов): 77.0 — обходит GPT-5.5 (75.3) и совсем чуть-чуть отстаёт от Claude Opus 4.8 (77.8). — Humanity's Last Exam (с инструментами): 54.7 — впереди GPT-5.5 (52.2) и плотно за Claude Opus 4.8 (57.9). — PostTrainBench и SWE-Marathon (многочасовые инженерные нагрузки): 34.3% против 25.0% у GPT-5.5 на первом, 13.0% против 12.0% на втором. — Terminal-Bench 2.1: 81.0 — уступает Claude Opus 4.8 (85.0) и GPT-5.5 (84.0), но бьёт Google Gemini 3.1 Pro (74.0). — Design Arena (краудсорсинговый дизайн): первое место с ELO 1360, обогнав даже Claude Fable 5.

Заметно, как работают режимы мышления: на «Max» модель выдаёт почти 85 тыс. токенов на задачу, на «High» — вдвое меньше при минимальной потере качества. Отличный рычаг для приложений, где критична задержка.

API и тарифные планы: Z.ai не жадничает

Z.ai запустила GLM Coding Plan — набор для разработчиков, а не просто чат-интерфейс. Из коробки поддерживаются Claude Code, OpenClaw, Cline, Kilo Code, Crush, Factory и другие. При ежегодной оплате цены такие:

— Lite: $12.60/мес (со второго года $151.20/год) — лёгкие итерации на маленьких репозиториях. — Pro: $50.40/мес — ежедневная разработка на средних проектах, в 5 раз больше лимита Lite. — Max: $112.00/мес — для тяжёлых нагрузок, в 20 раз больше лимита, выделенные ресурсы в пиковые часы.

Для интеграции через API цены — $1.40 за миллион входных токенов, $4.40 за выходные. Кешированный ввод — всего $0.26 за миллион, плюс временная бесплатная память для кэша. Для сравнения: сводка VentureBeat по общей стоимости на миллион токенов (input + output) от дешёвых к дорогим:

— MiMo-V2.5 Flash: $0.10 / $0.30 / $0.40 — DeepSeek-V4-Flash: $0.14 / $0.28 / $0.42 — DeepSeek-V4-Pro: $0.435 / $0.87 / $1.305 — MiniMax-M3: $0.30 / $1.20 / $1.50 — Gemini 3.1 Flash-Lite: $0.25 / $1.50 / $1.75 — Qwen3.7-Plus: $0.40 / $1.60 / $2.00 — MiMo-V2.5: $0.40 / $2.00 / $2.40 — Grok 4.3 (low context): $1.25 / $2.50 / $3.75 — MiMo-V2.5 Pro (≤256K): $1.00 / $3.00 / $4.00 — Kimi-K2.6: $0.95 / $4.00 / $4.95 — GLM-5.2: $1.40 / $4.40 / $5.80 — Grok 4.3 (high context): $2.50 / $5.00 / $7.50 — MiMo-V2.5 Pro (>256K): $2.00 / $6.00 / $8.00 — Qwen3.7-Max: $2.50 / $7.50 / $10.00 — Gemini 3.5 Flash: $1.50 / $9.00 / $10.50 — Gemini 3.1 Pro Preview (≤200K): $2.00 / $12.00 / $14.00 — GPT-5.4: $2.50 / $15.00 / $17.50 — Gemini 3.1 Pro Preview (>200K): $4.00 / $18.00 / $22.00 — Claude Opus 4.8: $5.00 / $25.00 / $30.00 — GPT-5.5: $5.00 / $30.00 / $35.00 — Claude Fable 5 / Claude Mythos 5: $10.00 / $50.00 / $60.00

Разницу между открытыми и закрытыми моделями заметили и в сообществе. На X обозреватель Lisan al Gaib (@scaling01) заявил: «Фронтирные лаборатории просто грабят вас ценами на API». Он подсчитал: GLM-5.2 с 744 млрд параметров берёт $4.40 за выходные токены, DeepSeek-V4-Pro (1.6 трлн) — $0.87, а Anthropic и OpenAI дерут $15-30. При этом открытые модели работают с прибылью без новейших «шикарных чипов Blackwell». Вывод: проприетарные лаборатории «на 90%+ маржи на этом этапе».

Лицензия MIT: чистое открытое железо для бизнеса

Самая взрывная фича релиза — лицензия. Z.ai выложила веса GLM-5.2 под MIT, объявив систему «чисто открытой». В документации прямо написано: «без региональных ограничений», «технический доступ без границ». Для enterprise-лидеров MIT значит, что можно использовать, модифицировать и коммерциализировать софт без отчислений и драконовских политик «допустимого использования». Инженерные команды могут разместить AI фронтьера на собственной суверенной инфраструктуре — никакого вендор-лока.

Реакция разработчиков: восторг и немедленная интеграция

Команда Kilo Code подтвердила интеграцию в первый же день: «GLM-5.2 работает в Kilo Code с первого дня. 1M контекст и режим Max задействованы. Настраивай конфиг — и вперёд!». Среда разработки Cline IDE на X отметила: «GLM-5.2 — первая модель с открытыми весами, перешагнувшая 80% на Terminal-Bench, и бьёт все остальные открытые модели. А ещё она бьёт Gemini. Фронтьер-уровень за копейки. Открытый weights вернулся. Это гейм-чейнджер. Уже доступно в Cline!». Агентивное ПО Eigent AI протестировало модель на сложных рабочих процессах: «Кинули долгоживущую задачу — исследовать 30 компаний в 6 секторах AI-инфраструктуры, структурировать в JSON, собрать интерактивный HTML-отчёт. И вот где GLM-5.2 вырывается вперёд: ...планирование». А если добавить, что нейросеть Z.ai явно решила перевернуть рынок — то после таких отзывов сомнений не остаётся: GLM-5.2 — это новая планка для открытых AI-систем.

Справка по теме (FAQ)

Что такое GLM-5.2 от Z.ai?

GLM-5.2 — это открытая мультимодальная модель от китайской компании Z.ai (бывшая Zhipu AI) с 753 миллиардами параметров, 1 миллионом токенов контекста и лицензией MIT. Она доступна для скачивания, модификации и коммерческого использования.

Где скачать веса GLM-5.2?

Веса выложены на Hugging Face под лицензией MIT. Также модель доступна через API Z.ai и уже интегрирована в более чем 20 сред разработки, включая Cline, Kilo Code, Claude Code.

Сколько стоят API GLM-5.2?

Цены: $1.40 за миллион входных токенов, $4.40 за выходные. Кешированный ввод — $0.26 за миллион. Для Enterprise есть подписки от $12.60/мес (Lite), $50.40/мес (Pro) и $112/мес (Max).

Как GLM-5.2 показывает себя на бенчмарках?

На SWE-bench Pro — 62.1 (выше GPT-5.5, 58.6). FrontierSWE — 74.4% (почти на уровне Claude Opus 4.8). MCP-Atlas — 77.0 (обходит GPT-5.5). В режиме «Max» модель выдает до 85 тыс. токенов на задачу с минимальной потерей качества.

Почему лицензия MIT — это важно?

Лицензия MIT допускает любое использование, модификацию и коммерциализацию без отчислений. Нет региональных ограничений, что особенно актуально после экспортных блокировок на американские модели типа Claude Fable 5.

Какая архитектура у GLM-5.2?

Архитектура IndexShare: один индексатор используется через каждые четыре разреженных слоя внимания. Это снижает FLOPs на токен в 2.9 раза при контексте 1 млн токенов. Также есть Multi-Token Prediction для спекулятивного декодирования и гибкие режимы мышления (Max/High).

Сравнение стоимости с конкурентами?

GLM-5.2: $5.80 за млн токенов (input+output). GPT-5.5: $35. DeepSeek-V4-Pro: $1.305. Claude Opus 4.8: $30. По оценке аналитиков, проприетарные лаборатории держат маржу 90%+ на этом рынке.

Есть ли ограничения по регионам?

Официально Z.ai заявляет «технический доступ без границ» и отсутствие региональных блокировок в документации к MIT-версии. Enterprise-клиенты могут разместить модель на собственной инфраструктуре.