Назад в ленту

Z.ai нейросеть GLM 5.2: открытые веса, 753 млрд параметров и адовый дроп на GPT-5.5

Азиатские нейросети продолжают наводить шороху. Сегодня Z.ai (бывшая Zhipu AI) выкатила GLM-5.2 — это 753 миллиарда параметров чистой мощи, открытые веса и нацеленность на то, чтобы рвать автономное программирование и многозадачную инженерию. Модель уже доступна на Hugging Face, через API Z.ai и в более чем 20 средах разработки. И да, у неё стабильный контекст в 1 миллион токенов. Enterprise-подписка стартует от смешных $12.60 в месяц. Но главное: Z.ai отдала веса под открытой лицензией MIT, так что бери, донашивай, кастомизируй и запускай локально — плати только за электричество. И это очень кстати, потому что американские проприетарные монстры вроде Claude Fable 5 попали под экспортные ограничения Трампа и теперь вообще недоступны. Для тех, кто принимает решения в IT, GLM-5.2 — это путь к размещению AI уровня фронтьера у себя на серверах, в обход любых географических блокировок.



IndexShare: меньше вычислений, больше смысла



Под капотом GLM-5.2 — 753 миллиарда параметров и архитектурная оптимизация IndexShare. В стандартных гигантах пересчёт внимания на длинных документах жрёт вычислительные ресурсы безбожно. IndexShare решает проблему: один и тот же индексатор используется через каждые четыре разреженных слоя внимания. При максимальном контексте в 1 млн токенов это снижает FLOPs на токен в 2.9 раза. Ещё модель получила улучшенный слой Multi-Token Prediction для спекулятивного декодирования — длина принятых токенов увеличивается до 20% во время инференса. И бонус: Z.ai внедрила гибкие режимы мышления. Можно переключать между «Max» — выжать максимум логики, и «High» — баланс между производительностью и задержками. Идеально для чувствительных к таймингу приложений.



Бенчмарки: открытая модель наступает на пятки закрытым гигантам



На стандартных тестах GLM-5.2 обходит почти все открытые флагманы, включая DeepSeek V4, и вплотную подбирается к закрытым монстрам — GPT-5.5 и Claude Opus 4.8. Особенно силён GLM-5.2 в агентном использовании инструментов и долгоживущих инженерных задачах. Вот ключевые цифры:



— SWE-bench Pro: 62.1 — уверенно бьёт GPT-5.5 (58.6) и предшественника GLM-5.1 (58.4). — FrontierSWE (долгоживущие задачи): 74.4% — выше GPT-5.5 (72.6%) и почти вровень с Claude Opus 4.8 (75.1%). — MCP-Atlas (использование инструментов): 77.0 — обходит GPT-5.5 (75.3) и совсем чуть-чуть отстаёт от Claude Opus 4.8 (77.8). — Humanity's Last Exam (с инструментами): 54.7 — впереди GPT-5.5 (52.2) и плотно за Claude Opus 4.8 (57.9). — PostTrainBench и SWE-Marathon (многочасовые инженерные нагрузки): 34.3% против 25.0% у GPT-5.5 на первом, 13.0% против 12.0% на втором. — Terminal-Bench 2.1: 81.0 — уступает Claude Opus 4.8 (85.0) и GPT-5.5 (84.0), но бьёт Google Gemini 3.1 Pro (74.0). — Design Arena (краудсорсинговый дизайн): первое место с ELO 1360, обогнав даже Claude Fable 5.



Заметно, как работают режимы мышления: на «Max» модель выдаёт почти 85 тыс. токенов на задачу, на «High» — вдвое меньше при минимальной потере качества. Отличный рычаг для приложений, где критична задержка.



API и тарифные планы: Z.ai не жадничает



Z.ai запустила GLM Coding Plan — набор для разработчиков, а не просто чат-интерфейс. Из коробки поддерживаются Claude Code, OpenClaw, Cline, Kilo Code, Crush, Factory и другие. При ежегодной оплате цены такие:



— Lite: $12.60/мес (со второго года $151.20/год) — лёгкие итерации на маленьких репозиториях. — Pro: $50.40/мес — ежедневная разработка на средних проектах, в 5 раз больше лимита Lite. — Max: $112.00/мес — для тяжёлых нагрузок, в 20 раз больше лимита, выделенные ресурсы в пиковые часы.



Для интеграции через API цены — $1.40 за миллион входных токенов, $4.40 за выходные. Кешированный ввод — всего $0.26 за миллион, плюс временная бесплатная память для кэша. Для сравнения: сводка VentureBeat по общей стоимости на миллион токенов (input + output) от дешёвых к дорогим:



— MiMo-V2.5 Flash: $0.10 / $0.30 / $0.40 — DeepSeek-V4-Flash: $0.14 / $0.28 / $0.42 — DeepSeek-V4-Pro: $0.435 / $0.87 / $1.305 — MiniMax-M3: $0.30 / $1.20 / $1.50 — Gemini 3.1 Flash-Lite: $0.25 / $1.50 / $1.75 — Qwen3.7-Plus: $0.40 / $1.60 / $2.00 — MiMo-V2.5: $0.40 / $2.00 / $2.40 — Grok 4.3 (low context): $1.25 / $2.50 / $3.75 — MiMo-V2.5 Pro (≤256K): $1.00 / $3.00 / $4.00 — Kimi-K2.6: $0.95 / $4.00 / $4.95 — GLM-5.2: $1.40 / $4.40 / $5.80 — Grok 4.3 (high context): $2.50 / $5.00 / $7.50 — MiMo-V2.5 Pro (>256K): $2.00 / $6.00 / $8.00 — Qwen3.7-Max: $2.50 / $7.50 / $10.00 — Gemini 3.5 Flash: $1.50 / $9.00 / $10.50 — Gemini 3.1 Pro Preview (≤200K): $2.00 / $12.00 / $14.00 — GPT-5.4: $2.50 / $15.00 / $17.50 — Gemini 3.1 Pro Preview (>200K): $4.00 / $18.00 / $22.00 — Claude Opus 4.8: $5.00 / $25.00 / $30.00 — GPT-5.5: $5.00 / $30.00 / $35.00 — Claude Fable 5 / Claude Mythos 5: $10.00 / $50.00 / $60.00

Разницу между открытыми и закрытыми моделями заметили и в сообществе. На X обозреватель Lisan al Gaib (@scaling01) заявил: «Фронтирные лаборатории просто грабят вас ценами на API». Он подсчитал: GLM-5.2 с 744 млрд параметров берёт $4.40 за выходные токены, DeepSeek-V4-Pro (1.6 трлн) — $0.87, а Anthropic и OpenAI дерут $15-30. При этом открытые модели работают с прибылью без новейших «шикарных чипов Blackwell». Вывод: проприетарные лаборатории «на 90%+ маржи на этом этапе».



Лицензия MIT: чистое открытое железо для бизнеса



Самая взрывная фича релиза — лицензия. Z.ai выложила веса GLM-5.2 под MIT, объявив систему «чисто открытой». В документации прямо написано: «без региональных ограничений», «технический доступ без границ». Для enterprise-лидеров MIT значит, что можно использовать, модифицировать и коммерциализировать софт без отчислений и драконовских политик «допустимого использования». Инженерные команды могут разместить AI фронтьера на собственной суверенной инфраструктуре — никакого вендор-лока.



Реакция разработчиков: восторг и немедленная интеграция



Команда Kilo Code подтвердила интеграцию в первый же день: «GLM-5.2 работает в Kilo Code с первого дня. 1M контекст и режим Max задействованы. Настраивай конфиг — и вперёд!». Среда разработки Cline IDE на X отметила: «GLM-5.2 — первая модель с открытыми весами, перешагнувшая 80% на Terminal-Bench, и бьёт все остальные открытые модели. А ещё она бьёт Gemini. Фронтьер-уровень за копейки. Открытый weights вернулся. Это гейм-чейнджер. Уже доступно в Cline!». Агентивное ПО Eigent AI протестировало модель на сложных рабочих процессах: «Кинули долгоживущую задачу — исследовать 30 компаний в 6 секторах AI-инфраструктуры, структурировать в JSON, собрать интерактивный HTML-отчёт. И вот где GLM-5.2 вырывается вперёд: ...планирование». А если добавить, что нейросеть Z.ai явно решила перевернуть рынок — то после таких отзывов сомнений не остаётся: GLM-5.2 — это новая планка для открытых AI-систем.