Вчера вечером Sakana — AI-стартап, который всё глубже закапывается в корпоративный сектор, — запустила Fugu. Это многоагентная система-оркестратор, которая через единый API, совместимый с OpenAI, выдает производительность на уровне передовых моделей. Если коротко: вместо того чтобы молиться на одного божественного монолита, Fugu собирает толпу специализированных агентов и динамически швыряет запросы между ними. Название — японская рыба фугу, ядовитая, если готовить неправильно. Ирония в том, что худшая работа оценщика оказалась самой сильной: Sakana, которую основали выходцы из Google Brain и Stability AI, решила, что доверять одному вендору — слишком большой риск. Особенно после того, как Anthropic по указке правительства США в июне отозвал публичный доступ к своим топовым моделям Claude Mythos 5 и Claude Fable 5.
«Fugu динамически оркестрирует лучшие мировые модели для сложных задач. Мы доказываем, что хорошо скоординированный пул сменяемых агентов может соответствовать ограниченным передовым моделям вроде Fable и Mythos», — написал вчера в X CEO Sakana Дэвид Ха. И добавил: «Но Fugu — это не только производительность. Я считаю, что модели-оркестраторы — следующий рубеж, важнее, чем просто наращивание размеров. Полагаться на модель одной компании для национальной инфраструктуры — колоссальный риск. Последние экспортные ограничения показали: доступ к топовым моделям может исчезнуть за одну ночь. Коллективный интеллект — практический хедж против такой концентрации власти. Fugu просто маршрутизирует запросы в обход вендорских ограничений, полагаясь на полностью сменяемый пул агентов».
Sakana AI прямо заявляет: какие именно модели отбирает Fugu и как он их координирует — проприетарная информация. Пользователю эти маршруты скрыты намеренно. В документации лишь общие фразы про «разнообразный пул мощных моделей», «несколько LLM» или «специализированные модели» — без конкретного количества. Система выступает не как самостоятельная фундаментальная модель, а как изощренный координатор, который по бенчмаркам агентных задач утирает нос топам вроде Fable и Mythos, при этом кардинально меняя подход к развертыванию критической AI-инфраструктуры.
Как работает Sakana Fugu и где он обходит Anthropic Claude Fable 5
По сути, Fugu — как генеральный подрядчик. Получив сложный запрос, он не пытается выполнить каждый шаг самостоятельно. Вместо этого дробит задачу, делегирует подзадачи пулу экспертных фундаментальных моделей, проверяет их работу и синтезирует финальный ответ. В техническом релизе команда Sakana поясняет: «Fugu сам является LLM, обученной вызывать различные LLM из пула агентов, включая рекурсивные вызовы самого себя». В основе — два исследовательских препринта Sakana 2026 года, TRINITY и Conductor. Система автономно управляет всем жизненным циклом выбора моделей и верификации, используя обученные стратегии координации, а не хардкодные воркфлоу. Для конечного пользователя весь этот мультиагентный рой спрятан за стандартным API-эндоинтом.
Sakana AI предлагает два варианта системы под разные нагрузки:
- Fugu — быстрая, малолатентная модель для повседневных задач. Дефолтный движок для интерактивных чат-ботов, интеграция в среды разработки вроде Codex.
- Fugu Ultra — флагманский уровень для сложных, критически важных задач: AI-исследования, кибербезопасность, многошаговый патентный анализ. По данным Sakana, Fugu Ultra координирует более глубокий пул экспертов и соответствует ведущим монолитным моделям на научных и логических бенчмарках.
По тарифу pay-as-you-go стандартный Fugu берет динамическую ставку в зависимости от задействованных моделей. Fugu Ultra использует фиксированное ценообразование: от $5 за миллион входных токенов и $30 за миллион выходных.
Согласно графикам бенчмарков, Fugu превосходит Anthropic Claude Fable 5 на LiveCodeBench (Fugu Ultra: 93.2, Fugu: 92.9, Fable: 89.8) — это открытый бенчмарк для кодинга с регулярно обновляемыми задачами. И обходит предыдущую модель Claude Mythos Preview на GPQA-D (Diamond) — тест из 198 вопросов уровня выпускника по биологии, физике и химии (Fugu Ultra: 95.5, Fugu: 95.5, Mythos Preview: 94.6). Оркестрируя модели от разных провайдеров, Fugu встраивает избыточность прямо в AI-стек. Если один провайдер падает или попадает под регуляторные ограничения, Fugu просто обходит сбой, сохраняя аптайм.
Лицензирование и доступность
Fugu — коммерческий проприетарный API, а не открытый фреймворк. Главная интеллектуальная собственность Sakana — в неочевидных паттернах коллаборации. Конкретная маршрутизация (какие модели выбираются для данного запроса) остаётся секретом и скрыта от пользователя. Однако Sakana даёт критически важные контроли для корпоративной безопасности: разработчики могут явно исключить определённые модели или провайдеров из пула Fugu, чтобы соблюдать внутренние стандарты приватности. Кроме того, можно запретить использование своих промптов для будущего обучения. Географически Fugu не работает в Европейском союзе и Европейской экономической зоне — Sakana ещё приводит свою архитектуру «чёрного ящика» в соответствие с GDPR.
Цены кусаются
Fugu доступен немедленно в большинстве регионов (кроме ЕС и ЕЭЗ) по подпискам и pay-as-you-go. Для команд: Standard $20/мес (лёгкие воркфлоу), Pro $100/мес (10x стандартного объёма), Max $200/мес (20x объёма для непрерывных задач). Я не нашёл, сколько токенов покрывают эти планы, но запросил у Дэвида Ха подробности. В рамках запуска Sakana предлагает бесплатный второй месяц для подписавшихся до 31 июля 2026.
Для корпоративного масштабирования — эластичный pay-as-you-go, где запросы обслуживаются с более высоким приоритетом, чем по месячной подписке. Стандартный Fugu берёт единую ставку самой дорогой модели, участвующей в запросе, без накрутки за мультиагентность. Fugu Ultra (fugu-ultra-20260615) — фиксированная цена: $5 за миллион входных токенов, $30 за выходные, $0.50 за кэшированные. Для экстремальных нагрузок с контекстом выше 272K токенов — $10, $45, $1.00 соответственно. Это ставит его в ряд дорогих опций:
| Модель | Вход | Выход | Итого | Источник |
|---|---|---|---|---|
| MiMo-V2.5 Flash | $0.10 | $0.30 | $0.40 | Xiaomi MiMo |
| deepseek-v4-flash | $0.14 | $0.28 | $0.42 | DeepSeek |
| deepseek-v4-pro | $0.435 | $0.87 | $1.305 | DeepSeek |
| MiniMax-M3 | $0.30 | $1.20 | $1.50 | MiniMax |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $1.75 | |
| Qwen3.7-Plus | $0.40 | $1. |