Sakana Fugu: ядовитая рыба, которая съела Claude Fable 5 — и худшая работа оценщика оказалась самой сильной

Вчера вечером Sakana — AI-стартап, который всё глубже закапывается в корпоративный сектор, — запустила Fugu. Это многоагентная система-оркестратор, которая через единый API, совместимый с OpenAI, выдает производительность на уровне передовых моделей. Если коротко: вместо того чтобы молиться на одного божественного монолита, Fugu собирает толпу специализированных агентов и динамически швыряет запросы между ними. Название — японская рыба фугу, ядовитая, если готовить неправильно. Ирония в том, что худшая работа оценщика оказалась самой сильной: Sakana, которую основали выходцы из Google Brain и Stability AI, решила, что доверять одному вендору — слишком большой риск. Особенно после того, как Anthropic по указке правительства США в июне отозвал публичный доступ к своим топовым моделям Claude Mythos 5 и Claude Fable 5.

«Fugu динамически оркестрирует лучшие мировые модели для сложных задач. Мы доказываем, что хорошо скоординированный пул сменяемых агентов может соответствовать ограниченным передовым моделям вроде Fable и Mythos», — написал вчера в X CEO Sakana Дэвид Ха. И добавил: «Но Fugu — это не только производительность. Я считаю, что модели-оркестраторы — следующий рубеж, важнее, чем просто наращивание размеров. Полагаться на модель одной компании для национальной инфраструктуры — колоссальный риск. Последние экспортные ограничения показали: доступ к топовым моделям может исчезнуть за одну ночь. Коллективный интеллект — практический хедж против такой концентрации власти. Fugu просто маршрутизирует запросы в обход вендорских ограничений, полагаясь на полностью сменяемый пул агентов».

Sakana AI прямо заявляет: какие именно модели отбирает Fugu и как он их координирует — проприетарная информация. Пользователю эти маршруты скрыты намеренно. В документации лишь общие фразы про «разнообразный пул мощных моделей», «несколько LLM» или «специализированные модели» — без конкретного количества. Система выступает не как самостоятельная фундаментальная модель, а как изощренный координатор, который по бенчмаркам агентных задач утирает нос топам вроде Fable и Mythos, при этом кардинально меняя подход к развертыванию критической AI-инфраструктуры.

Как работает Sakana Fugu и где он обходит Anthropic Claude Fable 5

По сути, Fugu — как генеральный подрядчик. Получив сложный запрос, он не пытается выполнить каждый шаг самостоятельно. Вместо этого дробит задачу, делегирует подзадачи пулу экспертных фундаментальных моделей, проверяет их работу и синтезирует финальный ответ. В техническом релизе команда Sakana поясняет: «Fugu сам является LLM, обученной вызывать различные LLM из пула агентов, включая рекурсивные вызовы самого себя». В основе — два исследовательских препринта Sakana 2026 года, TRINITY и Conductor. Система автономно управляет всем жизненным циклом выбора моделей и верификации, используя обученные стратегии координации, а не хардкодные воркфлоу. Для конечного пользователя весь этот мультиагентный рой спрятан за стандартным API-эндоинтом.

Sakana AI предлагает два варианта системы под разные нагрузки:

Fugu — быстрая, малолатентная модель для повседневных задач. Дефолтный движок для интерактивных чат-ботов, интеграция в среды разработки вроде Codex.
Fugu Ultra — флагманский уровень для сложных, критически важных задач: AI-исследования, кибербезопасность, многошаговый патентный анализ. По данным Sakana, Fugu Ultra координирует более глубокий пул экспертов и соответствует ведущим монолитным моделям на научных и логических бенчмарках.

По тарифу pay-as-you-go стандартный Fugu берет динамическую ставку в зависимости от задействованных моделей. Fugu Ultra использует фиксированное ценообразование: от $5 за миллион входных токенов и $30 за миллион выходных.

Согласно графикам бенчмарков, Fugu превосходит Anthropic Claude Fable 5 на LiveCodeBench (Fugu Ultra: 93.2, Fugu: 92.9, Fable: 89.8) — это открытый бенчмарк для кодинга с регулярно обновляемыми задачами. И обходит предыдущую модель Claude Mythos Preview на GPQA-D (Diamond) — тест из 198 вопросов уровня выпускника по биологии, физике и химии (Fugu Ultra: 95.5, Fugu: 95.5, Mythos Preview: 94.6). Оркестрируя модели от разных провайдеров, Fugu встраивает избыточность прямо в AI-стек. Если один провайдер падает или попадает под регуляторные ограничения, Fugu просто обходит сбой, сохраняя аптайм.

Лицензирование и доступность

Fugu — коммерческий проприетарный API, а не открытый фреймворк. Главная интеллектуальная собственность Sakana — в неочевидных паттернах коллаборации. Конкретная маршрутизация (какие модели выбираются для данного запроса) остаётся секретом и скрыта от пользователя. Однако Sakana даёт критически важные контроли для корпоративной безопасности: разработчики могут явно исключить определённые модели или провайдеров из пула Fugu, чтобы соблюдать внутренние стандарты приватности. Кроме того, можно запретить использование своих промптов для будущего обучения. Географически Fugu не работает в Европейском союзе и Европейской экономической зоне — Sakana ещё приводит свою архитектуру «чёрного ящика» в соответствие с GDPR.

Цены кусаются

Fugu доступен немедленно в большинстве регионов (кроме ЕС и ЕЭЗ) по подпискам и pay-as-you-go. Для команд: Standard $20/мес (лёгкие воркфлоу), Pro $100/мес (10x стандартного объёма), Max $200/мес (20x объёма для непрерывных задач). Я не нашёл, сколько токенов покрывают эти планы, но запросил у Дэвида Ха подробности. В рамках запуска Sakana предлагает бесплатный второй месяц для подписавшихся до 31 июля 2026.

Для корпоративного масштабирования — эластичный pay-as-you-go, где запросы обслуживаются с более высоким приоритетом, чем по месячной подписке. Стандартный Fugu берёт единую ставку самой дорогой модели, участвующей в запросе, без накрутки за мультиагентность. Fugu Ultra (fugu-ultra-20260615) — фиксированная цена: $5 за миллион входных токенов, $30 за выходные, $0.50 за кэшированные. Для экстремальных нагрузок с контекстом выше 272K токенов — $10, $45, $1.00 соответственно. Это ставит его в ряд дорогих опций:

Модель	Вход	Выход	Итого	Источник
MiMo-V2.5 Flash	$0.10	$0.30	$0.40	Xiaomi MiMo
deepseek-v4-flash	$0.14	$0.28	$0.42	DeepSeek
deepseek-v4-pro	$0.435	$0.87	$1.305	DeepSeek
MiniMax-M3	$0.30	$1.20	$1.50	MiniMax
Gemini 3.1 Flash-Lite	$0.25	$1.50	$1.75	Google
Qwen3.7-Plus	$0.40	$1. Источник: VentureBeat ИИ ТЕХНОЛОГИИ SAKANA FUGU CLAUDEFABLE5 Подписывайтесь на TechLoot в Telegram, VK и Дзен. Поделитесь лутом с друзьями Подбираем интересный лут... TECHLOOT © 2026 Агрегатор гик-новостей и скидок. Политика конфиденциальности