Привет, гики и все, кто в теме! Сегодня у нас на разборе горячая новость, которая может перевернуть наше представление о корпоративном AI. VentureBeat, как всегда, подкидывает пищу для размышлений, и на этот раз речь идет о том, почему гигантские компании, которые вроде бы уже освоили создание AI-агентов, внезапно уперлись в стену. И, как выясняется, проблема не в том, что модели недостаточно умны.
"Управление" — иллюзия, а реальная проблема — инфраструктура
Еще в первом квартале 2026 года исследования VentureBeat выявили так называемый "миряж управления" (Governance Mirage). Это когда у компаний есть красивые оргструктуры, отвечающие за AI-управление, но реальных механизмов контроля — кот наплакал. Почти половина опрошенных заявила, что центральная команда отвечает за governance, но при этом 31% винят в проблемах непрозрачность поставщиков.
Теперь же исследователи копнули глубже: что ломается первым, когда компании пытаются решить эти проблемы? Ответ однозначный: не модель, а "runtime" — среда выполнения.
Когда AI-агенты теряют память и контекст
Представьте себе: вы строите AI-агентов на основе, скажем, Python-скриптов или каких-то самодельных оркестраторов. Звучит круто, да? Но в реальном продакшене такая stateless-инфраструктура — это путь в никуда. Перезагрузка контейнера стирает весь контекст. Токены, которые должны были укладываться в бюджет, разлетаются в космос. Ошибки на ранних этапах развития агента накапливаются, как снежный ком, и к десятому шагу вы получаете полный крах.
В итоге инженеры тратят больше времени на "латание дыр" в этой хрупкой инфраструктуре, чем на создание той самой "интеллектуальности", ради которой все затевалось. Это, мягко говоря, не совсем то, что обещал AI.
"Скелет" или "Мозг": кто виноват в провалах?
В 2026 году главный вопрос для корпоративного AI — это где искать корень зла: в "Мозге" (модели, ее способности к рассуждению) или в "Скелете" (runtime-инфраструктуре, которая должна управлять состоянием, переживать сбои и координировать работу)?
Большинство опрошенных (по данным VentureBeat) склоняются к проблемам инфраструктуры и интеграции. Однако 17% все еще считают, что виноваты модели. Это говорит о том, что, несмотря на прогресс, модели в некоторых случаях еще недостаточно надежны для сложных, нетипичных сценариев.
Но даже те, кто винит модели, по сути, говорят о том же: текущие модели недостаточно надежны для работы в условиях, которые генерируют их же рабочие процессы. А это значит, что даже самые передовые модели вроде GPT-5 или Claude 4.7 становятся бесполезными, если их не на чем нормально запустить. "Модели достаточно умны, но наша stateless-инфраструктура слишком хрупка, чтобы управлять долгосрочными, многошаговыми агентскими процессами", — как верно подметил один из директоров по инжинирингу.
"Налог на DIY" пожирает ресурсы команд
Если runtime — это главная проблема, то сколько это стоит на практике? Оказывается, огромные ресурсы инженерных команд уходят на создание и поддержку всякого рода "сантехники": ручные повторные попытки, сохранение состояния, чекпоинты. И это вместо того, чтобы заниматься реальной разработкой AI-логики.
77% опрошенных тратят значительную часть своего времени на эту инфраструктурную накладку. Только 23% команд, использующих надежные фреймворки, смогли избежать этого "налога". Распределение довольно ровное, что говорит о рынке, который вроде бы справился с самыми критическими сбоями, но все еще страдает от структурных издержек.
Эти часы, потраченные на написание логики повторных попыток или отладку "призрачных сбоев" (когда агент просто зависает без всяких сообщений об ошибке), — это часы, которые могли быть потрачены на создание уникальных функций, оправдывающих инвестиции в AI.
"Амнезия состояний" — убийца продакшена
Когда AI-агенты терпят неудачу на этапе выхода в продакшен или масштабирования, какая главная техническая преграда? Вариантов много: от "галлюцинаций" моделей до перерасхода бюджета и проблем с задержками.
Но на первое место выходят именно проблемы с состояниями. "Галлюцинации" на 24% усугубляют эти проблемы, приводя к каскадным сбоям.
Что делать?
Компании, которые переживут этот "агентский расчет" (Agentic Reckoning), будут теми, кто отнесется к надежности runtime как к первоклассному инженерному требованию, а не как к чему-то, что можно "подлатать" потом. В противном случае их ждет судьба RPA — кладбище гениальных пилотов, которые не смогли прожить и двух дней.