Привет, гики и все, кто в теме! Сегодня у нас на разборе горячая новость, которая может перевернуть наше представление о корпоративном AI. VentureBeat, как всегда, подкидывает пищу для размышлений, и на этот раз речь идет о том, почему гигантские компании, которые вроде бы уже освоили создание AI-агентов, внезапно уперлись в стену. И, как выясняется, проблема не в том, что модели недостаточно умны.
"Управление" — иллюзия, а реальная проблема — инфраструктура
Еще в первом квартале 2026 года исследования VentureBeat выявили так называемый "миряж управления" (Governance Mirage). Это когда у компаний есть красивые оргструктуры, отвечающие за AI-управление, но реальных механизмов контроля — кот наплакал. Почти половина опрошенных заявила, что центральная команда отвечает за governance, но при этом 31% винят в проблемах непрозрачность поставщиков.
Теперь же исследователи копнули глубже: что ломается первым, когда компании пытаются решить эти проблемы? Ответ однозначный: не модель, а "runtime" — среда выполнения.
Когда AI-агенты теряют память и контекст
Представьте себе: вы строите AI-агентов на основе, скажем, Python-скриптов или каких-то самодельных оркестраторов. Звучит круто, да? Но в реальном продакшене такая stateless-инфраструктура — это путь в никуда. Перезагрузка контейнера стирает весь контекст. Токены, которые должны были укладываться в бюджет, разлетаются в космос. Ошибки на ранних этапах развития агента накапливаются, как снежный ком, и к десятому шагу вы получаете полный крах.
В итоге инженеры тратят больше времени на "латание дыр" в этой хрупкой инфраструктуре, чем на создание той самой "интеллектуальности", ради которой все затевалось. Это, мягко говоря, не совсем то, что обещал AI.
"Скелет" или "Мозг": кто виноват в провалах?
В 2026 году главный вопрос для корпоративного AI — это где искать корень зла: в "Мозге" (модели, ее способности к рассуждению) или в "Скелете" (runtime-инфраструктуре, которая должна управлять состоянием, переживать сбои и координировать работу)?
Большинство опрошенных (по данным VentureBeat) склоняются к проблемам инфраструктуры и интеграции. Однако 17% все еще считают, что виноваты модели. Это говорит о том, что, несмотря на прогресс, модели в некоторых случаях еще недостаточно надежны для сложных, нетипичных сценариев.
Но даже те, кто винит модели, по сути, говорят о том же: текущие модели недостаточно надежны для работы в условиях, которые генерируют их же рабочие процессы. А это значит, что даже самые передовые модели вроде GPT-5 или Claude 4.7 становятся бесполезными, если их не на чем нормально запустить. "Модели достаточно умны, но наша stateless-инфраструктура слишком хрупка, чтобы управлять долгосрочными, многошаговыми агентскими процессами", — как верно подметил один из директоров по инжинирингу.
"Налог на DIY" пожирает ресурсы команд
Если runtime — это главная проблема, то сколько это стоит на практике? Оказывается, огромные ресурсы инженерных команд уходят на создание и поддержку всякого рода "сантехники": ручные повторные попытки, сохранение состояния, чекпоинты. И это вместо того, чтобы заниматься реальной разработкой AI-логики.
77% опрошенных тратят значительную часть своего времени на эту инфраструктурную накладку. Только 23% команд, использующих надежные фреймворки, смогли избежать этого "налога". Распределение довольно ровное, что говорит о рынке, который вроде бы справился с самыми критическими сбоями, но все еще страдает от структурных издержек.Эти часы, потраченные на написание логики повторных попыток или отладку "призрачных сбоев" (когда агент просто зависает без всяких сообщений об ошибке), — это часы, которые могли быть потрачены на создание уникальных функций, оправдывающих инвестиции в AI.
"Амнезия состояний" — убийца продакшена
Когда AI-агенты терпят неудачу на этапе выхода в продакшен или масштабирования, какая главная техническая преграда? Вариантов много: от "галлюцинаций" моделей до перерасхода бюджета и проблем с задержками.
Но на первое место выходят именно проблемы с состояниями. "Галлюцинации" на 24% усугубляют эти проблемы, приводя к каскадным сбоям.
Что делать?
Компании, которые переживут этот "агентский расчет" (Agentic Reckoning), будут теми, кто отнесется к надежности runtime как к первоклассному инженерному требованию, а не как к чему-то, что можно "подлатать" потом. В противном случае их ждет судьба RPA — кладбище гениальных пилотов, которые не смогли прожить и двух дней.