Агентные предприятия обязаны учиться: почему не переобучать модель, а строить экосистему знаний

Представь: каждый день на работе ты и твои коллеги узнаёте что-то новое. Аналитик безопасности правит ошибочный вывод ИИ. Сетевой инженер находит корень периодического падения. Команда observability замечает, что определённый паттерн задержек, логов и изменений в инфраструктуре предсказывает деградацию сервиса. Отдел поддержки клиентов учится распознавать сигналы, которые ведут к эскалации.

Каждый такой момент — золотая жила организационного знания. Но в большинстве компаний это знание бесследно исчезает в тикетах, дашбордах, чатах, постмортемах и головах отдельных экспертов. Оно помогает решить сиюминутную проблему, но почти никогда не становится частью системы, способной улучшать будущие решения на основе ИИ.

Вот она, следующая головоломка для «агентного предприятия». Будущее не за тем, у кого самая крутая модель или самые автономные агенты. Многие организации будут иметь доступ к схожим frontier-моделям. Многие развернут агентов в безопасности, IT, инженерии, поддержке и операциях.

Настоящим отличием станет способность этих агентов учиться у самой организации. Не переобучая модель каждый раз, а захватывая операционный опыт, превращая его в институциональное знание и делая это знание доступным для будущих агентов, воркфлоу и решений.

Агентное предприятие — это не просто компания, использующая ИИ. Это компания, которая учится через ИИ.

До сих пор разговоры об ИИ крутились вокруг возможностей модели: большие контекстные окна, лучшее рассуждение, более быстрый инференс, мощный вызов инструментов, сложное агентное поведение. Всё это важно. Но в корпоративном мире модель — лишь часть системы.

Модель не знает автоматически, как работает конкретная организация. Она не знает, какой шаг исправил прошлый сбой, какая правка аналитика улучшила расследование угрозы, какой сетевой сигнал предшествовал отказу сервиса, или какая внутренняя политика должна перевесить иначе разумную рекомендацию.

Это знание принадлежит предприятию. Чтобы агентные системы становились лучше, нужен способ захватить его и сделать многоразовым. В большинстве случаев для этого не нужно менять саму модель. Нужно менять экосистему вокруг неё: базу знаний, слой поиска, промпты, политики, защитные перила, логику маршрутизации и воркфлоу, формирующие поведение агентов.

Модель может остаться той же. Умнее становится система обучения вокруг неё.

Петли обратной связи превращают каждый результат в обучающий момент для агентов

Любой агентный воркфлоу генерирует сигналы. Агент получает запрос, извлекает контекст, рассуждает над возможными действиями, вызывает инструменты и выдает ответ. Человек принимает, отклоняет или изменяет этот ответ. Связанные системы показывают, сработало ли действие.

Вся эта цепочка ценна. AI observability даёт видимость того, что произошло: промпт, ответ, путь рассуждения, вызовы инструментов, источники данных, промежуточные шаги, сбои и результаты. Без такой видимости невозможно понять, почему агент поступил так или иначе, не говоря уже об улучшении.

Но одной наблюдаемости мало. Главная возможность — превратить наблюдаемое поведение в институциональное знание. Трейс должен не только помогать разработчикам и операторам отлаживать агента. Он должен помогать предприятию понять, чему агент научился, что исправил человек, какой был результат и что нужно изменить до следующего похожего события.

Это переход от мониторинга ИИ к обучению ИИ. В агентном предприятии петли обратной связи соединяют действие с результатом, результат — со знанием, а знание — с будущим действием.

Система обучения на практике: безопасность, наблюдаемость и сеть

Представь сервис с периодической деградацией. Агент наблюдаемости замечает необычные задержки и ошибки. Сетевой агент обнаруживает потерю пакетов на конкретном пути. Агент безопасности видит, что в тот же временной промежуток произошла подозрительная аутентификация и необычный трафик с неизвестного источника.

По отдельности каждый агент видит лишь часть картины. Вместе они создают полную операционную картину. В первый раз, когда такой инцидент происходит, может потребоваться вмешательство экспертов. Сетевой инженер подтверждает, что потеря пакетов вызвана ошибочной маршрутизацией. Аналитик безопасности решает, что подозрительный трафик — не атака, а побочный эффект неправильно направленного внутреннего сервиса. SRE связывает сетевое событие с падением приложения.

Это разрешение содержит знание, которое организация не должна переучивать заново. Зрелая агентная система обучения захватила бы трейсы, человеческие правки, сетевой контекст, выводы безопасности, сигналы наблюдаемости и финальные шаги восстановления. Она сохранила бы взаимосвязи между этими сигналами: паттерн задержек, сетевой путь, поведение идентификаций, изменение маршрутизации и исправление.

В следующий раз, когда появится похожий паттерн, агенты не будут начинать с нуля. Они извлекут предыдущий кейс, сравнят текущие условия, порекомендуют проверенный диагностический путь и передадут эскалацию с лучшим контекстом. Модель frontier не пришлось переобучать. Предприятие научилось.

Архитектура обучающегося агентного предприятия

Такому предприятию нужно больше, чем модель или чат-бот. Нужна архитектура, способная захватывать опыт, превращать его в полезное знание, связывать это знание с операционным контекстом и управлять тем, как оно меняет будущее поведение агентов.

Память сохраняет, что произошло: что агент видел, что сделал, где вмешался человек и какие были результаты.
Базы знаний превращают этот опыт в многоразовые инструкции: плейбуки, примеры, политики, процедуры и доказательства.
Фабрика данных (data fabric) соединяет операционную среду. Сигналы, нужные агентам, живут в логах, метриках, трейсах, тикетах, системах идентификации, инструментах безопасности, сетевой телеметрии, коллаборационных платформах и бизнес-приложениях. Фабрика делает эти сигналы обнаруживаемыми, связанными, управляемыми и доступными в контексте.
AI observability объясняет поведение агентов, захватывая промпты, вызовы инструментов, промежуточные шаги, ответы, обратную связь и результаты. Такая видимость помогает понять, где агенты успешны, где терпят неудачу и что нужно улучшить.
Панель управления (control plane) управляет тем, как обучение превращается в изменения: какие знания продвигаются, какие промпты или политики обновляются, каким агентам разрешено использовать новую информацию, какие требуются утверждения и как аудируются изменения.

Вместе эти возможности позволяют ИИ-системам улучшаться со временем контролируемым, надёжным способом, позволяя предприятию учиться на собственных операциях.

Победят организации, которые учатся быстрее всех

Следующая эра ИИ не будет выиграна одними моделями. Её выиграют организации, способные захватывать то, чему они учатся в каждом воркфлоу, каждой экспертной правке, каждом инциденте, расследовании и результате.

Самые продвинутые агентные предприятия не просто развернут больше агентов. Они построят системы, где каждый агент может пользоваться коллективным знанием всей организации. Это значит соединять операционные данные через фабрику данных, наблюдать за поведением агентов достаточно глубоко, чтобы понимать его, сохранять опыт в памяти и институционализировать его в базах знаний, использовать панель управления, чтобы направлять, как обучение меняет поведение агентов.

Будущее ИИ — не один автономный агент, действующий в одиночку. Это экосистема из агентов, людей, данных и систем управления, которая учится со временем. Организации, построившие такую экосистему, создадут ИИ-системы, которые становятся лучше с каждым взаимодействием. Не потому, что модель постоянно меняется, а потому, что само предприятие становится умнее.

Хао Янг — вице-президент по ИИ в Splunk (компания Cisco). Материал подготовлен при поддержке Splunk.