Назад в ленту

Терминатор отдыхает: ИИ больше не нужны векторные базы данных!

Похоже, векторные базы данных начинают выходить из моды. По данным VentureBeat, исследователи из нескольких университетов предложили новый подход к работе ИИ-агентов, который называется Direct Corpus Interaction (DCI). Суть в том, чтобы дать ИИ доступ к сырым данным напрямую, без всяких этих ваших векторных представлений и прочей магии.

В классических системах, таких как RAG, документы разбиваются на куски, преобразуются в векторные представления и индексируются в векторной базе данных. Когда ИИ нужно что-то найти, он фильтрует всю базу и выдает список самых релевантных фрагментов. Но, как утверждают авторы DCI, такой подход имеет свои ограничения.

"Семантический поиск хорош для широкого семантического поиска, но когда агенту нужно решить многошаговую задачу, ему часто нужно искать точные строки, числа, версии, коды ошибок, пути к файлам или разреженные комбинации подсказок", – говорят исследователи. "Эти детали часто теряются в семантическом поиске".

DCI предлагает агентам работать в среде, похожей на терминал, где они могут использовать команды вроде `find`, `grep`, `sed` и `awk` для поиска и обработки данных. Агент может комбинировать эти инструменты для выполнения сложных поисковых запросов, например, искать файл определенного типа, содержащий определенное ключевое слово и год.

Одним из главных преимуществ DCI является то, что он позволяет агентам работать с актуальными данными, а не со снимком данных, представленным в векторной базе. "Во многих корпоративных средах данные – это не статический набор документов. Это ежедневные финансовые отчеты, журналы, тикеты, коммиты кода, файлы конфигурации, графики инцидентов и внутренние документы, которые постоянно меняются", – отмечают авторы.

Исследователи предлагают две версии DCI: DCI-Agent-Lite, предназначенную для небольших моделей, и DCI-Agent-CC, предназначенную для более мощных систем. DCI-Agent-Lite работает на GPT-5.4 nano и использует только базовые команды терминала, в то время как DCI-Agent-CC работает на Claude Code и Claude Sonnet 4.6.

Что это значит для нас, простых гиков? Ну, во-первых, возможно, нам придется вспомнить старые добрые команды терминала. Во-вторых, это может привести к созданию более мощных и гибких ИИ-агентов, которые смогут решать сложные задачи, недоступные для современных систем. Ну и в-третьих, это просто круто! Кто знает, может быть, в следующем году мы будем общаться с ИИ через терминал, как настоящие хакеры.