Liquid AI выпустила крошку LFM2.5-230M: маленькая модель, которая обходит гигантов в извлечении данных — Liquid AI новости

Когда команда бывших выпускников MIT запускает очередную языковую модель, обычно ждёшь чего-то монструозного на триллионах параметров. Но Liquid AI пошли другим путём и сегодня выпустили свою крошку — LFM2.5-230M. И, знаете, корпорациям стоит присмотреться к этому малышу для извлечения данных и локального развёртывания на смартфонах, ноутбуках и роботах.

Это фундаментальная модель на 230 миллионов параметров, заточенная под агентные сценарии на устройстве. Как пишет сама Liquid в релизном посте, такой размер позволяет запускать её практически «где угодно». По заявлениям компании, она ещё и обходит модели, которые в четыре раза больше — на избранных бенчмарках. Конкретно: вытаскивает данные лучше, чем Alibaba Qwen3.5-0.8B (Instruct) с 800 миллионами параметров и Google Gemma 3 1B с миллиардом параметров.

Модель нацелена на разработчиков и инженеров, которые строят лёгкие пайплайны для извлечения данных и автономные edge-системы. Распространяется по двойной коммерческой лицензии: физикам и компаниям с годовой выручкой меньше 10 миллионов долларов модель достаётся бесплатно, а крупным корпорациям — за отдельный платный договор. Этот релиз отличается от других маленьких AI-моделей тем, что использует архитектуру LFM2 для высокой скорости инференса без гигантского расхода памяти, типичного для трансформеров с кучей параметров.

Пока гиганты вроде Anthropic, OpenAI, Google, Microsoft и Meta гонятся за сотнями миллиардов и триллионами параметров, чтобы выжать frontier-производительность, параллельная гонка целиком сосредоточена на edge и локальных развёртываниях. Запуск Liquid AI модели LFM2.5-230M сигнализирует о повороте в сторону архитектурной эффективности вместо brute-force масштабирования. Втиснув 19 триллионов токенов предобучения в модель на 230 миллионов параметров, компания доказала: edge-устройствам не нужна бешеная вычислительная мощность или постоянное облачное соединение для сложных многошаговых агентных сценариев.

Как работает LFM2.5-230M

Модель LFM2.5-230M отходит от стандартных трансформерных архитектур, опираясь на фреймворк LFM2. Эта архитектура работает как гибридная система: перемежает управляемые короткие свёртки с grouped-query attention для эффективной обработки информации. Для тех, кто следит за эволюцией эффективных архитектур, подход Liquid преследует схожую концептуальную цель: управлять длинными контекстами и последовательными данными на edge-железе без квадратичных затрат памяти чистых механизмов внимания. Модель поддерживает окно контекста в 32K токенов — достаточно, чтобы проглотить объёмные документы или непрерывные потоки телеметрии с роботов.

Если глянуть на графики производительности в релизе, архитектурная эффективность видна невооружённым глазом. Модель укладывается в footprint менее 400 МБ, при этом выдает скорости префилла и декодинга, которые опережают конкурентов вроде Gemma 3 1B IT и Granite 4.0-H-350M. На Samsung Galaxy S25 Ultra с процессором Qualcomm Snapdragon Gen4 модель достигает 213 токенов в секунду на декодинге. Даже на сильно ограниченном Raspberry Pi 5 декодинг держит 42 токена в секунду. Кроме того, внутренние бенчмарки показывают, что GPU-стек вывода даёт меньшую end-to-end задержку, чем конкурирующие маленькие модели на всех уровнях параллелизма.

Почему это важно для предприятий

Чтобы понять, зачем нужна модель на 230 миллионов параметров, достаточно посмотреть, как предприятия сейчас управляют данными. Организации традиционно полагались на жёсткие, основанные на правилах ETL-скрипты для перемещения и обработки данных. Но эти легаси-системы печально хрупки: малейшее изменение в макете документа или обновлении схемы — и весь пайплайн разваливается. Промышленность переходит к «AI ETL», где машинное обучение самостоятельно выводит соответствия, обнаруживает дрейф схемы и адаптируется к изменениям. В современном лёгком пайплайне извлечения данных AI-модель подключается к неструктурированным источникам — PDF, письмам, веб-формам — и преобразует данные в форматы вроде JSON без хардкодных правил.

Для предприятий использовать массивную флагманскую модель вроде Claude Opus 4.6 (которая стоит $5 за миллион входных токенов) для разбора рутинных счетов, форматирования адресов или маршрутизации телеметрии — экономически нежизнеспособно. Вот где модели вроде LFM2.5-230M становятся критически важными. Разработанная именно как лёгкий экстракционный движок, она позволяет компаниям автоматизировать повторяющееся форматирование и парсинг данных за долю вычислительных затрат и задержки, работая прямо на локальном оборудовании, без дорогих бесконечных облачных API-вызовов.

Бенчмарки маленьких моделей: LFM против класса 3B

В середине 2026 года AI-индустрия переживает ренессанс «маленьких» моделей, но определение «маленький» сильно разнится. Недавно open-weight сообщество потряс VibeThinker-3B от Weibo — модель на 3 миллиарда параметров, построенная на бэкбоне Qwen2, которая выдала 94.3 на бенчмарке AIME 2026 по математике, сравнившись с монстрами на 600 миллиардов параметров благодаря агрессивному курированию данных и обучению с подкреплением. Аналогично, семейство Gemma 4 от Google — недавно перевалившее за 200 миллионов загрузок — выводит frontier AI на edge, включая модель E2B (2 миллиарда параметров), специально созданную для мобильных устройств и IoT.

В контрасте с ними, LFM2.5-230M от Liquid AI действует в совершенно другой весовой категории. При всего 230 миллионах параметров она примерно в десять раз меньше самой маленькой Gemma 4 от Google и VibeThinker-3B. Из-за микроскопического размера LFM2.5-230M не предназначена для соревнований в тяжёлых рассуждениях — продвинутой математике, кодинге или творческом письме. Liquid AI это открыто признаёт.

Однако в своих целевых областях — извлечение данных и вызов инструментов — модель бьёт намного выше своей весовой категории. Бенчмарки, опубликованные Liquid AI, показывают: LFM2.5-230M набирает 43.26 в бенчмарке вызова инструментов BFCLv3, доминируя над IBM Granite 4.0-350M (39.58) и полностью переигрывая более крупные модели на миллиард параметров, такие как Google Gemma 3 1B IT (16.61). На CaseReportBench — бенчмарке извлечения данных — она набирает 22.51, разгромив Qwen3.5-0.8B (Instruct). LFM2.5-230M доказывает: пока 3-миллиардные модели вроде VibeThinker решают задачи высшей математики, 230-миллионная модель — превосходный, глубоко оптимизированный выбор для выполнения структурированных инструментальных вызовов и поддержки агентных пайплайнов на ограниченном «железе».

Кстати, если хотите быть в курсе свежих событий в этой области, обязательно следите за liquid ai новости — именно там появляются первые отчёты по таким прорывным архитектурам. Или просто добавьте в закладки liquid ai новости lfm, чтобы не пропустить апдейты.

Продвинутые исследовательские сценарии

Благодаря тому, что модель отлично вызывает инструменты, LFM2.5-230M работает в первую очередь как слой выбора навыков. Liquid AI продемонстрировала эту возможность, развернув модель на человекоподобном роботе Unitree G1. Работая полностью на устройстве через бортовой модуль NVIDIA Jetson Orin, модель успешно обрабатывает сложные команды окружения. Как отмечается в техническом блоге компании, модель берёт свободную инструкцию вроде «Замри на 2 секунды, затем иди вперёд со скоростью 1 метр в секунду на 3 метра, зафиксируй позу на одной ноге вперёд на 5 секунд, и иди назад со скоростью 0.5 метра в секунду на 3 метра» и автоматически превращает её в структурированный многошаговый план, вызывая предобученные низкоуровневые навыки через фреймворк SONIC от NVIDIA. Базовая и пост-обученная модели уже доступны на Hugging Face, с нативной поддержкой с первого дня в экосистемах инференса: llama.cpp (GGUF), MLX, vLLM, SGLang и ONNX.

Двойная лицензия под LFM Open License

Liquid AI выпускает LFM2.5-230M под лицензией LFM Open License v1.0. Несмотря на слово «Open» в названии, это не OSI-совместимая лицензия; она работает как ограниченная двойная коммерческая схема. Для независимых разработчиков, исследователей и стартапов на ранних стадиях лицензия ведёт себя как open-source. Пользователи получают бессрочную, всемирную, бесплатную лицензию на воспроизведение, модификацию и распространение модели при условии сохранения оригинальных уведомлений об авторских правах и явного указания всех модификаций.

Однако лицензия включает строгое «Ограничение коммерческого использования». Любое юридическое лицо с годовой выручкой $10 миллионов и более теряет право на коммерческое использование модели по этому соглашению. Крупные предприятия, пересекающие этот порог, должны договариваться с Liquid AI о платном коммерческом контракте для продакшн-развёртывания. Эта стратегия защищает компанию от того, чтобы её интеллектуальную собственность бесплатно проглотили крупные технологические конгломераты, при этом модель распространяется на низовом уровне среди разработчиков.