Назад в ленту

Microsoft Surface RTX Spark Dev Box: AI-модели теперь на вашем столе, а не в облаках!

Microsoft на днях выкатила нечто под названием Surface RTX Spark Dev Box, и это, честно говоря, переворачивает игру. По данным СМИ, эта компактная десктопная машина предназначена для того, чтобы разработчики могли запускать тяжелые AI-модели прямо на своих рабочих столах, минуя необходимость платить за облачные вычисления. Это прямой вызов модели оплаты за каждый токен, которая определяла экономику AI-индустрии с момента появления ChatGPT.

Устройство, представленное на Microsoft Build 2026, оснащено новым процессором Nvidia RTX Spark на архитектуре Blackwell и 128 гигабайтами унифицированной памяти. По заявлениям Nvidia, оно способно выдавать один петафлопс вычислительной мощности для AI. На практике это означает, что разработчик может загружать, запускать и взаимодействовать с AI-моделями, превышающими 120 миллиардов параметров, без единого API-вызова в облако.

"Мы считаем, что такие устройства смогут запускать модели примерно до 100 миллиардов параметров," — отметил Паван Давулури, исполнительный вице-президент Microsoft по Windows и устройствам, на брифинге перед мероприятием. Он подчеркнул, что размер модели — это лишь часть уравнения: "Размер модели — это одно, но чтобы модель была эффективной, ей нужен достаточный контекст, потому что большая модель требует большего контекста." При 100 000 токенов контекста, по его словам, один только кэш ключ-значение может потреблять 40-50 гигабайт памяти. Именно поэтому Microsoft и Nvidia спроектировали устройство вокруг 128-гигабайтного пула унифицированной памяти, динамически разделяемого между CPU и GPU.

Машина появится в продаже в США позднее в этом году, эксклюзивно через Microsoft.com. Цену компания пока не раскрывает.

Почему Microsoft ставит на AI с фиксированной стоимостью, а не на облачные счетчики

Surface RTX Spark Dev Box выходит в тот момент, когда экономика разработки AI стала предметом внимания на уровне советов директоров. Компании, большие и малые, сталкиваются с непредсказуемо растущими счетами за облачные GPU: каждая операция тонкой настройки, каждый запрос на вывод, каждый агентский рабочий процесс, который циклически проходит через передовую модель, увеличивает затраты. Для разработчика, быстро итерирующего прототип — запуская одну и ту же модель десятки или сотни раз в день — эти расходы быстро накапливаются.

Microsoft позиционирует Dev Box как клапан для сброса этого давления. Эндрю Хилл, корпоративный вице-президент Surface, написал в анонсирующем посте, что устройство "меняет это уравнение", позволяя разработчикам "резервировать вызовы передовых моделей для действительно передовых задач, а остальное выполнять на собственном оборудовании". Предложение заключается не в том, что облачные вычисления устарели, а в том, что большая часть работы, отправляемой в удаленные дата-центры, не требует самых современных моделей и лучше обслуживается способным локальным оборудованием с предсказуемыми, фиксированными затратами.

Это значительный стратегический сдвиг для Microsoft, компании, чьи ежегодные доходы от облачных сервисов Azure составляют десятки миллиардов долларов. Продавая оборудование, которое явно снижает зависимость клиентов от облаков, Microsoft признает нарастающее напряжение в отрасли: предельная стоимость вывода AI в масштабе неустойчива для многих команд, и рынок требует альтернатив. Ставка, похоже, делается на то, что разработчики, которые прототипируют локально, все равно будут развертываться в Azure, когда им потребуется масштабирование — и владение обоими концами этого рабочего процесса ценнее, чем владение только облаком.

Внутри архитектуры унифицированной памяти на 128 ГБ, делающей локальный AI возможным

Техническая архитектура Dev Box отражает ряд намеренных инженерных решений, направленных на устойчивую, а не пиковую производительность — различие, которое имеет огромное значение для AI-нагрузок, работающих часами.

В центре находится система-на-чипе Nvidia RTX Spark, сочетающая сверхэффективный ARM-совместимый CPU с GPU RTX поколения Blackwell. В традиционном ПК с Windows, как объяснил Давулури во время брифинга, такая конфигурация потребовала бы четырех отдельных компонентов: CPU, дискретной GPU, выделенной графической памяти и системной ОЗУ. RTX Spark объединяет все это в один чип, соединенный с одним пулом унифицированной памяти.

Эта унификация является критическим дизайнерским решением. Обычные игровые ноутбуки с высокопроизводительными GPU Nvidia имеют максимум около 24 гигабайт памяти, доступной GPU. 128 гигабайт унифицированной памяти Dev Box — доступной как для CPU, так и для GPU через архитектуру Unified Memory Access от Nvidia — позволяют загружать модели, которые в противном случае потребовали бы облачных GPU-инстансов со специальными конфигурациями памяти с высокой пропускной способностью.Microsoft проделала значительную работу на уровне операционной системы, чтобы использовать эту архитектуру. Компания внедрила новую логику управления памятью в Windows, которая повышает предел объема системной памяти, к которому может обращаться GPU, вводит более умное выделение страниц для общих областей памяти и гарантирует, что тяжелые GPU-нагрузки не лишат CPU ресурсов, необходимых для многозадачности. Планировщик Windows также был оптимизирован для гетерогенной компоновки ядер RTX Spark, направляя требовательные рабочие нагрузки на производительные ядра, сохраняя при этом энергоэффективные ядра для фоновых задач.

Как 3D-печатный алюминиевый корпус служит радиатором

Тепловой дизайн также продуман до мелочей. Dev Box работает в пределах примерно 100-ваттного устойчивого теплового режима — скромно по меркам настольных ПК, но значимо для устройства, предназначенного для непрерывной работы задач обучения и вывода. Сам алюминиевый корпус спроектирован как пассивный радиатор, а метод его изготовления Microsoft является одной из самых поразительных деталей машины.

Верхняя панель изготовлена с использованием 3D-печати по металлу — процесса, который позволяет создавать внутренние геометрии, слишком сложные для традиционной механической обработки на станках с ЧПУ или литья под давлением. Перфорации — это не простые сквозные отверстия; они расположены под разными углами, чтобы оптимизировать воздушный поток от забора холодного воздуха через рассеивание тепла. Во время брифинга дизайнер Surface объяснил: "Сложность — это то, что другие производители не смогли бы сделать, например, с помощью ЧПУ или литья, из-за сложности формы."

На вопрос, не ограничит ли 3D-печать массовое производство, дизайнер признал сложность, но предположил, что Microsoft разработала достаточно надежный процесс для масштабирования. Результат — машина, которая работает достаточно тихо для открытого офиса, при этом выдерживая непрерывные GPU-нагрузки, которые заставили бы большинство обычных настольных ПК снизить производительность.