Напомню для тех, кто пропустил хайп: Cerebras делает Wafer-Scale Engine (WSE) — процессор, который вырезается не из маленького кусочка кремния, а из целой кремниевой пластины, размером с… ну, вы поняли. Их WSE-3 содержит 4 триллиона транзисторов, 900 000 вычислительных ядер и 44 гигабайта встроенной памяти. И да, он в 58 раз больше, чем хваленый Nvidia B200 "Blackwell". Представляете себе эту махину?
Главный фокус этого монстра – пропускная способность памяти. Cerebras утверждает, что их железяка обеспечивает в 2625 раз большую пропускную способность, чем B200 от Nvidia. Это критически важно для инференса — процесса, когда ИИ выдает ответы на основе обученной модели. Каждый токен, который генерирует, например, большая языковая модель, требует переноса всей ее весовой матрицы из памяти в вычислительные ядра. Этот процесс последовательный, его невозможно распараллелить, поэтому пропускная способность памяти — главный ограничивающий фактор. Cerebras заявляет, что их архитектура обеспечивает в 15 раз более быстрый инференс.
Так вот, компания продала 30 миллионов акций по 185 долларов за штуку и привлекла 5,55 миллиарда долларов. Bloomberg окрестил это крупнейшим технологическим IPO в США со времен Uber в 2019 году. Похоже, кто-то действительно верит в кремниевый апокалипсис.
Джули Чой, старший вице-президент и директор по маркетингу Cerebras, заявила в интервью, что они планируют направить свежий капитал на расширение облачной инфраструктуры. Больше дата-центров, больше Cerebras'ов, больше мощи для самого быстрого в мире инференса! Похоже, они всерьез намерены накормить ИИ-голодающих.
Так что теперь? Nvidia пора потесниться? Сможет ли Wafer-Scale Engine перевернуть рынок ИИ-инфраструктуры, или это просто дорогая игрушка для избранных? Время покажет. Но одно можно сказать точно: кремниевый обед от Cerebras обойдется вам в кругленькую сумму.