Вера Рубин: Тихие преобразования, которые NVIDIA готовит к 2026 году

2026-01-15 14:07:46

В ходе события, ознаменовавшего значительный поворот в стратегии компании, NVIDIA приняла решение не представлять потребительские графические карты на CES 2026. Вместо этого Дженсен Хуанг вышел на сцену с чем-то гораздо более амбициозным: платформой вычислений весом 2,5 тонны, которая обещает переосмыслить обучение и вывод моделей искусственного интеллекта.

Когда дизайн чипов нарушает собственные правила

Настоящий сюрприз заключается не в размере корпуса, а в его внутренней структуре. Платформа Vera Rubin (названа так в честь астронома, открывшего тёмную материю), нарушила внутреннее правило NVIDIA, которое сохранялось годами: каждое поколение продуктов переосмысливает только 1-2 чипа.

На этот раз компания одновременно переработала 6 различных чипов, завершила цикл разработки и перешла прямо к массовому производству. Причина прагматична: Закон Мура замедляется, но модели ИИ продолжают требовать ежегодного роста производительности в 10 раз. Единственным решением было инновации не в одном компоненте, а во всей архитектуре.

Шесть столпов Vera Rubin

Vera CPU: Основной вычислительный блок с 88 индивидуальными ядрами Olympus, способными обрабатывать 176 потоков одновременно. Объем системной памяти достигает 1,5 ТБ, что в три раза больше, чем у предшественницы Grace, с пропускной способностью NVLink C2C 1,8 ТБ/с.

Rubin GPU: Истинный движок вывода. Обеспечивает мощность NVFP4 в 50 PFLOPS, что в пять раз превышает архитектуру Blackwell. С 336 миллиардами транзисторов, включает третье поколение трансформеров, позволяющих динамически регулировать точность в зависимости от модели.

Подключение и хранение данных: ConnectX-9 обеспечивает Ethernet со скоростью 800 Гбит/с. Процессор BlueField-4 DPU управляет новым поколением хранения данных для ИИ, объединяя CPU Grace с 64 ядрами и пропускной способностью 800 Гбит/с.

Инфраструктура связи: Чип-коммутатор NVLink-6 соединяет 18 вычислительных узлов, позволяя до 72 GPU Rubin работать как единая система с пропускной способностью 3,6 ТБ/с all-to-all. Spectrum-6 добавляет 512 оптических каналов по 200 Гбит/с каждый, благодаря интеграции фотонного силикона TSMC COOP.

Влияние на показатели: когда инвестиции увеличиваются в разы

Система NVL72 Vera Rubin достигает 3,6 EFLOPS в задачах вывода NVFP4, что в пять раз больше, чем у Blackwell. В обучении — 2,5 EFLOPS, рост в 3,5 раза. Но самое впечатляющее — память: 54 ТБ LPDDR5X (в три раза больше) и 20,7 ТБ HBM (в 1,5 раза больше).

Для дата-центра мощностью 1 ГВт, стоимостью 50 миллиардов долларов, это не просто техническое улучшение. Это означает, что пропускная способность по токенам ИИ, генерируемым за ватт и доллар, увеличивается в 10 раз, прямо удваивая доходность инфраструктуры.

Обучение модели из 10 триллионов параметров теперь требует всего 1/4 предыдущих систем Blackwell. Стоимость за сгенерированный токен снижается примерно до 1/10 от предыдущей.

Решение узкого места: память контекста

В течение месяцев индустрия ИИ сталкивалась с растущей проблемой: “KV Cache” или рабочая память, которую создают модели, быстро исчерпывается в длинных диалогах. Vera Rubin решает проблему, размещая внутри корпуса процессоры BlueField-4, каждый с 150 ТБ памяти для контекста.

Этот подход обеспечивает каждой GPU дополнительно 16 ТБ памяти (при изначальных ~1 ТБ), сохраняя пропускную способность 200 Гбит/с без снижения скорости. Сеть Spectrum-X, специально разработанная для генеративного ИИ, обеспечивает работу этих “клеящихся заметок” на тысячах GPU как единая согласованная память.

Дженсен Хуанг подсчитал, что Spectrum-X может повысить пропускную способность на 25%, что эквивалентно экономии 5 миллиардов долларов в дата-центре такого масштаба. “Практически бесплатно”, — резюмировал он.

Шифрование данных на каждом уровне

Все данные в транзите, хранении и вычислениях шифруются, включая шины PCIe, коммуникацию NVLink и передачи CPU-GPU. Компании могут развертывать модели на внешних системах без опасений утечки данных.

Поворот к физическому ИИ и агентному разуму

В то время как Vera Rubin обеспечивает мощность, NVIDIA объявила о более глубоком смене парадигмы: эпоха “умных агентов” и физического ИИ уже наступила.

Дженсен Хуанг обратился к сообществу с открытым исходным кодом, подчеркнув, как DeepSeek V1 удивил мир в прошлом году как первая система вывода с открытым исходным кодом, вызвав волну инноваций. Он отметил Kimi K2 и DeepSeek V3.2 как лидеров в области open source, показав, что NVIDIA теперь строит на этой экосистеме, а не конкурирует с ней.

Стратегия заключается не только в продаже лопат. NVIDIA разработала суперкомпьютер DGX Cloud (оцененной в миллиарды) и передовые модели, такие как synthesia белков (Белок) и OpenFold 3. Семейство open source Nemotron включает модели голоса, мультимодальные, расширенное восстановление и безопасность.

Alpamayo: автономное вождение с рассуждением

Настоящим сюрпризом мероприятия стал Alpamayo — первая в мире система автономного вождения с возможностями мышления и рассуждения. В отличие от правил базированного автономного вождения, Alpamayo рассуждает как человек, разбивая сложные сценарии на элементы здравого смысла.

“Он скажет, что собирается сделать дальше и почему он так решил”, — объяснил Дженсен Хуанг. Mercedes CLA с этой технологией поступит в США в первом квартале 2026 года и будет признан самым безопасным автомобилем в мире по NCAP благодаря архитектуре “двойного слоя безопасности”, разработанной NVIDIA.

Роботы, фабрики и будущее физического ИИ

NVIDIA представила комплексную стратегию робототехники. Все роботы будут оснащены мини-компьютером Jetson и обучены в симуляторе Isaac платформы Omniverse. Видение ясно: дизайн чипов, архитектура систем и моделирование фабрик — всё ускорено физическим ИИ.

Дженсен Хуанг пригласил на сцену гуманоидных и четвероногих роботов Boston Dynamics и Agility, подчеркнув, что сама фабрика — это крупнейший робот. Даже роботы Disney были обучены на компьютерах и протестированы в симуляциях, прежде чем столкнуться с гравитацией в реальном мире.

Основное послание

В условиях растущего скептицизма по поводу “биржи ИИ” и очевидных ограничений закона Мура, Дженсен Хуанг должен был показать конкретными фактами, на что способна ИИ.

Ранее NVIDIA делала чипы для виртуального мира. Теперь они сами демонстрируют, как физический ИИ — в виде автономного вождения и гуманоидных роботов — входит в реальный мир. Как он сказал, когда битва начинается, бизнес “военной промышленности” может действительно процветать.

DEEPSEEK-2,12%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .