Microsoft обсудила поставки чипов Maia 200 для Anthropic через Azure

CHIP-6,46%
CLOUD-2,76%
TNSR-0,45%

Microsoft ведёт переговоры о поставках Anthropic, калифорнийской (Сан-Франциско) ИИ-компании, стоящей за Claude, своих ИИ-чипов Maia 200 через Azure. Сделка ещё не завершена, но она может помочь Microsoft сократить разрыв с Amazon и Google в предложении клиентам облака собственных ИИ-чипов. В ноябре Microsoft инвестировала 5 миллиардов долларов в Anthropic. Anthropic обязалась потратить 30 миллиардов долларов на Azure, при этом стартап также использует GPU Nvidia, а также кастомные чипы от Amazon и Google.

Maia 200 нацелена на эффективность ИИ-инференса

Maia 200 от Microsoft создана для ИИ-инференса — работы по запуску обученной модели для генерации ответов, а не как универсальный чип общего назначения. Запуск крупных ИИ-сервисов со временем может обходиться дороже, чем само обучение модели. Microsoft заявляет, что Maia 200 обеспечивает на 30% лучшую производительность на доллар, что может сократить ежедневные расходы для клиента с высоким объёмом или же позволить расширять, например, контекстные окна без увеличения бюджета. Чип также нацелен на то, чтобы время ответа оставалось более стабильным во время всплесков трафика — это важно для компаний, создающих продукты на моделях Anthropic.

Кастомные чипы меняют конкурентную борьбу в ИИ

Переговоры указывают, что гонка выходит за рамки покупки всё большего числа Nvidia GPU. Компании сочетают разработчиков моделей с платформами кастомных чипов и облачными системами, на которых они работают. Anthropic уже использует такой подход с Google и Broadcom — чип-дизайнером и инфраструктурной компанией. Она донастраивает модели Claude, чтобы они работали теснее с аппаратно-программным стеком Google Tensor Processing Unit (TPU). Аналогичная договорённость с Microsoft по Maia 200 может поддержать план с многооблачностью, где будет больше одного поставщика чипов, расширяя доступ Anthropic к кастомному кремнию через Azure. Поставки кастомных чипов от облачных провайдеров, по прогнозам, вырастут на 44,6% в 2026 году, тогда как рост для GPU составит 16,1%.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев