Китайская AI-лаборатория DeepSeek ведёт переговоры о привлечении первого раунда финансирования при оценке, о которой сообщает TechCrunch, в 45 миллиардов долларов. Эта оценка заметно выше по сравнению с оценкой в 20 миллиардов долларов, которая, как ожидалось, действовала всего несколькими неделями ранее, после того как внимание привлекли AI-модели компании благодаря более низким затратам на обучение. Основатель Лян Вэньфэн контролирует почти 90% компании.
DeepSeek решил искать финансирование после того, как конкуренты попытались переманить исследователей, предлагая доли в компании в качестве стимула. Раунд может возглавить China Integrated Circuit Industry Investment Fund, при этом, как сообщается, в переговорах также участвуют Tencent и Alibaba.
Как заявляет сама компания, модель V4 DeepSeek по результатам бенчмарков работает наравне с ведущими моделями OpenAI и Anthropic. Конкурентное преимущество распространяется и на цены: V4-Pro стоит 1,74 доллара за миллион входных токенов, тогда как V4-Flash — примерно 0,14 доллара за миллион входных токенов, что заметно ниже стоимости сопоставимых по классу американских моделей.
Более низкая структура затрат объясняется вычислительно-эффективной архитектурой DeepSeek, включая дизайн mixture-of-experts (MoE), при котором для каждой задачи активируется лишь часть модели, что снижает вычисления во время инференса. По данным DeepSeek, V4-Pro использует 27% вычислительной мощности и 10% памяти, необходимых для V3.2.
Раунд финансирования DeepSeek проходит на фоне того, как Китай стремится построить более самодостаточную AI-инфраструктуру в ответ на американские экспортные ограничения на передовые чипы. V4 — первая модель DeepSeek, настроенная под китайские чипы, такие как линейка Huawei Ascend, однако в техническом отчёте компании говорится, что китайские чипы выполняют инференс, тогда как обучение, возможно, по-прежнему в значительной степени зависит от аппаратного обеспечения Nvidia.
DeepSeek также выпускает модели с открытыми весами — обученные параметры, которыми другие могут пользоваться, дообучать и разворачивать, расширяя развитие AI за пределами доминирования США. Эта стратегия делает акцент на алгоритмической эффективности вместо эксклюзивного доступа к самым продвинутым американским аппаратным решениям, хотя AI-рывок Китая остаётся частично зависимым от оборудования Nvidia.
Related News
Apple увеличивает расходы на НИОКР до максимума за 30 лет на фоне ускорения инвестиций в ИИ
CITIC: ИИ-вычисления стимулируют перестройку энергоснабжения в США, рынок самообеспечения открывается
Акции Hut 8 выросли на 30% до аренды дата-центра для ИИ на $9,8 млрд
ИИ стимулирует спрос на полупроводники: акции Samsung резко выросли на 12%, капитализация превысила 1 триллион долларов
Anthropic commits $200B в Google Cloud на протяжении более пяти лет