Повідомлення Gate News, 24 квітня — У Сполучених Штатах розгорнулася дискусія щодо технологічних можливостей і відповідності (комплаєнсу) DeepSeek V4. Кріс МакГайр, старший науковий співробітник у Раді з міжнародних відносин (CFR) та колишній посадовець Ради національної безпеки Білого дому й Міністерства оборони, опублікував аналітичну записку, в якій стверджує, що V4 не змінила конкурентний ландшафт у сфері ШІ між США та Китаєм. За словами МакГайра, власний звіт DeepSeek щодо V4 визнає, що його міркувальні здібності відстають від базових моделей приблизно на 3–6 місяців, і це підтверджується бенчмаркінгом проти GPT-5.2 та Gemini 3.0 Pro, які вийшли за шість місяців до цього.
МакГайр висловив занепокоєння, що хоча звіт V4 розкриває адаптацію на етапі інференсу до NVIDIA GPU та Huawei Ascend NPU, він не вказує публічно моделі GPU або витрати на навчання, використані під час розробки. Він поставив під сумнів, чи це мовчання означає застосування експорт-контрольованих чипів NVIDIA Blackwell, зазначивши, що V3 раніше заявляла про використання 2,000 GPU H800 із вартістю $5.57 million. DeepSeek заперечив використання Blackwell, заявивши, що модель навчали на процесорах NVIDIA H800 та Huawei Ascend 910C.
CEO Replit Амджад Масад заперечив аналіз МакГайра, стверджуючи, що китайські вчені публічно діляться справжніми проривами в галузі ШІ, тоді як американські політики та лобісти посилюють занепокоєння щодо «дистиляції з Китаю». Масад підкреслив архітектурні інновації, розкриті в офіційних заявах DeepSeek, зокрема стиснення уваги на рівні токенів (DeepSeek Sparse Attention) та суттєві покращення ефективності для обчислень із довгим контекстом. Він зазначив, що V4-Pro демонструє значно нижчі витрати обчислень інференсу на один токен і вимоги до KV cache за контексту 1M порівняно з V3.2, наголошуючи, що ці архітектурні досягнення не пов’язані з дистиляцією навчальних даних, і що всі дослідники, включно з американськими лабораторіями, можуть скористатися відкритими розробками з відкритого коду.
Related News
Tencent випустила Hy3 у прев’ю-версії з відкритим кодом, тест продуктивності коду порівняно з попередньою версією покращено на 40%
OpenAI 推 GPT-5.5:12M контекст, AA індекс на першому місці, Terminal-Bench 82.7% переписує агентський бенчмарк
Google Jules запускає список оновлених кандидатів у відкритому доступі та перевизначає його як платформу для розробки end-to-end продуктів