2026-04-10 06:18:53

10 апреля，DeepSeek 官方博客发布了一篇文章，介绍 DeepSeek V4——由 DeepSeek 公司推出的旗舰模型。该模型不仅突破了参数规模的上限，还承诺前所未有的效率。预计 DeepSeek V4 能够处理 1 万亿 (T) 参数，原生支持多模态数据，包括文本、图像、视频和音频，并拥有 1 00 万 token 的上下文窗口，等同于 15-20 部完整小说(，使其成为直接竞争西方巨头（如 OpenAI 的 GPT-5.4 和 Anthropic 的 Claude Opus 4.5）。DeepSeek V4 的 API 定价比 GPT-5.4 和 Claude Opus 4.5 低 10-50 倍；预计 DeepSeek V4 将以 Apache 2.0 许可证开源发布。DeepSeek V4 还可在本地运行于配备两张 RTX 4090 或一张 RTX 5090 的系统上。此外，DeepSeek 为 DeepSeek V4 提出了三项革命性创新：1. 记忆エングram；2. 多样化受限超连接 )mHC(；3. 稀疏注意力机制 )DSA( 和 Lightning 索引器。进一步地，在 DeepSeek 的官方声明中提到，由于美国对高质量 NVIDIA 图形处理器的严格出口限制——例如 B300 和 H200)——DeepSeek 针对推理对 V4 进行了优化，主要依赖中国生产的芯片。尽管最初的训练仍可能使用 NVIDIA 设备，例如 H800(，但该模型已针对华为 Ascend 950PR 和 Cambricon MLU 的芯片进行了高度优化。

查看原文

post-image

post-image

post-image

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

评论

请输入评论内容

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate上线Pre-IPOs
18.37万热度
#
加密市场回升
4.55万热度
#
原油小幅上涨
116.69万热度
#
美伊停火协议谈判再生变故
55.88万热度
#
大摩比特币现货ETF上市
44.23万热度

热门 Gate Fun
查看更多

1
MRT
Memorial Token
市值:$2344.98持有人数:4
0.50%
2
T.T
无限充值的忏悔
市值:$2255.17持有人数:1
0.00%
3
人民币
人民币
市值:$2891.3持有人数:2
4.35%
4
Fjb
飞机杯
市值:$0.1持有人数:1
0.00%
5
gt
Helu
市值:$2251.72持有人数:1
0.00%