✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
10 апреля,DeepSeek 官方博客发布了一篇文章,介绍 DeepSeek V4——由 DeepSeek 公司推出的旗舰模型。该模型不仅突破了参数规模的上限,还承诺前所未有的效率。预计 DeepSeek V4 能够处理 1 万亿 (T) 参数,原生支持多模态数据,包括文本、图像、视频和音频,并拥有 1 00 万 token 的上下文窗口,等同于 15-20 部完整小说(,使其成为直接竞争西方巨头(如 OpenAI 的 GPT-5.4 和 Anthropic 的 Claude Opus 4.5)。DeepSeek V4 的 API 定价比 GPT-5.4 和 Claude Opus 4.5 低 10-50 倍;预计 DeepSeek V4 将以 Apache 2.0 许可证开源发布。DeepSeek V4 还可在本地运行于配备两张 RTX 4090 或一张 RTX 5090 的系统上。此外,DeepSeek 为 DeepSeek V4 提出了三项革命性创新:1. 记忆エングram;2. 多样化受限超连接 )mHC(;3. 稀疏注意力机制 )DSA( 和 Lightning 索引器。进一步地,在 DeepSeek 的官方声明中提到,由于美国对高质量 NVIDIA 图形处理器的严格出口限制——例如 B300 和 H200)——DeepSeek 针对推理对 V4 进行了优化,主要依赖中国生产的芯片。尽管最初的训练仍可能使用 NVIDIA 设备,例如 H800(,但该模型已针对华为 Ascend 950PR 和 Cambricon MLU 的芯片进行了高度优化。