DeepSeek 部署 DSpark 框架,将 DeepSeek-V4 生成速度提升高达 85%

DEEPSEEK-0.01%
DeepSeek 在与北京大学联合发布技术报告后,为其 DeepSeek-V4 生产服务部署了推测采样加速框架 DSpark。DSpark 将 Flash 版本的生成速度提高 60% 至 85%,Pro 版本提高 57% 至 78%,同时不影响输出质量。
DeepSeek 开源了完整的 DeepSpec 代码库以及该框架。DeepSpec 支持包括 Qwen3 和 Gemma 在内的流行开源模型,为开发者提供了完整的 Python 工具链,用于在本地训练自定义加速模块。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论