英伟达发布 Cosmos-Reason2-32B 旗舰模型权重,并将上下文窗口扩展至 256K 个 Token

据 Beating 称,NVIDIA 已发布 Cosmos-Reason2-32B 的权重,这是其物理 AI 推理视觉语言模型(VLM)的旗舰版本,旨在帮助机器人和自动驾驶系统理解空间、时间和物理原理。该 320 亿参数模型基于 Qwen3-VL-32B-Instruct 构建,现已在 NVIDIA Open Model License 下提供商业使用。

该模型能够分析视频流以评估行车安全,在图像中以 2D/3D 坐标检测目标,并可作为人形机器人和自动驾驶车辆的规划引擎。与上一代相比,Cosmos-Reason2 新增了具有精确时间定位的目标检测,并将上下文窗口扩展至 256K tokens。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Anthropic Claude Code 因计费故障向用户多收 200.98 美元,最初拒绝退款,后才完成全额补偿

根据 Beating 的监控,Anthropic 的 Claude Code 服务中的一个计费漏洞导致一名 Max 20x 订阅者在仅使用其每月配额的 13% 的情况下,被额外多收了 200.98 美元的使用费。该漏洞是在用户的 git 仓库提交历史包含大写的情况下触发的

GateNews18 分钟前

DeepSeek 于 4 月 30 日推出视觉基础原语方法,以增强多模态推理

根据 DeepSeek 的技术报告,4 月 30 日,该公司推出了 Visual Primitives,这是一种将诸如点和边界框等基础视觉单元嵌入推理链的方法,以解决多模态任务中的 Reference Gap 问题。该方法降低了图像标记的消耗

GateNews43 分钟前

OpenAI 揭露 Codex 为何禁止谈论“哥布林”:书呆子人格奖励失控

OpenAI 在官方博客中说明 Codex 禁谈“哥布林”等生物,源于书呆子人格训练中的奖励信号偏好生物隐喻,导致跨人格污染与 RLHF 误导。事件由 Barron Roth 爆出系统指令后,OpenAI 采取短期硬编码与长期清除奖励信号两种策略,警示奖励设计的脆弱性,后续训练审计需更精细。

鏈新聞abmedia1小时前

阿里巴巴在 4 月 30 日开源 Qwen-Scope 可解释性模块,覆盖 7 个模型

据 PANews 称,4 月 30 日,阿里巴巴的 Qwen 公布了对 Qwen-Scope 的开源,这是一种在 Qwen3 和 Qwen3.5 系列模型上训练的可解释性模块。该发布覆盖了 7 个大型语言模型,包括密集版和混合专家(mixture-of-experts)变体,并提供 14 组稀疏自动编码器

GateNews2小时前

英伟达 B300 AI 服务器在供应紧张之际于中国创下 100 万美元

根据路透社,英伟达的 B300 AI 服务器现在在中国的售价约为 700 万元人民币(约 100 万美元),原因是打击走私网络的行动以及本地科技公司的持续需求。该价格已从 2025 年晚些时候约 400 万元人民币(585,000 美元)大幅上涨,显著

GateNews2小时前

LG CNS 第一季度经营利润因 AI 和云增长上涨 19%

据朝鲜日报报道,LG CNS 于 4 月 30 日表示,第一季度营业利润同比增长 19.4% 至 942 亿韩元(6410 万美元),由 AI 和云需求带动。收入增长 8.6% 至 1.3 万亿韩元(8.94 亿美元)。 该公司 AI 和云业务部门产生了 765.40 亿韩元

GateNews3小时前
评论
0/400
暂无评论