Step Audio 2.5 实时发布:主观评分 80.41 分,较 GPT-Realtime-1.5 大幅领先 18%,语音通话费用 3.8 元/小时

据 Beating,Step Audio 2.5 Realtime(Step Cosmos 的端到端实时语音模型)于 2026 年 4 月在其开放平台 API 上线。该模型强调自然对话,支持可定制的角色人设,并具备副语言感知(语调、停顿、叹息)。

在官方五个维度的测试中,Step Audio 2.5 Realtime 在所有类别中均排名第一。主观评估得分(真实用户手机应用对话)达到 80.41,而 GPT-Realtime-1.5 为 68.01,Gemini Live 为 67.16。语音问答基准得分为 79.80,几乎是 GPT-Realtime-1.5 的 1.5 倍(53.20)。API 定价:每百万输入 token 收取 10 元(缓存命中为 2 元),每百万输出 token 收取 70 元;持续语音通话预计为每小时 3.8 元。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

TCI 基金在抛售近 $8B 的微软股份,称其存在 AI 威胁

据《金融时报》报道,Chris Hohn 的对冲基金 TCI 最近出售了近 80 亿美元的微软股份。该基金告诉投资者,人工智能对微软在软件领域的主导地位构成威胁。

GateNews41 分钟前

Tessera Labs 完成由 a16z 领投的 $60M 融资轮次

据 Odaily 报道,AI 自动化初创公司 Tessera Labs 宣布完成一轮 6000 万美元的融资,由 Andreessen Horowitz(a16z)领投,Foundation Capital、Myriad Venture Partners 和 Osage University Partners 参与。该公司的 AI 原生平台可自动化企业

GateNews2小时前

攻击者通过 13 个账号向 Hugging Face 和 ClawHub 注入 575 项恶意技能

据 Mist Security 首席信息安全官 @im23pds 称,攻击者最近入侵了 13 个账户,以向 Hugging Face 和 ClawHub(OpenClaw)注入 575 个恶意 Skills,相关信息已在 X 平台披露。

GateNews2小时前

DeepSeek 计划在创纪录的融资轮中最多募集人民币 500 亿,并将在 6 月推出 V4.1 模型

据 PANews 5 月 8 日报道,DeepSeek 计划在首轮融资中最多筹集人民币 500 亿,这将成为中国 AI 公司单笔融资规模最大的融资。创始人兼 CEO 梁文峰预计将出资最多。该公司计划加速大语言模型

GateNews3小时前

Sportix 完成 320 万美元的融资轮,由 Coinvestor Ventures 领投,Animoca Brands 参与

据 ChainCatcher 称,体育 AI 基础设施平台 Sportix 已完成一轮 320 万美元的融资。该轮融资由 Coinvestor Ventures 牵头,Animoca Brands、Becker Ventures、X21 Digital 和 Alpha Capital 参与。 Sportix 表示,它将使用这笔资金来推进其 AI

GateNews3小时前

机器人训练数据成本自 2024 年以来下降 65%,从每小时 340 美元降至每小时 118 美元

据 Cointelegraph 称,自 2024 年以来,机器人训练数据成本下降了 65%,到 2026 年已从每小时 340 美元降至每小时 118 美元。

GateNews3小时前
评论
0/400
暂无评论