OpenAI 的 GPT-5.5-Cyber 武装网络防御者

Cryptonews

OpenAI 已发布 GPT-5.5-Cyber 给已审核的网络安全防御者,使他们在针对专业安全工作流的场景中获得更少的安全护栏。
摘要

  • OpenAI 的 GPT-5.5-Cyber 是其产品线中放开程度最高的模型,限量预览提供给获批的合作伙伴,用于执行高级安全工作。
  • 已审核的团队可以用它进行漏洞猎取、恶意软件分析和逆向工程,但编写恶意软件和窃取凭证仍被阻止。
  • 此次发布是在竞争对手 Anthropic 的 Claude Mythos Preview 提前一月推出之后,后者引发了投资者和政府的关注。

OpenAI 于 5 月 7 日在限量预览中发布 GPT-5.5-Cyber,目标是保护关键基础设施的安全专业人士。该公司将其描述为其网络安全产品线中放开程度最高的模型,面向一小群获批合作伙伴,提供针对专门授权工作流的支持,并要求更强的核验以及账户级控制。

这款面向网络安全的特定版本让已审核团队更容易使用 OpenAI 最新模型进行漏洞识别、补丁验证和恶意软件分析等工作流;在通用可用的 GPT-5.5 中,内置的安全护栏可能会造成阻力。

OpenAI 表示:“GPT-5.5-Cyber 让更小范围的合作伙伴能够研究高级工作流,在这种工作流中,专门的访问行为可能更关键。”

防御者能做什么和不能做什么

获批参与 OpenAI 的网络安全 Trusted Access for Cyber 项目最高等级的防御者,将获得一个护栏更少的 GPT-5.5 版本,其能力比公开模型更强,能够支持漏洞猎取、恶意软件研究,以及对攻击的逆向工程。无论访问级别如何,凭证窃取和编写恶意软件始终被阻止。

在早期测试中,部分合作伙伴使用 GPT-5.5-Cyber 来自动化并扩展对基础设施系统的红队演练,并验证高严重性漏洞。OpenAI 计划在未来的一次技术深度剖析中记录这些发现,作为负责任披露流程的一部分。

英国 AI 安全研究院发布了对 GPT-5.5 在 95 项细分网络安全任务中的评估。该研究院发现,自至少 2026 年 2 月以来,基础任务已被领先模型完全饱和;但它也提醒,其测试不反映在有防守、并伴随告警惩罚的真实世界目标上的表现。

竞争压力

该推行距离 Anthropic 发布 Claude Mythos Preview 仅一月。后者是一款面向网络安全的模型,吸引了投资者以及 Trump 政府高级成员的关注,即便 Anthropic 早在数周前就已被 Pentagon 列入黑名单。

AI 网络安全已成为一种正式的竞争战线,两家公司都在提出问题:究竟是谁控制 AI 攻防工具,以及当这些能力被滥用时,责任应由谁承担。

OpenAI 还指出,它已向 US Center for AI Standards and Innovation 以及 UK AI Security Institute 提供了更早的模型 GPT-5.4-Cyber,以供独立评估。标准版 GPT-5.5 仍是其面向大多数防御者的推荐入门选择。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Cloudflare 股价在 5 月 8 日盘中大跌 23.62%,因 Q1 财报后宣布裁员 1,100 人

Cloudflare 的股价在 5 月 8 日下跌 23.62%,至每股 196.13 美元,此前公司发布了第一季度财报,并宣布约 1,100 人裁员。尽管第一季度营收为 6.4 亿美元,凭借同比增长 34% 超出预期,但第二季度营收指引为 6.64–6.65 亿美元,低于此前市场预期的 6.66 亿美元。裁员规模约占员工总数的 20%,是公司向“AI-agent-first 运营模式”转型的一部分,预计成本为 1.4 亿–1.5 亿美元。

GateNews24 分钟前

Helsing 目标在 180 亿美元估值下融资

据《金融时报》报道,Helsing,这家德国AI驱动的无人机初创公司,计划以约 180 亿美元的估值筹集新融资。

GateNews1小时前

Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%,超越 GPT-5.5 Pro,解决了 3 个此前无法解决的问题

Google DeepMind 发布了 AI 共数学家(AI co-mathematician),一种多智能体数学研究助手,在 FrontierMath 第 4 级基准上实现 47.9% 的准确率,超越 GPT-5.5 Pro 在 5 月 9 日创下的先前纪录(39.6%)。该系统解决了 48 道题中的 23 道题,包括 3 道此前所有模型都无法解答的问题。该系统基于 Gemini 3.1 Pro 构建,采用分层架构:项目协调员智能体向子智能体分发任务,由子智能体分别负责文献检索、编码与推理,并在提交前由多个审阅智能体对证明进行验证。 Epoch AI 进行了盲测,确保 DeepMind 团队看不到题目,每道题允许进行 48 小时的计算。在实际应用中,数学家 Marc Lackenby 使用该系统解决了《Kourovka Notebook》中的一个未决猜想,展示了其实际研究价值。目前,该系统正处于测试版阶段,仅向少数数学家开放。

GateNews1小时前

OpenAI 的奖励系统无意中在包括 GPT-5.4 在内的 6 个模型上对思考链进行评分

根据 OpenAI 的对齐团队称,该公司最近发现了一个影响 6 个大型语言模型(包括 GPT-5.4)的关键训练错误:奖励机制无意中对模型的思维链进行了评分——即在生成答案之前的内部推理过程。GPT-5.5 未受影响。 该事件违反了一项基本的 AI 安全原则,即思维链绝不能被评估,因为这样做可能会激励模型为获得更高分数而编造推理。 有缺陷的评分系统在评估回复是否有用,或模型是否已被攻击所攻破时,错误地包含了思维链。受影响的训练样本在数据集中最多占 3.8%。OpenAI 已修补该漏洞,并开展了对比实验,证实这些模型并未发展出欺骗行为。该公司已在所有训练流程中部署了自动化扫描系统,以防止再次发生。

GateNews2小时前

阿里巴巴未与 DeepSeek 进行谈判,市场消息人士在 5 月 9 日作出澄清

据《财新》5月9日报道的市场消息,阿里巴巴并未就融资与 DeepSeek 进行谈判。此澄清是在此前媒体报道称两家公司会谈已破裂之后作出。DeepSeek 于4月发起一轮重要的融资,吸引了腾讯和阿里巴巴的关注。

GateNews2小时前

OpenAI 发布 Codex 迁移工具,用于从竞争性的 AI 助手导入配置

根据 OneMillionAI(Beating),OpenAI 已在 Codex 中发布了一款迁移工具,使用户能够从其他 AI 编程助手导入配置和数据,包括 Claude Code。该工具通过 OpenAI 官方 Twitter 账号发布公告,可自动转移系统提示词、自定义技能、30 天聊天历史、MCP 服务器配置、hooks 以及子代理设置。 OpenAI 指出,这款迁移工具会通过 Codex 设置中的“Import other agent setup”选项自动处理大多数配置。对于不兼容的设置,该工具会启动引导式对话,以帮助用户进行手动迁移。该公司建议用户在迁移后核实权限和身份验证设置,因为不同平台之间的权限系统不兼容。

GateNews3小时前
评论
0/400
暂无评论