在人工智能与区块链技术快速交汇的当下,Sam Altman 领导的 OpenAI 携手加密投资巨头 Paradigm,正式推出 EVMbench。这项全新基准测试工具,旨在严格评估 AI 代理能否有效侦测、修补,甚至模拟利用以太坊智能合约中的高风险漏洞,守护价值数千亿美元的数字资产安全。
(前情提要:加密货币从来不是为人类设计的?Dragonfly 合伙人:真正的使用者是 AI 代理)
(背景补充:Sam Altman 亲自挖角!OpenClaw 创办人加入 OpenAI,个人 AI 代理“很快成为核心产品”)
本文目录
随着人工智能技术快速进展,OpenAI 近日宣布与加密货币投资公司 Paradigm 合作,正式推出全新基准测试工具“EVMbench”。这项工具专门用来评估 AI 代理(AI agents)在区块链智能合约安全领域的表现。OpenAI 表示,此举旨在为区块链安全建立更明确的 AI 评估标准,同时回应去中心化金融(DeFi)领域日益庞大的资产保护需求。
智能合约是部署在以太坊虚拟机(EVM)相容区块链上的自动执行代码,已成为支撑去中心化交易所、借贷平台与稳定币支付等应用的核心基础。目前,这些合约保护的开源加密资产总值经常超过 1000 亿美元。由于合约一旦上链通常无法修改,任何漏洞都可能导致巨额资金损失,过去数年已发生多起知名攻击事件。因此,如何有效审计与强化智能合约安全,已成为区块链产业最迫切的课题之一。
EVMbench 基准测试以真实世界案例为基础,共搜集来自 40 个审计项目的 120 个严重漏洞,其中大多数来自公开的代码审计竞赛(如 Code4rena),并额外纳入 Paradigm 支持的 Tempo 区块链支付相关漏洞情境。测试涵盖三项核心能力:
通过这三个面向,EVMbench 提供百分比式的综合表现分数,让研究者与开发者能清楚比较不同 AI 模型在智能合约安全任务上的实力。
OpenAI 在官方博客中强调,随着 AI 代理在阅读、撰写与执行代码的能力持续提升,它们在具有高度经济价值的环境中扮演防御性角色的能力将越来越关键。EVMbench 不仅是用来测试 AI 的极限,也希望鼓励业界将 AI 应用于主动审计与强化已上线合约上面,进而降低整体风险。
OpenAI 同时指出,此基准与其“准备框架”(Preparedness Framework)中描述的高风险网络情境高度相关,显示其在 AI 安全治理上的全面布局。
EVMbench 的推出标志着 AI 技术正从通用应用走向高度专业的区块链安全领域。随着 DeFi 与稳定币支付持续成长,未来若 AI 能在侦测与修补漏洞上展现可靠表现,将大幅提升整个生态系的安全水准。不过,基准测试也提醒我们,AI 在“利用漏洞”上的能力同样需受到严格监管,以避免被用于恶意攻击。随着 AI 模型能力不断跃进,EVMbench 或许将成为衡量“AI 是否足以守护数字资产”的重要指标。
相关文章