智元 GE-Sim 2.0:用世界模型生成世界,宇树劲敌将人形机器人推向自我进化

鏈新聞abmedia

具身智慧(Embodied AI)正迎来一个关鍵转折点。中国智元机器人近期发布 Genie Envisioner World Simulator 2.0(GE-Sim 2.0),試圖將 World Model(世界模型)从單純理解環境的工具,推进为可以直接运行、訓練与優化机器人的世界模擬器(World Simulator)。

如果你还不了解这有多关鍵,不妨先看看 LLM 架構的硬傷:訓練逻辑上现存 LLM 只是根據龐大语料庫来预測上下文,它可以知道「蘋果掉下来」这幾个字常一起出现,但並不真正理解重力或物理世界的因果关係。

这就是为什麼楊立昆、李飞飞等科学家都投身於 World Model 賽道,当 AI 具備对 3D 環境的理解与物理预測能力后,这項技術將成为自主机器人、自动駕駛与智慧製造等「实體AI」(Physical AI)的數位大腦。因此,World Model 的路線主張,机器人將会是十分关鍵的載體。如今等身机器人廠商智元机器人入局,象徵中国从硬體逆襲的先鋒。

先前台積电董事长魏哲家曾表示:如果看中国大陸一直弄机器人可跳来跳去蹦蹦跳。那个沒用,只是好看头而已。他指出关鍵在於要让机器人大腦能运作,而大腦誰在做,輝达 (Nvidia)、超微 (AMD) 与一堆美国公司,但 95% 大腦是台積电製造。GE-Sim 2.0 发展瓶頸仍在,与中国的模型发展強綁定。

World Model 的路線主張,机器人是关鍵

当前主流的 LLM 依靠龐大的语料庫与统计关係来理解上下文,並预測下一个詞语。它可以知道「蘋果掉下来」这幾个字常一起出现,但並不真正理解重力或物理世界的因果关係。

这種模式在文本生成、程式輔助或问答任務上表现出色,但在需要理解现实世界結構、推理因果关係与长期規劃的场景中,仍存在根本限制。更大的问題在於數據来源正在逐漸枯竭。LLM 的訓練高度依賴高品质人類资料,而近年业界已开始警告,可用的人類文本资料可能在未来幾年內被消耗殆盡。屆时就像近親繁殖可能遺傳缺陷,最終導致模型逐漸偏离现实並出现性能退化。

(深度解析:LLM 存在缺陷?为何楊立昆的 AMI 押注 World Model 路線)

这也是为什麼近年 AI 学界两位重量級人物楊立昆与被稱为「AI 教母」的李飞飞(Fei-Fei Li)都选擇押在被稱为 World Model(世界模型) 的新一代 AI 架構。

当时筆者曾表示:延伸来看,当 AI 具備对 3D 環境的理解与物理预測能力后,这項技術將成为自主机器人、自动駕駛与智慧製造等「实體AI」(Physical AI)的數位大腦。因此,World Model 的路線主張,机器人將会是十分关鍵的載體。如今等身机器人廠商智元机器人入局,象徵中国从硬體逆襲的先鋒。

先前台積电董事长魏哲家,在談及机器人与半導體发展时直言,如果看中国大陸一直弄机器人可跳来跳去蹦蹦跳。那个沒用,只是好看头而已。他指出关鍵在於要让机器人大腦能运作,而大腦誰在做,輝达 (Nvidia)、超微 (AMD) 与一堆美国公司,但 95% 大腦是台積电製造。

(台積电魏哲家酸:中国机器人蹦蹦跳,只是好看头沒用!关鍵仍来自輝达)

World Model 进化:从理解世界,到在世界中学習

过去幾年,World Model 一直被視为 AI 理解现实的关鍵技術。透过影像、语言与感測數據,模型可以预測環境變化,让机器人具備基本決策能力。

但 GE-Sim 2.0 的核心突破在於不只是理解世界,而是直接在「模型生成的世界」中学習与行动系统將行动(Action)納入核心變數,从傳统的狀態预測,升級为完整循環:

State

Action

State Evolution

这意味著,机器人不再只是觀察与回应,而是能在模擬環境中主动試错、自主優化、持续学習。这種转變,使 World Model 从「认知模型」进化为「訓練基礎设施」。

GE-Sim 2.0:让机器人在虛擬世界中「进化」

GE-Sim 2.0 被定義为一套「具身世界模擬器」,核心目標是解決现实訓練的三大瓶頸:成本过高、數據不足、难以規模化。透过模型生成環境,系统可以在不依賴真实世界的情況下,大規模訓練机器人。

技術上,GE-Sim 2.0 整合三个关鍵能力:首先是「动作驅动影像生成」,模型能根據机器人动作生成对应的未来畫面,並保持多視角一致性,包括头部視角与左右手操作視角。

其次是本體感知(proprioception)建模,不只模擬外部畫面,还能预測机器人自身关節与动作狀態,让決策更接近真实物理世界。

第三是「自动任務評估」,透过內建的 reward model(獎勵模型),系统可自动判斷任務是否完成,例如「將藍色物體放入紅色盒子」,並給出回饋,直接用於強化学習。这使得机器人可以在模擬環境中完成完整閉環:

GE-Sim 2.0 已能实现「分鐘級」穩定影片生成

相较早期模型僅能生成短片段,GE-Sim 2.0 已能实现「分鐘級」穩定影片生成,支援长时间任務模擬。同时,透过大規模真实數據(远端操作、部署与交互數據)訓練,模型在不同场景与任務间具備更強泛化能力。这一点对於人形机器人尤其关鍵:因为现实世界的操作高度多變,无法單靠固定场景訓練。

World Simulator 的出现,意味著机器人可以在虛擬世界中「无限練習」这將帶来两个結構性變化:第一,訓練成本大幅下降。第二,能力迭代速度呈指數級提升。

智元机器人:中国人形机器人新勢力

智元机器人 成立於 2023 年,由华为「天才少年」彭志輝 創辦,專注於 AI 与机器人融合的具身智能领域。

公司核心产品包括:

「远征」系列人形机器人

「靈犀」机器人系统

通用大模型 GO-1

目前已完成多輪融资,並獲紅杉中国、高瓴资本等机構投资,被視为中国人形机器人领域的重要玩家,与宇樹科技形成競爭格局。

这篇文章 智元 GE-Sim 2.0:用 World Model 生成世界,宇樹勁敵將人形机器人推向自我进化 最早出现於 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论