腾讯混元开源首个面向世界模型的强化学习后训练框架WorldCompass

2026/03/10 15:27:51

1M AI News 消息,腾讯混元 3D 团队开源首个面向世界模型的强化学习后训练框架 WorldCompass。WorldCompass 是专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。如果说世界模型是引擎,那么 WorldCompass 就是精准的「指南针」,通过引入强化学习机制,直接「引导」模型如何更准确地遵循用户指令探索世界,并保持长时序的视觉一致性。

相关推荐

某巨鲸于美股盘前新建20倍杠杆CL多单,持仓规模达110万美元

3 月 10 日,据 Hyperinsight 监测显示,过去半小时,地址 0x8d6 开头巨鲸新建 20 倍杠杆 CL 多头仓位,规模约 12,500 份,约合 109 万美元。


该仓位当前浮动盈利约 6,233 美元,收益率约 9.13%,持仓均价为 86.61 美元,清算价 83.7 美元,当前 CL 价格暂报 87.7 美元。

8分钟前

03

10

快讯
腾讯混元开源首个面向世界模型的强化学习后训练框架WorldCompass

1M AI News 消息,腾讯混元 3D 团队开源首个面向世界模型的强化学习后训练框架 WorldCompass。WorldCompass 是专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。如果说世界模型是引擎,那么 WorldCompass 就是精准的「指南针」,通过引入强化学习机制,直接「引导」模型如何更准确地遵循用户指令探索世界,并保持长时序的视觉一致性。