蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版 Agent一键接入RL训练(蚂蚁集团再次约谈) 99xcs.com

蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版 Agent一键接入RL训练!蚂蚁集团与清华大学联合发布了开源强化学习训练框架AReaL v1.0的稳定版。这一版本主打“Agent一键接入RL训练”,无需修改代码,兼容各种Agent框架,让智能体强化学习训练变得简单易用。

自2026年初以来,智能体技术持续升温,以LangChain、Claude Code和OpenClaw为代表的智能体框架迅速发展,但也面临两大挑战。首先是接入训练的成本高,因为现有智能体框架接口不统一,每次接入都需要编写大量适配代码。其次是大多数智能体缺乏持续进化的能力,它们的能力主要取决于底层模型在训练阶段习得的固定权重,部署后无法再针对特定场景进行优化,能力上限在交付时已经确定。

AReaL是首个全异步训推解耦的大模型强化学习训练系统,它使智能体能够在真实任务交互中获得反馈并持续优化决策。v1.0版本通过在智能体与训练系统之间加入Proxy Worker中转层,实现了任意Agent零改造接入RL训练。开发者只需更改一个请求地址即可完成接入。