RLinf 正式加入 PyTorch Ecosystem Landscape，拥抱全球开源生态

近日，RLinf 正式入选 PyTorch Ecosystem Landscape ，成为 PyTorch 官方生态的重要组成部分。PyTorch Landscape 是 PyTorch 官方维护的权威生态项目目录，入选项目需严格满足代码质量、文档完整性、社区治理、开源合规等多项高标准要求。RLinf 的成功入选，标志着该项目已通过 PyTorch 社区全面审核，符合 PyTorch 生态系统的技术规范与质量标准，获得全球 AI 开发者生态的官方认可。

关于 RLinf

RLinf 是由无问芯穹与清华大学、北京中关村学院等机构联合打造的全球首个面向具身智能的大规模强化学习训练开源框架，专为通过强化学习对具身大模型进行后训练而设计，独创了混合式执行模式与 M2Flow 编程范式，实现系统提速超 120%、模型性能跃升 40%~60%。并将可编程的逻辑工作流与高效的底层优化解耦，兼顾灵活性与高效性。

RLinf 系列成果发表于计算机系统架构最重要会议之一OSDI、机器学习会议NeurIPS等，开源以来斩获 GitHub Star 3600+、Forks 490+，成为具身智能领域最受欢迎的框架之一，被加州大学伯克利分校、佐治亚理工大学、香港大学、清华大学、北京大学、上海交通大学、复旦大学、中科院自动化研究所等学术机构的具身智能体团队采用。在产业层面，RLinf 也已被英伟达、智元机器人、自变量机器人、原力灵机、摩尔线程、地瓜机器人等工业界企业广泛采用，形成了从科研到产业的开源生态闭环。

Milestone

RLinf 自 2025 年 9 月开源以来，持续进行迭代完善，致力于成为全球领先的具身智能训练基础设施：

2025.9

RLinf v0.1

在 v0.1 版本，RLinf 打通了仿真、训练与推理的一体化流程，统一支持多种具身大模型、强化学习算法与仿真器，并进行系统性优化，在 GPU 利用效率和整体训练吞吐上显著优于现有框架，在实验评测中实现了最高 1.27 倍的整体效率提升。

2026.3

RLinf v0.2

在 v0.2 版本，RLinf 将能力进一步扩展至真实世界，支持全异构、全异步的真机强化学习。系统通过自适应通信平面和统一硬件接口实现“像使用GPU一样使用机器人”，支持跨域多机真实世界强化学习。并且，系统通过训推异步支持了至少4种数据高效的强化学习算法与人在环功能，为可扩展的真实世界强化学习提供系统级基础设施。

2026.3

RLinf 入选具身智能 EAI-100 年度榜单十大突破项目

魔搭社区联合CCF智能机器人专委会、工信部装备数字孪生技术重点实验室、Lumina具身智能社区等权威机构发布了EAI-100（Embodied Artificial Intelligence 100）具身智能年度百项代表性成果与人物榜单，无问芯穹与清华大学等机构联合发布的大规模强化学习框架 RLinf，成功入选十大突破项目。

2026.5

RLinf 被 StanfordVL/BEHAVIOR-1K 官方上游仓库正式集成

由计算机视觉泰斗李飞飞教授发起的 BEHAVIOR 基准虽然为具身长程任务提供了一个“高保真”的练兵场，但同时也使得模型训练“慢”且“贵”。RLinf 对 BEHAVIOR 进行了极致的系统级性能优化，成功将端到端延迟从 1028ms/step 缩短至41ms/step，实现了 25 倍的加速。

2026.5

《RLinf-VLA：面向视觉-语言-动作模型强化学习的统一高效框架》获 CVPR 2026 ScaleBot Workshop 最佳论文

RLinf-VLA是一个面向 VLA 强化学习的统一高效框架，其核心特点可概括为“多、快、好”。“多”在于通过统一接口支持多种 VLA 模型、RL 算法与异构仿真器，提升扩展性与评测一致性；“快”在于针对 RL 流水线设计灵活资源分配机制，并为 GPU 并行仿真提出混合细粒度流水线策略，实现1.61倍—1.88倍的训练加速；“好”在于基于该框架训练的模型在 LIBERO、ManiSkill 和 RoboTwin 等基准上取得约20%-85%的稳定性能提升，并进一步总结出一套有效的训练实践。RLinf-VLA 为具身智能中的 VLA 强化学习研究提供了一个统一、高效且可复现的基础系统。

2026.5

RLinf 正式上线对 DreamZero 训练的深度支持

RLinf不仅完成了对世界动作模型 DreamZero 的支持，还在实现功能适配的基础之上更进一步，依托 RLinf 强大的底层系统优化能力，对 DreamZero 的训练管线进行了深度的重构与加速。相比 DreamZero 官方提供的基线训练脚本，RLinf 成功实现了近 4 倍的训练吞吐加速，且具有更好的收敛效果。这也标志着 RLinf 的技术边界从传统大模型强化学习训练，成功拓展至具身智能、基础模型训练场景，生态覆盖范围进一步拓宽。

2026.5

RLinf 加入蚂蚁开源 Agentic AI Landscape

作为中国开源生态的重要组成部分，蚂蚁开源 Agentic AI Landscape 最新全景图，将生态架构划分为模型层、模型基础设施层、Agent 基础设施层三大层级。RLinf 作为智能体时代强化学习的核心基建，正式入驻模型基础设施层（Model Infra）。

无问芯穹一直致力于面向人工智能最前沿，打造高性能的AI基础设施，坚定地支撑数字世界与物理世界智能体的应用效能突破与持续进化。在 RLinf 项目上，我们持续携手清华大学、北京中关村学院等产学研伙伴，秉持开源共建、开放共享的理念，推动具身智能强化学习技术走向高效化与普惠化。

从开源发布到纳入 PyTorch 官方生态，RLinf 的成长，离不开全球开发者的支持与信赖。未来，我们将持续优化性能、完善功能、提升易用性，与 PyTorch 生态深度协同，与全球开发者共同推动技术的前沿落地。也欢迎全球的社区开发者、研究者与工程实践者共同参与项目建设，一起打造更易用、更强大的具身智能训练基础设施！