1 月 1 日消息,智元具身研究中心今日宣布推出第二代一体化具身大小脑系统 GenieReasoner。
针对 VLA 模型中语义推理与动作控制的模态对齐难题,智元具身研究中心提出了一种支持统一离散化预训练的模型架构,并通过流匹配(Flow-matching)缓解了传统离散 Tokenizer 的动作精度瓶颈。
同时具身研究中心开源了 ERIQ-聚焦于真机操控全流程的具身推理评测基准,用以解耦量化评估 VLA 中具身大脑不同维度的推理能力。
实验表明,GenieReasoner 不仅在推理能力上达到 SOTA,更在跨本体真机实验中展现了 SOTA 级别的泛化性。进一步的对比实验证实:VLA 模型更强的具身推理能力可显著提升其端到端动作执行表现,从而验证了 ERIQ 的评估价值。
下一步,智元具身研究中心将从“逻辑深度”与“执行精度”两个维度持续推进,并致力于实现具身大小脑、世界模型(World Model)与真机强化学习(Real-world RL)的闭环协同。
智元具身研究中心已将 ERIQ Benchmark 完全开源,附项目地址如下:
https://geniereasoner.github.io/GenieReasoner/