9月23日消息,据媒体报道,智元机器人今日宣布,通用具身基座大模型GO-1(Genie Operator-1)已在GitHub正式开源,成为全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型。
这一突破性架构通过引入隐式动作标记,有效弥合了图像-文本输入与机器人动作执行之间的语义鸿沟,显著提升了机器人对复杂任务的理解与执行能力。 向全球开发者免费开放,降低具身智能技术门槛。
该模型基于多模态理解、隐式规划和动作生成三层协同设计,支持多视角视觉、力觉信号与语言指令的融合处理。
同时,智元推出Genie Studio一站式开发平台,覆盖数据采集、模型训练到真机部署全流程,助力开发者快速实现具身智能应用落地。GO-1已在多类机器人本体上完成验证,展现出优秀的可移植性与仿真性能。
值得一提的是,智元机器人在不久前正式发起Genie Trailblazer全球招募计划,向全球的具身智能研究团队发出邀请,聚焦通用具身智能模型、具身世界模型、高级遥操作三大核心探索方向。
文章来源:
快科技
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!