小 | 中 | 大 |
2025-03-10 15:45 来源:证券日报网
本报讯 (记者王镜茹 见习记者刘晓一)3月10日,上海智元新创技术有限公司(以下简称“智元机器人”)发布国内首个通用具身基座模型——智元启元大模型(Genie Operator—1,以下简称“GO—1”)。 智元机器人相关负责人表示,GO—1开创性地提出了Vision—Language—Latent—Action(ViLLA)架构,该架构由VLM(多模态大模型)+MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。三者环环相扣,实现了通过人类视频学习的能力,完成了小样本快速泛化,降低了具身智能门槛,并成功被部署到公司的多款机器人本体。GO-1可以持续进化,将具身智能推上新台阶。 (编辑 张明富) |