
GO-1大模型简介
GO-1是什么?
Genie Operator-1(GO-1)是智元启元大模型是智元机器人于2025年3月10日发布的中国首个通用具身基座模型。GO-1模型开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,由多模态大模型(VLM)和混合专家(MoE)组成。

技术架构
- ViLLA架构:VLM借助海量互联网图文数据,获得通用场景感知和语言理解能力;MoE中的Latent Planner(隐式规划器)通过跨本体和人类操作视频数据,获得通用的动作理解能力;Action Expert(动作专家)则通过百万真机数据,实现精细的动作执行。
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解。
- 小样本快速泛化:能够在极少数据甚至零样本的情况下快速适应新场景和任务,降低了具身智能的门槛。
- 跨本体应用:支持部署到不同机器人本体,实现快速适配和高效落地。
- 持续进化:通过数据回流系统,从实际执行中不断学习和进化。
主要特点
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解,更好地为人类服务。
- 小样本快速泛化:具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛和后训练成本。
- 一脑多形:作为通用机器人策略模型,GO-1能够在不同机器人形态之间迁移,快速适配到不同本体,实现群体升智。
- 持续进化:搭配智元的数据回流系统,GO-1可以从实际执行遇到的问题数据中持续进化学习,越用越聪明。
实验表现
在五种不同复杂度任务上测试GO-1,相比已有的最优模型,GO-1的平均成功率提高了32%。其中,在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)任务中表现尤为突出。
应用前景
家庭场景
- 家务劳动:GO-1可以执行家务清洁、物品整理、厨房任务等,例如倒水、烤吐司、整理房间等。
- 智能助手:通过自然语言交互,帮助家庭成员完成日常任务,如拿取物品、开关电器等。
商业场景
- 零售服务:在零售店中,GO-1可以根据顾客需求提供个性化服务,如物品上架、货物盘点、顾客引导等。
- 餐饮服务:在餐厅中,机器人可以完成送餐、清理桌面、补充饮料等任务。
工业场景
- 物流与分拣:模拟工业仓库与生产线环境,执行物料分拣、包装打包、物流搬运等任务。
- 生产辅助:在生产线上协助完成一些重复性或精细操作任务,如安装、检测等。
办公场景
- 文件管理:帮助整理文件、递送物品,提升办公效率。
- 会议辅助:在会议中协助拿取物品、记录信息等。
其他潜在场景
- 教育与培训:作为教学工具,帮助学生理解机器人操作和编程。
- 医疗辅助:在医院或康复中心协助完成一些简单任务,如搬运物品、辅助康复训练。
智元启元大模型GO-1项目官网:https://agibot-world.com/blog/go1
GO-1论文:https://agibot-world.com/blog/agibot_go1.pdf
数据统计
数据评估
关于GO-1大模型特别声明
本站土豆丝提供的GO-1大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月14日 下午10:46收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

LMArena AI,前身为lmsys.org,是一个专注于众包AI基准测试的开放平台,用户可以在此平台上免费与AI聊天并进行投票,比较和测试不同的AI聊天机器人。

OpenRouter
OpenRouter,一项提供对各种 AI 模型的访问的服务,包括 GPT-4、Claude 2、Google PaLM 等开源模型。OpenRouter使用MoE架构,提供对聊天完成、问答、摘要和推理等任务的模型的访问。

书生通用大模型
书生通用大模型,上海人工智能实验室发布的大型预训练模型。

VIMI大模型
VIMI大模型,商汤科技推出的全球首个可控人物视频生成AIGC产品,VIMI模型基于商汤的日日新大模型技术,能够通过单张照片生成与目标动作一致的人物视频,实现精准的表情和肢体控制。
飞桨|AIStudio
飞桨 | AI Studio,飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

百度心响
一款由百度推出的手机端超级智能体应用,它以“AI任务完成引擎”为核心,通过自然语言交互帮助用户实现复杂任务的拆解、动态执行和可视化结果交付。

ManusAI
ManusAI,全球首款通用型AI智能体,ManusAI通过自主任务执行、动态任务拆解、多模态交互和跨平台执行等能力,帮助用户高效完成复杂任务。

澜舟智会
澜舟智会,AI智能会议助手,智能分析用户上传的会议音频和视频,对关键信息进行快速的理解、查找和导航定位。
暂无评论...
