
GO-1大模型简介
GO-1是什么?
Genie Operator-1(GO-1)是智元启元大模型是智元机器人于2025年3月10日发布的中国首个通用具身基座模型。GO-1模型开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,由多模态大模型(VLM)和混合专家(MoE)组成。

技术架构
- ViLLA架构:VLM借助海量互联网图文数据,获得通用场景感知和语言理解能力;MoE中的Latent Planner(隐式规划器)通过跨本体和人类操作视频数据,获得通用的动作理解能力;Action Expert(动作专家)则通过百万真机数据,实现精细的动作执行。
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解。
- 小样本快速泛化:能够在极少数据甚至零样本的情况下快速适应新场景和任务,降低了具身智能的门槛。
- 跨本体应用:支持部署到不同机器人本体,实现快速适配和高效落地。
- 持续进化:通过数据回流系统,从实际执行中不断学习和进化。
主要特点
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解,更好地为人类服务。
- 小样本快速泛化:具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛和后训练成本。
- 一脑多形:作为通用机器人策略模型,GO-1能够在不同机器人形态之间迁移,快速适配到不同本体,实现群体升智。
- 持续进化:搭配智元的数据回流系统,GO-1可以从实际执行遇到的问题数据中持续进化学习,越用越聪明。
实验表现
在五种不同复杂度任务上测试GO-1,相比已有的最优模型,GO-1的平均成功率提高了32%。其中,在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)任务中表现尤为突出。
应用前景
家庭场景
- 家务劳动:GO-1可以执行家务清洁、物品整理、厨房任务等,例如倒水、烤吐司、整理房间等。
- 智能助手:通过自然语言交互,帮助家庭成员完成日常任务,如拿取物品、开关电器等。
商业场景
- 零售服务:在零售店中,GO-1可以根据顾客需求提供个性化服务,如物品上架、货物盘点、顾客引导等。
- 餐饮服务:在餐厅中,机器人可以完成送餐、清理桌面、补充饮料等任务。
工业场景
- 物流与分拣:模拟工业仓库与生产线环境,执行物料分拣、包装打包、物流搬运等任务。
- 生产辅助:在生产线上协助完成一些重复性或精细操作任务,如安装、检测等。
办公场景
- 文件管理:帮助整理文件、递送物品,提升办公效率。
- 会议辅助:在会议中协助拿取物品、记录信息等。
其他潜在场景
- 教育与培训:作为教学工具,帮助学生理解机器人操作和编程。
- 医疗辅助:在医院或康复中心协助完成一些简单任务,如搬运物品、辅助康复训练。
智元启元大模型GO-1项目官网:https://agibot-world.com/blog/go1
GO-1论文:https://agibot-world.com/blog/agibot_go1.pdf
数据统计
数据评估
关于GO-1大模型特别声明
本站土豆丝提供的GO-1大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月14日 下午10:46收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

澜舟智会,AI智能会议助手,智能分析用户上传的会议音频和视频,对关键信息进行快速的理解、查找和导航定位。

TheB.AI
TheB.AI,一个一体化人工智能平台,通过易于使用的界面或统一的API接口,提供从语言到图像处理的各种尖端模型,可通过用户友好的界面或统一的 API 进行访问。

Openai
Openai,ChatGPT,美国OpenAI研发的聊天机器人程序 ,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
文心百中
文心百中,一款基于百度文心大模型推出的创新搜索产品,文心百中通过极简的框架设计和新一代语义向量搜索模式,实现了搜索效果与效率的双重突破,为企业和开发者提供了更加高效和便捷的搜索解决方案。
甲骨文AI协同平台-殷契文渊
甲骨文AI协同平台-殷契文渊,腾讯公司推出的一个专门用于甲骨文研究的AI工具平台。名为“殷契文渊”,在2024年5月28日正式上线。

华为盘古AI大模型
华为盘古AI大模型,华为的盘古ai大模型是华为云推出的一项人工智能技术。该大模型包含了多个领域的大型模型,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、预测大模型和科学计算大模型。
MathGPT
MathGPT,MathGPT,是国内首个专为数学打造的大模型。仅需要通过文字或图片上传数学题,即可得到对话式的解答反馈。另外,你也可以通过「随机来一题」的选项,随机生成数学题目并由系统给出解答。

美图AI视觉大模型
美图AI视觉大模型,奇想智能MiracleVision大模型汇聚顶尖技术,专业人才和行业资源,依托美图视觉实验室的强大AI技术能力,通过美学升级锻造调优实现更懂美学的AI视觉大模型。
暂无评论...
