
GO-1大模型简介
GO-1是什么?
Genie Operator-1(GO-1)是智元启元大模型是智元机器人于2025年3月10日发布的中国首个通用具身基座模型。GO-1模型开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,由多模态大模型(VLM)和混合专家(MoE)组成。

技术架构
- ViLLA架构:VLM借助海量互联网图文数据,获得通用场景感知和语言理解能力;MoE中的Latent Planner(隐式规划器)通过跨本体和人类操作视频数据,获得通用的动作理解能力;Action Expert(动作专家)则通过百万真机数据,实现精细的动作执行。
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解。
- 小样本快速泛化:能够在极少数据甚至零样本的情况下快速适应新场景和任务,降低了具身智能的门槛。
- 跨本体应用:支持部署到不同机器人本体,实现快速适配和高效落地。
- 持续进化:通过数据回流系统,从实际执行中不断学习和进化。
主要特点
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解,更好地为人类服务。
- 小样本快速泛化:具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛和后训练成本。
- 一脑多形:作为通用机器人策略模型,GO-1能够在不同机器人形态之间迁移,快速适配到不同本体,实现群体升智。
- 持续进化:搭配智元的数据回流系统,GO-1可以从实际执行遇到的问题数据中持续进化学习,越用越聪明。
实验表现
在五种不同复杂度任务上测试GO-1,相比已有的最优模型,GO-1的平均成功率提高了32%。其中,在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)任务中表现尤为突出。
应用前景
家庭场景
- 家务劳动:GO-1可以执行家务清洁、物品整理、厨房任务等,例如倒水、烤吐司、整理房间等。
- 智能助手:通过自然语言交互,帮助家庭成员完成日常任务,如拿取物品、开关电器等。
商业场景
- 零售服务:在零售店中,GO-1可以根据顾客需求提供个性化服务,如物品上架、货物盘点、顾客引导等。
- 餐饮服务:在餐厅中,机器人可以完成送餐、清理桌面、补充饮料等任务。
工业场景
- 物流与分拣:模拟工业仓库与生产线环境,执行物料分拣、包装打包、物流搬运等任务。
- 生产辅助:在生产线上协助完成一些重复性或精细操作任务,如安装、检测等。
办公场景
- 文件管理:帮助整理文件、递送物品,提升办公效率。
- 会议辅助:在会议中协助拿取物品、记录信息等。
其他潜在场景
- 教育与培训:作为教学工具,帮助学生理解机器人操作和编程。
- 医疗辅助:在医院或康复中心协助完成一些简单任务,如搬运物品、辅助康复训练。
智元启元大模型GO-1项目官网:https://agibot-world.com/blog/go1
GO-1论文:https://agibot-world.com/blog/agibot_go1.pdf
数据统计
数据评估
关于GO-1大模型特别声明
本站土豆丝提供的GO-1大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月14日 下午10:46收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

PixelDance,字节跳动研发的一种视频生成模型,PixelDance通过结合文本指导和首尾帧图片指导的方式,能够生成具有复杂场景与动作的视频。

CogVideo
CogVideo,目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。
飞桨|AIStudio
飞桨 | AI Studio,飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

MoonShotAI
MoonShot AI,中文名:月之暗面,一家专注于大模型技术的创业公司,月之暗面致力于将能源转化为智能,通过产品与用户共创智能,实现普惠AI。

MotionGen
MotionGen,元象推出基于物理的3D动作生成模型,MotionGen通过创新性融合大模型、物理仿真和强化学习等前沿算法,用户只需输入简单的文本指令,即可快速生成逼真、流畅且复杂的3D动作。
联想百应智能体
更懂中小企业的智能体,百应智能体专注于提供基于自然语言交互的多场景企业服务,以及个性化智能体,且具备场景智能分发与调度能力,助力中小企业轻松实现智能化转型。

AnakinAI
Anakin AI,一站式无代码AI应用平台,Anakin AI包括内容创作、文案、问答、图像生成、视频生成、语音生成、智能 Agent、自动化工作流、自定义等AI 应用,定制你专属的 AI应用工作台。

火山方舟大模型
火山方舟大模型,字节跳动旗下的火山引擎推出的大模型服务平台,主要面向企业提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。
暂无评论...
