
GO-1大模型简介
GO-1是什么?
Genie Operator-1(GO-1)是智元启元大模型是智元机器人于2025年3月10日发布的中国首个通用具身基座模型。GO-1模型开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,由多模态大模型(VLM)和混合专家(MoE)组成。

技术架构
- ViLLA架构:VLM借助海量互联网图文数据,获得通用场景感知和语言理解能力;MoE中的Latent Planner(隐式规划器)通过跨本体和人类操作视频数据,获得通用的动作理解能力;Action Expert(动作专家)则通过百万真机数据,实现精细的动作执行。
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解。
- 小样本快速泛化:能够在极少数据甚至零样本的情况下快速适应新场景和任务,降低了具身智能的门槛。
- 跨本体应用:支持部署到不同机器人本体,实现快速适配和高效落地。
- 持续进化:通过数据回流系统,从实际执行中不断学习和进化。
主要特点
- 人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解,更好地为人类服务。
- 小样本快速泛化:具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛和后训练成本。
- 一脑多形:作为通用机器人策略模型,GO-1能够在不同机器人形态之间迁移,快速适配到不同本体,实现群体升智。
- 持续进化:搭配智元的数据回流系统,GO-1可以从实际执行遇到的问题数据中持续进化学习,越用越聪明。
实验表现
在五种不同复杂度任务上测试GO-1,相比已有的最优模型,GO-1的平均成功率提高了32%。其中,在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)任务中表现尤为突出。
应用前景
家庭场景
- 家务劳动:GO-1可以执行家务清洁、物品整理、厨房任务等,例如倒水、烤吐司、整理房间等。
- 智能助手:通过自然语言交互,帮助家庭成员完成日常任务,如拿取物品、开关电器等。
商业场景
- 零售服务:在零售店中,GO-1可以根据顾客需求提供个性化服务,如物品上架、货物盘点、顾客引导等。
- 餐饮服务:在餐厅中,机器人可以完成送餐、清理桌面、补充饮料等任务。
工业场景
- 物流与分拣:模拟工业仓库与生产线环境,执行物料分拣、包装打包、物流搬运等任务。
- 生产辅助:在生产线上协助完成一些重复性或精细操作任务,如安装、检测等。
办公场景
- 文件管理:帮助整理文件、递送物品,提升办公效率。
- 会议辅助:在会议中协助拿取物品、记录信息等。
其他潜在场景
- 教育与培训:作为教学工具,帮助学生理解机器人操作和编程。
- 医疗辅助:在医院或康复中心协助完成一些简单任务,如搬运物品、辅助康复训练。
智元启元大模型GO-1项目官网:https://agibot-world.com/blog/go1
GO-1论文:https://agibot-world.com/blog/agibot_go1.pdf
数据统计
数据评估
关于GO-1大模型特别声明
本站土豆丝提供的GO-1大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月14日 下午10:46收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

千影QianYing,巨人网络发布的有声游戏生成大模型,主要包括游戏视频生成大模型YingGame和视频配音大模型YingSound。

GoogleBard
Google Bard,Google 推出的一款对话式AI工具,Bard 可以帮助您完成各种任务,例如编写、编码、调试和解释代码。您还可以与 Bard 进行有趣的对话,探索它的创造力和幽默感。
序列猴子开放平台
序列猴子开放平台,序列猴子开放平台,领先市场的语言驱动深度学习大模型能够快速、准确地处理语言表达,支持多种交互方式。可以快速生成悦耳语音、高质量文本、与人机互动,满足各类语音、文本和对话需求。

Dpdf
Dpdf ,好用的在线 PDF工具网站,提供免费的在线PDF工具,包括合并、拆分、转换PDF等功能。

快手可图
快手可图,快手可图大模型(Kolors)是快手公司自主研发的一款AI图像生成工具。支持文生图和图生图两大功能并提供了20多种AI图像玩法,Kolors可用于AI创作图像以及AI形象定制。

心辰Lingo语音大模型
心辰Lingo语音大模型,实现了从语音输入到语音输出的全程无缝对接,心辰Lingo能够直接理解语音内容,捕捉语气、节奏和情绪,并以同样丰富的语音形式进行回复。
AutoGLM沉思
AutoGLM沉思,智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产品,它能探究开放式问题,并根据结果执行操作的自主智能体。 它能够模拟人类的思维过程,完成从数据检索、分析到生成报告。

Story321
Story321 ,一个可生成故事、图像、音乐、播客、视频和动漫的全能AI平台,Story321能帮用户做出故事、图像、音乐、播客、视频和动漫等内容。
暂无评论...
