
Cradle简介
Cradle是什么?
Cradle是一个通用计算机控制(General Computer Control, GCC)的多模态ai框架,由昆仑万维、北京智源人工智能研究院等机构联合推出。它通过屏幕截图作为输入,键盘和鼠标操作作为输出,使AI代理能够像人类一样直接控制计算机完成各种任务。Cradle具备信息收集、自我反思、任务推断、技能策划、动作规划和记忆管理等核心功能,能够广泛应用于游戏、日常软件操作和专业软件操作等场景。

Cradle核心功能
- 信息收集:从屏幕图像和音频中提取多模态信息,用于决策。
- 自我反思:评估先前行动的成功与否,分析失败原因,以指导后续行动。
- 任务推断:根据当前环境和历史信息,推断并选择最佳的下一个任务。
- 技能策划:生成和更新与给定任务相关的技能,以适应不同的计算机操作需求。
- 动作规划:为键盘和鼠标控制生成具体操作,将策略转化为可执行的命令。
- 记忆与知识管理:拥有长期和短期记忆系统,存储过去的经验和技能,在需要时进行检索和应用。
Cradle应用场景
- 游戏环境:如《荒野大镖客2》《星露谷物语》《城市天际线》等。
- 日常软件操作:如浏览器、邮件客户端、办公软件等。
- 专业软件操作:如图形设计或视频编辑软件。
Cradle技术原理
- 多模态输入处理:接收并处理屏幕图像和音频的多模态输入,模拟人类感知方式理解计算机界面和环境。
- 信息提取与理解:利用大型多模态模型(如GPT-4V)识别图像中的视觉元素、文本信息和音频中的指令或反馈。
- 自我反思机制:通过反思模块评估之前执行动作是否成功,并分析失败原因。
- 任务推断与规划:确定当前的优先任务,并制定出新动作完成任务。
- 技能生成与更新:根据当前任务生成新的技能或更新现有技能。

Cradle特点
- 通用性:不依赖任何内部API,能够与任意开闭源软件交互。
- 强大的推理能力:基于大型语言模型,能够进行复杂任务规划和执行。
- 自我改进:通过自我反思机制不断优化性能。
- 技能积累:可以逐步积累和复用各种操作技能。
Cradle已成功应用于《荒野大镖客2》、《星露谷物语》、《城市:天际线》等游戏,以及Chrome浏览器、Outlook邮箱等软件。
Cradle相关链接
Cradle项目主页:https://baai-agents.github.io/Cradle/
Cradle代码仓库:https://github.com/BAAI-Agents/Cradle
Cradle论文:https://arxiv.org/abs/2403.03186
数据统计
数据评估
关于Cradle特别声明
本站土豆丝提供的Cradle都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月14日 下午11:49收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

酷特喵,一个专注于发现和分享最新、最酷、最有趣的互联网产品工具的网站。用户可以在酷特喵进行投稿和发现新产品。

出海去
出海去,一个专为独立创客、一人公司和小微团队设计的新型社区孵化器,出海去目的在于帮助中国AI/SaaS创业团队和独立开发者走向国际市场。

FlutterFlowAI
FlutterFlow AI,一款AI辅助低代码应用开发工具,FlutterFlow AI利用人工智能技术简化了应用开发的流程,使开发者能够更快速、更高效地构建应用程序。

AICompanionApp
AI Companion App,AI Companion App,一键创建和训练属于你的AI伴侣/女朋友。

LiveSketch
LiveSketch,LiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。

SharlyAI
Sharly AI,Sharly AI 是一个基于AI技术,可让您上传任何文档并之聊天的文档聊天机器人。您可以要求 Sharly AI 为您总结、突出显示或分析文档。

ImageAI
Image AI,专注于图片AI工具,用于处理和生成图片,提供换脸、人脸修复、百变人脸、图片识别、文本生成图片、图片去背景、图片去水印、图片去文字、图片高清放大、图片重新创作、人脸变贴纸等AI图片工具。

DecoHack周刊
DecoHack周刊,一个专为独立开发者和创造者设计的灵感周刊,目的帮助独立开发者发现新产品方向。DecoHack涵盖产品设计、开发、运营与推广等实用知识,提供新闻洞察、行业分析、文章推荐和工具分享等内容。
暂无评论...
