
新EmotePortraitAlive
Emote Portrait Alive,阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。
Cradle是一个通用计算机控制(General Computer Control, GCC)的多模态ai框架,由昆仑万维、北京智源人工智能研究院等机构联合推出。它通过屏幕截图作为输入,键盘和鼠标操作作为输出,使AI代理能够像人类一样直接控制计算机完成各种任务。Cradle具备信息收集、自我反思、任务推断、技能策划、动作规划和记忆管理等核心功能,能够广泛应用于游戏、日常软件操作和专业软件操作等场景。
Cradle已成功应用于《荒野大镖客2》、《星露谷物语》、《城市:天际线》等游戏,以及Chrome浏览器、Outlook邮箱等软件。
Cradle项目主页:https://baai-agents.github.io/Cradle/
Cradle代码仓库:https://github.com/BAAI-Agents/Cradle
Cradle论文:https://arxiv.org/abs/2403.03186