
Phenaki简介
Phenaki 是什么?
Phenaki 是 Google Research 的一个项目,其目标是从开放域的文本描述中合成逼真的视频。可以直接从文本中生成长达数分钟的视频。
通过Phenaki,您还可以从静止图像和提示生成视频。所提出的视频编码器-解码器在时空质量和每个视频的令牌数量方面优于文献中当前使用的所有每帧基线。
为了从文本生成视频标记,Phenaki使用以预先计算的文本标记为条件的双向掩码转换器。生成的视频令牌随后被去令牌化以创建实际视频。

Phenaki 是视频合成领域的一个突破,因为它可以处理开放域和时间变量提示,这与以前受数据可用性和计算成本限制的方法不同。Phenaki 还可以从静止图像和提示生成视频,例如放大猫的眼睛或让它打哈欠。Phenaki 有许多潜在的应用,例如娱乐、教育、讲故事和艺术。
Phenaki能做什么?
这段视频火爆外网,谷歌把AI视频造假搞得太真太简单了
Phenaki 优点:
它可以生成可变长度和质量的视频,最长可达两分钟
它可以处理开放域和时间变量提示,例如故事或描述
它利用大量的图像-文本对语料库和少量的视频-文本示例来泛化视频数据集之外
数据统计
数据评估
关于Phenaki特别声明
本站土豆丝提供的Phenaki都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月12日 下午11:53收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

百度推出的一款AI数字人社交App,度豆的AI数字人不仅能够理解并回应用户的文字、语音和图片信息,能让你跟数字人聊天就像跟真人一样自然

StereoCrafter
StereoCrafter,一个由腾讯AI实验室开发的能将普通的2D视频转换为沉浸式的立体3D视频的开源框架。

VidgoAI
Vidgo AI,一个多合一AI图像、音乐和视频生成器,能将文字、图片等素材变成图像、音乐和视频等多媒体内容。提供AI 图像生成、视频生成和编辑三大核心功能。

KataListAi
KataList Ai,一个利用AI将剧本转化为视觉故事的工具。通过KataList Ai可以生成创意提案、故事板和视频,并提供音乐和旁白等一站式服务。

EmuVideo
Emu Video,Meta开发的文本到视频生成模型,Emu Video使用扩散模型根据文本提示创建视频,首先生成图像,然后根据文本和生成的图像创建视频。
ToonCrafter
ToonCrafter,一个AI驱动的能够将静态卡通漫画图像转化为流畅、生动的动画工具。通过AI算法,ToonCrafter可以自动生成关键帧之间的过渡帧,保持原始艺术风格的一致性,并提供像素级的细节提取和无缝过渡动画。

MirageStudio
Mirage Studio,一款基于自研全模态基础模型的AI视频生成工具,可根据音频、文本、图像等输入自动生成具有真实情感和动作的虚拟角色视频。

通义万相AI生视频
通义万相AI生视频,通义万相全新发布自研AI视频生成大模型,具备强大的画面视觉动态生成能力,擅长概念理解与组合生成,多种艺术风格轻松驾驭,优化中式元素表现,带来影视级画面质感,同时支持多语言与可变分辨率生成。
暂无评论...
