
Phenaki简介
Phenaki 是什么?
Phenaki 是 Google Research 的一个项目,其目标是从开放域的文本描述中合成逼真的视频。可以直接从文本中生成长达数分钟的视频。
通过Phenaki,您还可以从静止图像和提示生成视频。所提出的视频编码器-解码器在时空质量和每个视频的令牌数量方面优于文献中当前使用的所有每帧基线。
为了从文本生成视频标记,Phenaki使用以预先计算的文本标记为条件的双向掩码转换器。生成的视频令牌随后被去令牌化以创建实际视频。
Phenaki 是视频合成领域的一个突破,因为它可以处理开放域和时间变量提示,这与以前受数据可用性和计算成本限制的方法不同。Phenaki 还可以从静止图像和提示生成视频,例如放大猫的眼睛或让它打哈欠。Phenaki 有许多潜在的应用,例如娱乐、教育、讲故事和艺术。
Phenaki能做什么?
这段视频火爆外网,谷歌把AI视频造假搞得太真太简单了
Phenaki 优点:
它可以生成可变长度和质量的视频,最长可达两分钟
它可以处理开放域和时间变量提示,例如故事或描述
它利用大量的图像-文本对语料库和少量的视频-文本示例来泛化视频数据集之外
数据统计
数据评估
关于Phenaki特别声明
本站土豆丝提供的Phenaki都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月12日 下午11:53收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

BibiGPT,BibiGPT,提取B站视频的字幕,并通过理解和分析这些字幕生成视频内容的概括性总结,这种方法可以帮助用户快速了解视频的主题和关键点。

Hedra
Hedra,通过上传一任意人物照片和语音就能生成个人会说话和唱歌的动态视频神器,同时保持唇形和表情、姿态和语音内容相匹配。

GlatoAI
GlatoAI,只需一个简单的网页链接,GlatoAI将你的产品,网页,文章转变为令人瞩目的短视频,不仅融入栩栩如生的虚拟人物讲解,还配备专业的语音配音与精准字幕。

X-MeAI
X-Me AI,X-Me是一款AI头像视频生成工具,其特色在于无需复杂的训练过程即可快速创建定制化的头像。

Moonvalley
Moonvalley,Moonvalley是一款功能强大的文本到视频生成 AI 模型,可让您创建令人惊叹的高清 + 视频和动画,涵盖各种不同的风格 - 从超现实视频到动漫,再到介于两者之间的所有内容。

即梦AI
即梦AI,剪映Dreamina的中文品牌名称,是一个集成了AI作图和AI视频生成功能的平台。

D-ID
D-ID,D-ID带有由 AI 提供支持的图像生成能讲话的数字人视频,导入文本或上传自已的音频就可以说话。

FlawlessAI
Flawless AI,Flawless AI 是世界上第一个为电影剪辑师和后期制作专家开发的专业级、可授权的人工智能工具,专注于通过最先进的对话和表演修改功能来增强故事讲述。
暂无评论...