
Vidu简介
Vidu是生数科技与清华大学合作开发的Vidu视频大模型,凭借其创新的U-ViT架构,成为国内首个达到Sora级别的视频大模型。该模型不仅在技术上具有全球首创性,而且通过开源的UniDiffuser模型,展示了其大规模可扩展性的验证。
Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

Vidu功能特征:
- 模型结构:Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。
- 视频生成能力:Vidu 能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。
- 3D生成:基于简单文字输入,生成高质量、多样性和创造性的图像 图像生成 API调用 在线体验 基于文本或图像输入,生成个性化3D模型 | 基于已有3D模型,对贴图等进行自动化编辑。
- 实际应用演示:在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。
- 高级功能:Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。
北京生数科技有限公司(简称“生数科技”)成立于2023年3月,核心团队成员来自清华大学人工智能研究院,此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才,是全球范围内领先的深度生成式算法研究团队,拥有扩散概率模型底层创新研发能力。公司致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式ai在艺术设计、游戏制作、影视后期、内容社交等场景的商业赋能,通过AI提升人类的创造力和生产力。
数据统计
数据评估
关于Vidu特别声明
本站土豆丝提供的Vidu都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月12日 下午11:26收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

FunFun Art,一个利用人工智能技术将用户的创意概念转化为视觉上吸引人的图片和视频。用户只需在平台上输入描述性关键词,就能获得多种艺术风格的生成l图像和视频作品。

RewinAI
Rewin AI,Rewin AI通过在几秒钟内生成病毒式营销的 YouTube 和 TikTok 脚本来提供帮助。Rewin AI可以将自己喜欢的视频内容变成独特、引人入胜的脚本,从而将自己转变为内容创作强手。

微软VASA-1
微软VASA-1,微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。
Runwayml
Runwayml,Runwayml,一款AI视频编辑工具,它的功能又不仅仅是编辑,更重要的是支持文字转视频,只需输入一句话就可以拍大片。
ViduAiHugging
Vidu Ai Hugging,将您的照片生成温馨的拥抱视频,Vidu Ai Hugging为静态图像注入生命力,创造出逼真且充满情感的动画。体验AI拥抱视频的魔力——制作简单,分享有趣,独具个性。

寻光
寻光,寻光是阿里达摩院推出的一站式AI视频创作平台,寻光目标是让视频生成编辑过程像操作PPT一样简单。
光映AI视频创作平台
光映AI视频创作平台 ,一款 AI驱动的视频创作平台,可快速将文字、图片等内容转化为 TikTok、Instagram 、YouTube 视频与虚拟形象视频,无需视频编辑技能。

Heygen数字人
Heygen数字人,HeyGen是一个AI视频虚拟数字人生成平台,只需输入和点击,就可以把文本转换成发言人视频。可以从100多个AI虚拟数字人中选择,或者创建你自己的虚拟数字人。
暂无评论...
