
新VISIONXL
VISION XL,一款专注于视频质量修复与增强的全新工具,VISION XL利用潜在扩散模型来解决高清视频的逆问题,能够在资源要求较低的环境下提供出色的修复与超分辨率能力。
EchoMimic,一个基于音频驱动的肖像动画生成工具,通过可编辑的特征点条件生成逼真、自然的动画,用户可以根据自己的需求调整动画细节。
EchoMimic是一个蚂蚁集团支付宝基于音频驱动的肖像动画生成工具,通过可编辑的特征点条件生成逼真、自然的动画,用户可以根据自己的需求调整动画细节,可用于虚拟主播、视频编辑等,效果比SadTalker、MuseTalk好,表情更丰富动作更顺畅。
EchoMimic可以根据人像面部特征和音频来帮人物对口型,结合面部标志点和音频内容生成较为稳定、自然的视频。
EchoMimic功能:
EchoMimic应用:
ComfyUI EchoMimic:https://github.com/smthemex/ComfyUI_EchoMimic
EchoMimic项目:https://badtobest.github.io/echomimic.html
EchoMimic Github:https://github.com/BadToBest/EchoMimic
EchoMimic模型:https://huggingface.co/BadToBest/EchoMimic
EchoMimic 由蚂蚁集团支付宝终端技术部开发的音频输入驱动创建逼真肖像动画的技术。它使用可编辑的地标调节来实现逼真的面部动作和表情,从而实现高度可定制且外观自然的动画。