
新Magi
Magi,为您喜欢的漫画生成文字记录,将文本与说话者相匹配,从而使读者能够通过阅读文本来完整地体验漫画故事。
Step-Audio,由阶跃星辰与吉利汽车集团联合研发的一个开源的集成语音识别、语义理解、对话生成、语音克隆、音频编辑和语音合成等功能的语音交互模型。
Step-Audio,作为业内首款产品级开源语音交互模型,具备根据场景需求生成多样化语音表达的能力,涵盖情绪、方言、语种、歌声以及个性化风格,且交互自然流畅。在汉语水平考试六级评测中,Step-Audio表现卓越,被誉为最懂中文的开源模型。此ai模型由阶跃星辰与吉利汽车集团联合研发,并于2025年2月18日正式开源。
Step-Audio功能特征:
Step-Audio应用场景:
Step-Audio技术特征:
Step-Audio使用方法:
Step-Audio获取方式
GitHub:https://github.com/stepfun-ai/Step-Audio
ModelScope:[点击访问]
技术报告:[点击访问]
支持PAI Model Gallery一键部署[点击访问]