jtysdty

帅气的我简直无法用语言描述!
CialloTTS

CialloTTS

Ciallo TTS,一款免费的在线文本转语音工具,支持超过300种不同语言和口音的声音,可调节语速和语调,提供即时试听和下载功能。
01480
声网Agora

声网Agora

声网Agora,专注于实时音视频技术的云服务公司,全球实时互动云服务开创者和引领者。开发者只需简单调用声网API,即可在应用内构建多种实时音视频互动场景。
0870
星火纪要

星火纪要

星火纪要,科大讯飞推出的一款基于先进语音识别技术和大模型的会议交流总结和分析平台,具有高效转录、智能总结、翻译、数据分析等功能。
0970
星声AI播客

星声AI播客

星声AI播客,专注于AI播客领域的AI播客生成器,面向广大播客爱好者和音频内容分享使用者。
01220
YuE

YuE

YuE,一个全新的多模态音乐开源模型,YuE具有从歌词生成高质量音乐的能力。能够生成长达5分钟的完整音乐作品,包括人声和伴奏,支持多种语言生成。
01550
kokoroTTS

kokoroTTS

kokoroTTS,一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS拥有8200万参数,基于StyleTTS 2架构,提供高质量、自然的语音合成,适用于有声书、播客等。
01220
PengChengStarling

PengChengStarling

PengChengStarling,鹏城实验室开源的一款多语言语音识别系统开发工具包,PengChengStarling可以在统一的框架内处理多种语言语音输入,支持实时语音识别,边说边识别。
01050
FUZZ

FUZZ

FUZZ,由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。
01130
FishAudio

FishAudio

FishAudio,一个在线AI文本转语音合成配音声音克隆平台,以其自然、富有表现力的语音生成技术,为用户带来了前所未有的音频体验。
0890
Spark-TTS

Spark-TTS

Spark-TTS,SparkAudio团队开发的文本转语音(TTS)系统,基于 Qwen2.5 构建, 能够生成自然、高质量的语音。并支持零样本语音克隆和多语言合成。
01130
NotaGen

NotaGen

NotaGen,由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款 AI 音乐生成模型,专注于生成高质量的古典乐谱。
0920
NoizAI

NoizAI

Noiz AI,一款专注于语音合成与克隆的AI工具,依托自研的超大语音模型,能够快速生成与真人无异的声音模型,广泛应用于文本转语音、视频配音和多语言视频翻译等场景。
01950