
新AIJSON
AI JSON,字节的一款借助AI模型生成结构化JSON输出的工具,支持DeepSeek等与OpenAI兼容的API接口。
Hibiki是Kyutai Labs开发的支持法语和英语的高保真实时语音翻译模型,可以保留原声特点并进行实时翻译,边听边翻译,像同声传译一样实时输出,同时生成语音和文字翻译。
Hibiki功能特征:
Hibiki技术:
Hibiki是一种通过精确的同步算法,能迅速地将一种语言的语音翻译成另一种语言的语音或文本的解码模型。这一技术的核心在于它多流语言模型,能够在语音识别和翻译过程中,实时生成音频和文本输出。还有,Hibiki还支持声音特征迁移,可以在翻译过程中保留说话者的语调和情感,使翻译的效果更自然和真实。
不过,由于需要进行语音数据的传输和云计算处理,它对网络的要求较高。如果网络信号不好,可能会出现识别错误或者翻译延迟的现象。
Hibiki应用场景:
GitHub: https://github.com/kyutai-labs/hibiki
HuggingFace: https://huggingface.co/collections/kyutai/hibiki-fr-en-67a48835a3d50ee55d37c2b5
arXiv论文: https://arxiv.org/pdf/2502.03382