Poly.AI是一款基于生成式AI技术的聊天机器人和社交应用,提供高度定制化的聊天体验,适用于语言学习、情感陪伴及社交互动。
Qwen2-VL是一个基于自然语言处理(NLP)技术的语音到文本(Voice-to-Text)和文本到语音(Text-to-Speech, TTS)转换工具,旨在提供高质量的语音转换服务。
D-ID Video Translate是一款先进的视频翻译工具,能够实现视频内容的自动识别和实时翻译,为跨语言交流提供便捷。
Pulse Inspect 是一款由 Pindrop 提供的先进欺诈检测与分析工具,专为金融机构和其他高风险行业设计,用于实时识别并阻止欺诈活动。
Whisper-Medusa:一款基于Whisper模型的优化版语音识别工具,通过多解码头技术显著提升处理速度
CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型,专注于高质量的语音合成,能够生成自然且逼真的语音。该模型支持多种语言、音色和情感控制,为用户提供了丰富的语音生成能力。
Fish Audio 是一个提供文本转语音服务的平台,它允许用户将文本转换为语音,生成音频文件。
ChatTTS 是一个专为对话场景设计的语音生成模型,特别适用于大型语言模型(LLM)助手的对话任务,以及对话式音频和视频介绍等应用。它支持中文和英文,通过大约10万小时的中英文数据训练,展现出高质量和自然的语音合成效果。
字节跳动公司发布的 Seed-TTS是一种高级文本到语音(TTS)模型系列,旨在生成高质量、几乎无法与人类语音区分的语音。
必剪 Studio 是一款数字分身工具,支持形象驱动和音色定制。用户可以定制专属数字分身,用于配音、口播等场景。产品背景为解决用户在音频制作中个性化需求的问题,定位于提供便捷的数字分身创作工具。
Poly.AI是一款基于生成式AI技术的聊天机器人和社交应用,提供高度定制化的聊天体验,适用于语言学习、情感陪伴及社交互动。