文字转语音（配音播报） | 网址分类目录 | 六点半AI导航

文字转语音（配音播报）

谷歌零样本跨语言语音传输（Zero-Shot Voice Transfer, VT）

一种先进的文本到语音（TTS）技术，能够在没有特定说话者样本的情况下，恢复或模拟说话者的声音。

Deepgram 语音 AI

一个提供语音到文本、文本到语音以及语言理解 API 的语音 AI 平台。它被全球顶尖企业、对话式 AI 领导者和初创公司所信赖，适用于医疗转录到自主代理等多种场景。

Qwen2-VL是一个基于自然语言处理（NLP）技术的语音到文本（Voice-to-Text）和文本到语音（Text-to-Speech, TTS）转换工具，旨在提供高质量的语音转换服务。

阿里CosyVoice语音生成模型

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型，专注于高质量的语音合成，能够生成自然且逼真的语音。该模型支持多种语言、音色和情感控制，为用户提供了丰富的语音生成能力。

ChatTTS 文本转语音

ChatTTS 是一个专为对话场景设计的语音生成模型，特别适用于大型语言模型（LLM）助手的对话任务，以及对话式音频和视频介绍等应用。它支持中文和英文，通过大约10万小时的中英文数据训练，展现出高质量和自然的语音合成效果。

必剪Studio

必剪 Studio 是一款数字分身工具，支持形象驱动和音色定制。用户可以定制专属数字分身，用于配音、口播等场景。产品背景为解决用户在音频制作中个性化需求的问题，定位于提供便捷的数字分身创作工具。

百宝音配音神器

一个专业的在线配音服务网站，提供多种语言的配音服务，适用于个人和企业用户。手机用户可在微信小程序搜索百宝音小程序使用。

CeVIO 是由日本 Yamaha 公司开发的一款语音合成软件，可以将文字转换为语音，并支持多种语言和音色选择。它主要面向音乐制作、视频配音、游戏开发等领域，为用户提供便捷的语音合成解决方案。

HitPaw 是一个提供强大视频、音频和图片解决方案的平台，由一系列多媒体工具组成，旨在帮助用户在各种媒体内容上进行创作、编辑和转换。

Voice Engine

OpenAI推出了一种新的人工智能工具Voice Engine，通过输入文本和15秒音频样本，Voice Engine便可以生成一个与音频中说话者非常相似的自然语音，而生成的自然语音具有丰富的情感和逼真的声音。【需要科学上网】

悦音配音

悦音配音是一款集成了人工智能技术的配音工具，它能够将文本转换为自然流畅的语音，广泛应用于各种场景中的语音合成需求。该工具通过深度学习算法，模拟人类的发音习惯和语调变化，生成接近真人发音的语音。

MotionSound

Motion Sound是一款基于人工智能技术的音频处理工具，旨在为用户提供高效、便捷的音频编辑和处理体验。该工具通过先进的AI算法，能够自动识别和分析音频内容，从而为用户提供一系列的音频处理功能。

商汤如影

让每个人都可以轻松创作令人惊艳的数字人短视频。通过数字人形象定制、声音克隆技术，能够生成出比拟真实人物的外貌、表情、动作和声音，并且通过AI文案功能快速生成企业宣传、网络营销文案，使创作效率得到更进一步的提升。

魔音工坊（配音软件）

魔音工坊，先进的配音工具和高效多人协同创作工具，可以在线将文字转成语音的智能配音产品，可提供不同性别、不同口音的真人声音,在你输入文字后直接配音。

Fliki（带教程）

Fliki 是一款文本转视频和文本转语音创建器，可帮助您在几分钟内创建高质量的音频和视频内容。【需要科学上网】【使用教程点击下方链接】

Adobe Podcast

AI驱动的音频工具可提升您的声音,使用 Adobe Podcast创建听起来很专业的高质量播客和配音。Adobe Podcast AI 可帮助您在无需专业设备的情况下获得专业的声音。