Seamless--Meta推出的实时语音翻译模型

AI 翻译 AI开源项目

一体式大规模多语言和多模式机器翻译模型，可为近 100 种语言的语音和文本提供高质量翻译。

链接直达手机查看

SeamlessM4T 是我们基础的一体式大规模多语言和多模式机器翻译模型，可为近 100 种语言的语音和文本提供高质量翻译。

SeamlessM4T 模型支持以下任务：

语音到语音翻译 (S2ST)
语音到文本翻译 (S2TT)
文本到语音翻译 (T2ST)
文本到文本翻译 (T2TT)
自动语音识别 (ASR)
我们正在发布 SemalessM4T v2，这是采用我们新颖的 UnitY2 架构的更新版本。与 SeamlessM4T v1 相比，该新模型在质量以及语音生成任务中的推理延迟方面有所改进。

要了解有关 SeamlessM4T 模型集合、每个模型所使用的方法、其语言覆盖范围及其性能的更多信息，请访问 SeamlessM4T 自述文件或模型卡

SeamlessExpressive

SeamlessExpressive 是一种语音到语音翻译模型，可捕捉韵律中某些未充分探索的方面，例如语速和停顿，同时保留语音风格和高内容翻译质量。

要了解有关 SeamlessExpressive 模型的更多信息，请访问 SeamlessExpressive 自述文件或模型卡

SeamlessStreaming

SeamlessStreaming 是一种流式翻译模型。该模型支持语音作为输入模态和语音/文本作为输出模态。

SeamlessStreaming 模型支持以下任务：

语音到语音翻译 (S2ST)
语音到文本翻译 (S2TT)
自动语音识别 (ASR)
要了解有关 SeamlessStreaming 模型的更多信息，请访问 SeamlessStreaming 自述文件或模型卡

安装

先决条件之一是 fairseq2，它具有仅适用于 Linux x84-86 和 Apple-silicon Mac 计算机的预构建软件包。此外，它还依赖于 libsndfile，而您的计算机上可能没有安装该文件。如果您遇到任何安装问题，请参阅其自述文件以获取进一步说明。

pip install .
转录推理音频以计算指标使用自动安装的 Whisper。Whisper 反过来需要在您的系统上安装命令行工具 ffmpeg ，大多数包管理器都可以提供该工具。

项目链接:https://github.com/facebookresearch/seamless_communication
网站/论文: https://ai.meta.com/research/seamless-communication/
HF: https://huggingface.co/collections/facebook/seamless-communication-6568d486ef451c6ba62c7724

相关导航

QuillBot

QuillBot是由人工智能驱动的英语/德语/中文写作润色修改工具，帮助学生和专业人士改写、编辑和改变他们文本的语气，以提高文章的清晰度和可读性。

无偏水印（Unbiased Watermark）

该研究介绍了针对大型语言模型的无偏水印技术，表明可以添加水印而不影响生成文本的质量。研究提供了一个无偏水印的理论框架，确保输出不受水印的影响。这种方法为负责任的人工智能开发讨论提供了一个追踪和归因模型输出的方法，而不会牺牲质量。

英伟达视觉语言模型 VILA

VILA是由Efficient-Large-Model组织在GitHub上开源的一个视觉语言模型（Visual Language Model）。它是英伟达发布的一个模型，通过大规模的图像-文本数据进行预训练，从而实现了视频理解和多图像理解能力。

Hpcaitech Open-Sora

Open-Sora是一个由hpcaitech开源的类Sora架构视频生成模型，它基于Diffusion Transformer（DiT）架构，旨在通过文本描述生成高质量的视频内容。该项目涵盖了整个视频生成模型的训练过程，包括数据处理、训练细节和模型检查点，供对文生视频模型感兴趣的人免费学习和使用。

腾讯混元大模型开源项目

Hunyuan-DiT 是腾讯开源的一款强大的多分辨率扩散变换器（Diffusion Transformer），具备精细的中文理解能力。该模型旨在探索文本到图像的生成，支持中英文双语输入，并能够进行多轮对话式图像生成。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.sitemap.