MagicAvatar：多模式头像生成和动画

AI开源项目 AI视频工具

MagicAvatar是一个多模式框架，能够将各种输入模式（文本、视频和音频）转换为运动信号，随后生成动画。

链接直达手机查看

MagicAvatar是一个多模式框架，能够将各种输入模式（文本、视频和音频）转换为运动信号，随后生成动画。

相关导航

Phi-3-vision-128k-instruct

Phi-3-vision-128k-instruct是Phi-3家族中的第一个多模态模型，拥有4.2B参数，支持128K的上下文长度。该模型结合了语言和视觉处理能力，能够在多种设备上高效地处理和响应图像及文本数据。

Microsoft GraphRAG

GraphRAG，这是一种基于图的RAG（检索增强生成）技术。GraphRAG旨在通过构建知识图谱来增强大模型在搜索、问答、摘要和推理等方面的能力。

Vidu

Vidu是一款由生数科技联合清华大学研发的视频生成大模型，它在AI视频生成领域具有突破性进展，能够生成长达16秒的视频片段，并且具有接近国际先进水平的多镜头语言、时间和空间一致性、物理规律模拟等能力。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.sitemap.