MagicAvatar是一个多模式框架,能够将各种输入模式(文本、视频和音频)转换为运动信号,随后生成动画。
Phi-3-vision-128k-instruct是Phi-3家族中的第一个多模态模型,拥有4.2B参数,支持128K的上下文长度。该模型结合了语言和视觉处理能力,能够在多种设备上高效地处理和响应图像及文本数据。
GraphRAG,这是一种基于图的RAG(检索增强生成)技术。GraphRAG旨在通过构建知识图谱来增强大模型在搜索、问答、摘要和推理等方面的能力。
Veo 可以捕捉不同的视觉和电影风格,包括风景和延时镜头,并对已生成的镜头进行编辑和调整。
Glif是一个全面的无代码AI沙盒平台,支持构建AI工作流程、应用程序、聊天机器人及更多内容,提供多样化的创意与实用工具。
Vidu是一款由生数科技联合清华大学研发的视频生成大模型,它在AI视频生成领域具有突破性进展,能够生成长达16秒的视频片段,并且具有接近国际先进水平的多镜头语言、时间和空间一致性、物理规律模拟等能力。
Pixels Dance 是一个在线工具,用于创建和分享CSS动画。
Phi-3-vision-128k-instruct是Phi-3家族中的第一个多模态模型,拥有4.2B参数,支持128K的上下文长度。该模型结合了语言和视觉处理能力,能够在多种设备上高效地处理和响应图像及文本数据。