AI大模型 | 网址分类目录 | 六点半AI导航

AI大模型

Fireworks f1：复合AI系统在复杂推理领域的突破

一款专门用于复杂推理的复合AI模型，它通过在推理层交织多个开放模型，实现了与许多封闭前沿模型相匹配甚至超越的推理能力。

AI试衣技术Fashion-VDM

一款基于视频扩散模型（VDM）的虚拟试穿技术，它能够结合给定的服装图像和人物视频，生成人物穿着该服装的高质量试穿视频。

AI换头技术CHANGER

CHANGER是一种新型头部融合管道，旨在为数字内容创作提供高保真的头部合成解决方案，特别适用于视觉效果(VFX)、数字人物创建和虚拟头像等领域。

Meissonic 图像生成模型

Meissonic是一款由阿里巴巴集团、Skywork AI及多所高校共同研发的颠覆性图像生成模型，它基于掩蔽图像建模技术，能够生成高质量、高分辨率的图像。

AlphaFold3：革命性的AI蛋白质结构预测工具

AlphaFold3是由谷歌DeepMind团队开发的AI模型，能够预测蛋白质、核酸（DNA和RNA）、小分子、离子及修饰残基等生物分子的三维结构。

通义千问开源Qwen2.5-Coder全系列

Qwen2.5-Coder是通义千问团队开源的一系列AI编程模型，旨在提升编程效率和性能，支持多种编程语言和代码相关任务。

字节跳动X-Portrait2肖像动画技术

一项由字节跳动和清华大学联合开发的肖像动画技术，它能够将静态肖像图像和驱动表演视频结合起来，生成具有高度表现力和真实感的角色动画和视频。

FLUX1.1 Pro Ultra 超清AI图像生成模型

FLUX1.1Pro 迎来重大更新，推出全新版本 FLUX1.1Pro Ultra，支持高达4兆像素的分辨率，生成速度大幅提升，每张图片仅需约10秒完成。

FLUX.1-dev LoRA 服装生成器

FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术，为用户带来前所未有的时尚设计体验，让设计小白也能秒出服装效果图。

Meta MobileLLM 模型

Meta MobileLLM是Meta（前Facebook）推出的专为移动设备设计和优化的大型语言模型，旨在解决云计算成本上升和延迟问题，使其非常适合在资源受限的设备上运行。

Toy Box Flux：基于AI的3D渲染图像生成工具

Toy Box Flux 是一个利用AI生成图像训练的3D渲染模型，结合了3D LoRA模型和Coloring Book Flux LoRA的权重，形成了独特的风格，特别适合生成具有特定风格的玩具设计图像。

Sana：高效高分辨率图像合成工具

Sana 是一个文本到图像的框架，能够高效生成高达4096×4096分辨率的图像。它以极快的速度合成高分辨率、高质量的图像，并保持强文本图像对齐，可部署在笔记本电脑GPU上。

Llama-3.1-Nemotron-70B-Instruct-HF：NVIDIA推出的大型语言模型

NVIDIA推出的一款大型语言模型，它基于70亿参数的Nematron模型，经过特定指令训练，以提高其在自然语言处理任务中的性能和准确性。

零一万物 Yi-Lightning

Yi-Lightning是零一万物公司最新发布的高性能AI模型，以其卓越的推理速度和生成质量在国际权威盲测榜单LMSYS上取得世界第六、中国第一的排名。

中国移动九天人工智能平台

九天人工智能平台提供人工智能算力、算法、数据，汇聚优秀AI能力，打造从智算基础设施、核心算法能力到智能化应用的全栈人工智能服务，全面支持自智网络等多样化运营商智慧运营需求，为工业、医疗、政务、教育、金融等行业客户构建创新解决方案。

Pyramid-Flow：快手和北大联手开源的视频生成模型

一款由快手与北京大学联合研发并开源的视频生成模型。该模型利用深度学习技术，能够实现高质量的视频生成和处理，为用户提供了一种创新的视频内容创作工具。

Hugging Face OpenAI-Gradio AI构建网页应用工具

该工具让开发者可以在几分钟内启动AI应用，无需庞大团队和复杂的技术基础。对于企业而言，这意味着能够快速推出AI项目，提升创新能力，加速技术转化。

Apple Depth Pro AI 模型

苹果最新推出的 AI 模型 Depth Pro 在深度估计领域取得重大突破，能快速生成高分辨率的3D深度图，无需相机元数据。该模型工作速度快，能捕捉微小细节，提供绝对深度估计，且开源共享。

GS-VTON 3D虚拟试衣间

一种3D虚拟试衣技术，它通过使用高斯散射（3DGS）作为3D表示，实现了从2D虚拟试衣模型到3D空间的知识转移，同时提高了跨视图的一致性。

西湖星辰Westlake-Omni

Westlake-Omni是一个开源的中文情感语音交互大语言模型，采用离散表示实现语音与文本模态的统一处理，支持低延迟生成和高质量的中文情感语音交互。

Hugging Face Chat macOS

HuggingFace公司最新推出的HuggingChat原生macOS客户端为macOS用户带来了无缝且直观的高级AI对话体验，支持本地使用语言模型，并集成了Markdown、网页浏览、代码语法高亮等实用功能。用户可以通过简单的安装步骤快速启动应用，随时享受强大的AI聊天能力。

Deepgram 语音 AI

一个提供语音到文本、文本到语音以及语言理解 API 的语音 AI 平台。它被全球顶尖企业、对话式 AI 领导者和初创公司所信赖，适用于医疗转录到自主代理等多种场景。

由Kyutai实验室精心研发的全双工语音对话系统，它通过结合先进的文本语言模型、神经音频编解码器和多流音频语言模型，实现了更自然、更流畅的人机对话体验。

1 2 3 4 … 7