零一万物大模型开放平台是一个提供多种AI模型服务的平台,旨在满足不同用户对文本生成、推理、图片理解等多样化需求。
GPT-4o是OpenAI发布的一款全新AI模型,其中的“o”代表“omni”,意为全面、全能。GPT-4o的发布标志着向更自然的人机交互迈出重要一步,它能够接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。
NVIDIA ChatRTX是NVIDIA推出的一款基于GPT(Generative Pre-trained Transformer)的聊天机器人示范程序。它结合了检索增强生成(Retrieval-Augmented Generation, RAG)技术与TensorRT-LLM软件,并通过RTX加速,为用户提供快速且准确的回答。
VILA是由Efficient-Large-Model组织在GitHub上开源的一个视觉语言模型(Visual Language Model)。它是英伟达发布的一个模型,通过大规模的图像-文本数据进行预训练,从而实现了视频理解和多图像理解能力。
DeepSeek-V2 基于 2 千亿 MoE 模型底座,领先性能,超低价格,越级场景体验,已在对话官网和 API 全面上线。
Refuel.ai是一个专注于数据标注和清洗的开源平台,其核心产品RefuelLLM-2是一款先进的语言模型,旨在提高数据处理的效率和准确性。
Maimo 是一个旨在提高信息处理效率的智能平台,它通过自动化技术帮助用户快速从各种内容源中提取关键信息。
NeMo-Aligner 是由英伟达研究人员开源的安全对齐框架,旨在提升大型语言模型的安全性和稳定性。
ComfyUI-IC-Light是ComfyUI的原生插件,用于实现IC-Light技术。该技术允许用户通过一系列工作流程生成背景和重新打光,从而增强图像的视觉效果。它的重要性在于能够提供更自然和逼真的图像处理结果,尤其适用于需要高级图像编辑功能的用户。
Siri-Ultra是一个基于云的智能助手,可以在Cloudflare Workers上运行,并且可以与任何大型语言模型(LLM)配合使用。它利用了LLaMA 3模型,并且通过自定义函数调用来获取天气数据和在线搜索。这个项目允许用户通过Apple Shortcuts来使用Siri,从而消除了对专用硬件设备的需求。
Phi-3 WebGPU是一款结合了Transformers.js和onnxruntime-web的AI模型,它利用WebGPU加速技术,提供超过20t/s的处理速度,并且所有数据处理在本地完成,确保用户隐私安全。尽管在中文回答上存在一些不足,但其在浏览器中提供的AI模型运行能力仍然值得关注。
Pixian.AI 是一个在线图片背景移除服务,它利用人工智能技术帮助用户从图片中移除背景。
一个本地且开源的CharacterAI替代工具,提供了一个用户友好的界面,允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色,让每个虚拟角色都有自己的独特个性和语言风格。
Stability AI 推出了 Stable Artisan,这是一款支持使用 Developer Platform API 创建高质量媒体的 AI 工具,包含 Stable Diffusion 3 等高级模型,能够生成和编辑图像,并支持多种图像处理功能,以及用文字或图像创作精细视频。
X.ai 博客是一个发布关于人工智能(AI)模型、工具和研究的平台。
通义千问2.5是阿里云推出的一款先进的中文大模型,它代表了当前中文AI领域的顶尖技术水平。
Stability AI是一个人工智能平台,旨在通过为人们建立一个由人们开发的AI基础,激发人类的潜能。
虎博科技是一家专注NLP(自然语言处理)的公司,致力于大数据AI(人工智能)和语义分析识别数据挖掘等领域
InternLM 是在过万亿 token 数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。
元乘象Chatimg 多模态对话大模型 主打“看懂世界”,擅长“以图生文”
云雀(Skylark)是字节跳动研发的一款语言模型,它通过自然语言交互,能够高效完成互动对话、信息获取、协助创作等任务。用户可以通过简单的API调用,快速搭建基于大模型的AI应用。
云知声AI开放平台的山海大模型是一款基于通用大模型,并结合行业特色数据与知识进行深度学习的人工智能服务产品。该模型以模型即服务(MaaS)为基础设施,旨在为各行各业提供数字专家级的智能服务。
云从科技的从容大模型是云从科技推出的一款人工智能模型,旨在提供高效的机器学习服务。
“兆言”已经在智能客服、数字政务、IT智能运维、高校智慧招生、企业智能营销等多个领域和场景中成功落地应用,展现了其广泛的应用潜力和实用价值。
SuperCLUE是一个专注于人工智能模型性能评估和排名的平台。它提供了一个总排行榜,展示了不同机构开发的AI模型在特定测试中的得分和排名情况。
5118 是一个提供营销大数据服务的平台,它集成了多种站长工具,帮助用户进行SEO优化、关键词挖掘、内容智能改写等。该平台利用大数据分析,为用户提供互联网上热点趋势和用户行为的洞察。
。该方法通过多模态注意力机制,将视频和文本特征进行融合,并利用多语言翻译模型将不同语言的文本特征进行转换,从而实现跨语言的视频-文本检索。实验结果表明,该方法在多语言视频-文本检索任务上取得了较好的效果。
通过共同开发开放模型、数据集、系统和评估工具,使每个人都可以访问大型模型。
MuseV是一个基于扩散模型的虚拟人视频生成框架,它能够以无限长度和高保真度生成满足视觉条件的视频。
SadTalker:学习现实的3D运动系数风格化音频驱动的单图像说话的脸动画。
MiraData 是一个具有长时长和结构化字幕 的大规模视频数据集。它专为长视频生成任务而设计。
通义实验室研发的 AI 模型 ——EMO 正式上线通义 App,并开放给所有用户免费使用。借助这一功能,用户可以在歌曲、热梗、表情包中任选一款模板,然后通过上传一张肖像照片就能让 EMO 合成演戏唱歌视频。
VideoCrafter2 是由腾讯优图实验室开源的视频生成工具,基于 Stable Diffusion 模型,支持文本转视频、图像转视频、视频编辑等功能。
Open-Sora 是由北京大学元组智能研究组开发的开源视频生成工具,基于 Stable Diffusion 模型,支持文本转视频、图像转视频、视频编辑等功能。
Palantir是一家数据分析公司,提供企业级软件平台,用于数据集成、分析和可视化。其产品之一是AIP(Analytic Integration Platform),这是一个分析集成平台,旨在帮助组织更有效地处理和分析大量数据。
Qwen1.5-110B采用了与其他Qwen1.5模型相同的Transformer解码器架构,并引入了分组查询注意力(GQA)机制,在模型推理时更加高效。该模型支持32K tokens的上下文长度,同时仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
Qwen1.5-110B-Chat模型是一个基于大规模数据训练的人工智能对话系统,它能够理解并生成自然语言,进行有效的对话交互。
一种新的视频超分辨率(VSR)模型,旨在生成具有高频细节和时间一致性的视频。
专注于提供企业级IT服务,特别是在云计算和大数据时代的智能IT运维产品和解决方案。
智拓是拓尔思公司推出的基于深度学习的语义智能技术平台,围绕自然语言处理(NLP)、知识图谱、图像检索等核心技术,提供全栈AI服务能力,旨在帮助用户快速构建AI技术能力,提升行业服务效果。
国产自主可控,生态开放,垂直领域知识开源增强,具备多参数、多领域、多语言、多技能的核心能力,旨在通过大模型技术赋能各行各业,推动政企数智化转型。
来自Meta的研究人员推出了SceneScript,只需要70M参数,仅采用编码器解码器架构,就能将真实世界的场景转化为几何表示。
腾讯电子签是腾讯官方出品的电子合同工具,提供极简且高效的合同管理服务,一站式完成合同拟定、合同签署和签署后管理,满足全行业、多场景电子合同签署和管理需求
MiniMax是一家提供智能AI服务的公司,旨在通过先进的AI技术助力企业和开发者快速搭建AI应用。
零一万物是一家专注于AI 2.0大模型技术和应用的全球公司,致力于通过先进的人工智能技术推动行业发展。
生成式人工智能驱动型助手,专为针对您的业务定制的工作而设计
Amazon Titan 是亚马逊公司于 2023 年 10 月发布的一款基于云计算的图形数据库服务。它能够存储和处理海量规模的图数据,并提供高效的查询和分析功能。
亚马逊云科技的大模型托管平台Amazon Bedrock集成了全球7家头部模型公司的20多种优选大模型。 简单理解,Bedrock就像模型的超市。
华为HarmonyOS是一个面向智能设备的操作系统,旨在为不同设备提供统一的智能化、互联与协同能力。
AI 编码辅助工具,旨在通过提供上下文感知的代码补全和聊天辅助来提升开发者的工作效率。它集成到了流行的集成开发环境(IDE)中,并原生构建在 GitHub 平台上。
上海AI Lab和香港中文大学等研究机构联合开发的多模态大模型InternLM-XComposer2-4KHD(简称IXC2-4KHD),该模型能够自动分析PDF、网页、海报、Excel图表内容。
Snowflake Arctic 是一个创新的平台,旨在为语言模型提供一个开放且高效的基础。这是一个基于云的解决方案,使组织能够高效地存储、处理和分析大量的非结构化文本数据。
Samsung Galaxy AI是三星为其Galaxy系列手机开发的一套人工智能解决方案,旨在为用户提供更高效、便捷的智能体验。
Phi-3-mini-128k-instruct是微软发布的轻量级语言模型Phi-3系列中的最小版本。它拥有38亿参数,相较于大型模型,其在保持较高性能的同时,显著降低了计算资源的占用。该模型经过预训练,能够理解并处理自然语言文本,具备语言理解、生成和推理的能力。
OpenELM是由苹果公司开发的预训练模型,基于Transformer架构。该模型旨在实现高效且灵活的文本表示学习,能够捕捉文本中的语义和上下文信息。通过在大规模语料库上进行预训练,OpenELM能够生成文本的向量表示,为各种自然语言处理任务(如文本分类、情感分析、问答等)提供强大的基础。
出门问问(Chumen Wenwen)是一家中国的人工智能公司,提供包括智能手表、智能耳机等在内的智能硬件产品,同时也提供基于人工智能技术的软件服务。
语言驱动的深度学习大模型能够快速、准确地处理语言表达,支持多种交互方式,可以快速生成悦耳的语音、高质量的文本,以及与人机进行互动,以满足各种语音、文本和对话需求。
阿里云百炼是阿里云提供的一个基于大模型的服务平台,旨在为企业和开发者提供一站式的大模型服务,包括全流程应用工具和全链路训练工具。
达摩院是阿里巴巴集团旗下的科研机构,专注于基础科学、创新性技术和应用技术的研究与探索,以科技驱动未来发展。
李未可科技的WAKE-AI大模型是专为未来 AI+终端定向优化研发的多模态 AI 大模型平台。
零一万物大模型开放平台是一个提供多种AI模型服务的平台,旨在满足不同用户对文本生成、推理、图片理解等多样化需求。