360人工智能研究院 - 多模态大模型技术研发与创新

Multimodal Understanding

多模态理解

细粒度图文对齐检索

Fine-Grained

新一代的图文跨模态VLM模型，解决CLIP及其衍生模型图文理解和对齐粒度粗糙造成的词袋效应和局部图像特征对齐失准的问题，超越SigLip2和MetaCLIP2，中英双语支持。

高精度多模态RAG

Multimodal RAG

面向高精度图文检索场景的多模态embedding模型，支持图+文+视频的全模态、任意模态混合的多模态向量化，解决企业内部文档理解、检索、知识问答依赖于OCR+纯文本，无法有效解析多模态信息的瓶颈问题。

多模态VLA

Agent-Ready

面向Web/Computer自动化，核心解决基座模型无法在B端场景泛化的问题，支持企业内部Web业务系统的模型驱动自动化操作，不依赖于不稳定的DOM标识，实现真正的「越用越好用」。

Multimodal Generation

多模态生成

高可控图像生成

Controllable Image

面向专业生产力场景，支持复杂多主体目标的布局可控，精准实现「指哪画哪」；支持复杂场景元素的分图层生成，满足专业设计生产中对元素布局的精细控制要求。

高可控图像编辑

Layer Editing

面向专业生产力场景，支持对已有图片的图层分解，分层编辑不再是难题；支持对图片指定目标元素提取图层，摆脱「盲盒抽卡」；满足专业设计生产中对图片精细再编辑的需求。

高可控视频生成与编辑

Video Creation

面向专业生产力场景，支持对复杂多主体目标的精确镜头内位置控制生成；支持对已有视频的多元素分层分解，满足专业设计生产中对视频精细再编辑的需求。

Tech Blog

技术Blog

查看全部

研究院两项多模态生成成果入选CVPR 2026，以技术创新赋能业务差异化发展

360人工智能研究院在多模态生成方向的两项成果，被计算机视觉与模式识别国际顶会CVPR 2026接收！作为与ICCV、ECCV齐名的计算机视觉全球顶尖学术会议，CVPR今年收到16092篇投稿，最终接收4090篇，录用率仅25%，竞争一如既往地激烈。

360 AI Research · 2026-04-07

为专业妆容迁移而生：FLUX-Makeup，无需人脸控制模块的高一致性妆容迁移方法

FLUX-Makeup 的核心价值在于：在不引入任何额外人脸控制模块的前提下，仅通过“源图 + 参考图”这一最自然的输入形式，实现高保真、强一致性、鲁棒的妆容迁移。这一点对技术向实际产品转化尤为重要。目前论文、代码、模型以及对应的comfyUI工作流均已开源。

冷大炜、刘山源 · 2026-01-27

以多模态技术破局，让大模型从炫技走向落地 —— 360人工智能研究院年度技术总结

本文将带您走进AI研究院的2025，一起回顾研究院2025年的代表性工作。这些创新成果已成功在集团内外部多个关键业务场景中实现深度落地应用，有效驱动了业务智能化升级。更多关于研究成果的详细解读与技术细节，敬请访问360人工智能研究院官网(research.360.cn)。

360 AI Research · 2025-12-30

致谢与应用反馈：FG-CLIP 2 在智能养老监护课程项目中的应用

近日，我们收到了一封来上海交通大学学生的感谢信。该学生是自动化与感知学院的大一学生，利用研究院多模态模型FG-CLIP 2在细粒度识别和多语言支持方面的强大能力，开发了一套“基于VLM的支持语义客制化的智能养老摄像头”系统。特此来信对我们的开源工作表示感谢！

360 AI Research · 2025-12-10

FG-CLIP 2: 为细粒度跨模态理解而生的下一代VLM，8大类29项任务双语性能全球第一

FG-CLIP 2从训练范式、目标函数到数据生态对上一代模型进行了全面革新，从源头解决了CLIP的近视和粗粒度词袋效应，补齐了业界亟需的中文能力支持，在8大类多达29项的benchmark评测上，FG-CLIP 2超越包括SigLIP 2 和 MetaCLIP 2在内的最新强力基线，双语性能达到全球第一。

冷大炜、谢春宇、王斌 · 2025-11-06

突破多模态检索壁垒，RzenEmbed重点发力企业文档智能

360人工智能研究院的多模态理解团队，基于前期在跨模态理解与多模态大模型领域的长期积累，倾力推出RzenEmbed 多模态 Embedding 模型，旨在为下一代RAG系统提供更精准、更全面的语义检索能力。

冷大炜，简伟健 · 2025-09-24

MiniCPM-o.cpp：让多模态大模型真正跑在端侧

在大模型技术快速演进的今天，越来越多的开发者希望把多模态能力（文本、语音、图像、视频）带到端侧设备上。然而，推理开销、硬件限制、实时性要求，常常成为落地应用的最大现实障碍。 360人工智能研究院冷大炜博士认为：“大模型时代，推理优化应该放到与模型训练同等重要的地位。” 带着这一思考，我们正式推出 MiniCPM-o.cpp ——360人工智能研究院在模型推理优化方向上的首个开源工作。

冷大炜、吕森 · 2025-09-08