筛选
服务商
不限字节跳动阿里巴巴GoogleOpenaiDeepseekAnthropic百度Xai腾讯智谱ai月之暗面Minimax商汤百川01-ai科大讯飞华为BigCode阶跃星辰
分类
不限文本生成推理模型图像理解全模态向量模型文本分类语音合成语音识别图片生成视频生成
能力
不限模型精调结构化输出函数调用
上下文长度
不限0-16K16-32K32-128K128-500K500K+
326个模型符合条件

GPT 4.1 Mini
文本生成多语言工具调用
GPT-4.1 mini是OpenAI推出的中小型多模态模型,支持百万token上下文,可处理文本、图像及视频。性能媲美GPT-4o,MMMU测试得分73%超前代,延迟降半、成本减83%,适用于开发者API调用,处理长内容与视觉任务。
Openai
更新时间:
2025-11-11

Gemini 2.0 Flash Lite
文本生成多语言工具调用
Gemini 2.0 Flash Lite 是 Gemini 2.0 系列中速度最快的模型,经过优化以实现更高的成本效益和更低的延迟。它旨在处理高吞吐量的轻量级任务,并支持多模态输入(如图片、文档和音频),具有巨大的输入 token 上限
Google
更新时间:
2025-11-11

Grok 4 Fast
文本生成多语言
Grok 4 Fast是xAI于2025年推出的大语言模型轻量版本,主打高速推理与成本优化。其核心特点包括:每秒75 token生成速度(较标准版快10倍),200万token超长上下文窗口,支持整本书籍或代码库一次性处理;推理成本降低98%,通过优化架构减少40%推理tokens消耗。作为Grok 4系列基础版本,它集成文本/图像输入、实时网络访问(DeepSearch工具)及函数调用能力,面向日常问答、文档处理等轻量化场景,计划逐步替代Grok 3成为免费用户基础服务。该模型在保持多模态能力的同时,以效率优先设计适配普通用户需求。
Xai
更新时间:
2025-11-10

O3 Mini
文本生成多语言工具调用
OpenAI o3-mini是2025年1月推出的小型推理模型,定位STEM领域专业化方案,支持函数调用、结构化输出等高级开发者功能,提供低/中/高推理级别以平衡精度与效率,适用于科学计算、编程开发等场景,兼具低成本与低延迟特性。
Openai
更新时间:
2025-11-08

GPT 5 Codex
文本生成多语言
GPT-5 Codex是OpenAI推出的多模型混合代码生成系统,整合高效基础模型与深度推理模块,通过智能路由动态调度资源。其代码生成能力显著提升,可快速构建复杂前端应用、调试大型代码库,支持单提示生成完整网站和游戏,在设计美学处理上更优。适用于编程开发、应用构建及代码调试场景,免费用户可基础使用,付费版提供更高限额与扩展推理能力。
Openai
更新时间:
2025-11-07

Claude 3 Opus
文本生成多语言工具调用
Claude 3 Opus是Anthropic推出的顶级大模型,属Claude 3系列高端版本,具备多模态能力,支持20万Token上下文窗口。特点为智能水平领先,在MMLU、GPQA等基准测试中表现超同类,能深度理解复杂任务,实现类人交互。适用于任务自动化(API/数据库操作)、研发(药物研发、研究审查)、战略分析(财务趋势预测、图表解读)等场景。
Anthropic
更新时间:
2025-11-04

Gemini 2.0 Flash
文本生成多语言工具调用
Gemini 2.0 Flash是谷歌推出的多模态AI模型,属Gemini 2.0套件子模型。具备文本理解、图像生成与编辑能力,支持100万token上下文窗口,响应速度比1.5 Pro快两倍。适用于广告设计、社交媒体内容创作、教育插图生成等场景,开发者可通过Google AI Studio和Gemini API接入。
Google
更新时间:
2025-10-31

Claude Haiku 4.5
文本生成多语言工具调用
Claude Haiku 4.5是Anthropic推出的小型混合推理AI语言模型,性能接近中型模型Sonnet 4,成本仅为其三分之一,推理速度提升超两倍。具备20万token上下文处理能力,支持多模态提示词,AI安全等级ASL-2。适用于智能客服、编程辅助、对话式助手等实时响应场景,可通过Claude应用、API及主流云平台集成。
Anthropic
更新时间:
2025-10-16

Gemini 2.5 Flash
文本生成多语言工具调用
Gemini 2.5 Flash是谷歌推出的多模态轻量级AI模型,支持文本、图像、音频、视频输入,具备自适应推理能力,令牌使用效率提升20-30%,适用于高吞吐量、低延迟任务,如翻译、分类及多模态交互,面向开发者与企业用户开放。
Google
更新时间:
2025-10-13

Claude Sonnet 4.5
文本生成
Claude Sonnet 4.5是Anthropic于2025年9月发布的中端平衡型AI模型,属Claude系列“中杯”产品,定位性能与成本折中。其编程能力突出,SWE-bench Verified测试得分77.2%,支持连续编程超30小时,可构建生产级应用;兼具高效推理与视觉处理能力,响应速度快、成本适中,适用于软件开发、复杂智能体构建及企业级任务。
Anthropic
更新时间:
2025-09-30

Claude 3 Sonnet
文本生成多语言
Claude 3 Sonnet是Anthropic推出的大语言模型,属Claude 3系列中端型号,平衡能力与速度,适企业级应用。2倍速于前代,高可控性,支持内容生成、分类、数据提取、知识检索等,已在API及Amazon Bedrock上线。
Anthropic
更新时间:
2025-09-29

Gemini 2.5 Flash Lite
文本生成多语言工具调用
Gemini 2.5 Flash-Lite是谷歌推出的轻量级AI推理模型(预览版),主打极速响应与成本优化,为当前速度最快的Gemini模型。支持多模态输入、100万token上下文及谷歌原生工具(如搜索、代码执行),适用于高吞吐量、低延迟场景(如翻译、分类),面向开发者提供API服务。
Google
更新时间:
2025-09-25

Qwen Image Plus
图片生成
最新发布
Qwen-image-plus是阿里云通义千问系列的文生图模型,属Qwen-Image专业版,擅长复杂文本渲染,支持中英双语及多行布局。适用于海报、对联等需精准文字生成场景,成本较基础版低,可通过API调用,兼顾质量与效率。
Alibaba
更新时间:
2025-09-23

Qwen3 Coder Plus
文本生成工具调用
最新发布
Qwen3-Coder-Plus是阿里巴巴通义千问系列的增强型代码生成模型,属480B参数混合专家(MoE)架构,激活参数350亿,具备1M上下文窗口。特点为代码理解与生成能力强,支持多语言及复杂逻辑推理,性能媲美Claude Sonnet,适用于大型项目分析、代码库操作等智能体编程任务。
Alibaba
更新时间:
2025-09-23

Qwen3 Vl Plus
视觉理解工具调用
最新发布
Qwen3-VL-plus是阿里通义千问推出的视觉语言模型增强版,属Qwen3-VL系列,提供Instruct和Thinking版本。特点是小参数量高性能,8B参数性能逼近上一代72B旗舰模型,支持超百万像素分辨率图像,强化细节识别、文字理解及复杂视觉推理。适用于智能客服、图像识别、内容创作、辅助决策等场景。
Alibaba
更新时间:
2025-09-23

Qwen3 Vl 235b A22b Thinking
视觉理解工具调用
最新发布
Qwen3-VL-235B-A22B-Thinking是阿里通义千问Qwen3系列旗舰视觉语言模型,采用MoE架构,2350亿参数。具备GUI级视觉Agent能力,支持32种语言OCR、256K上下文(可拓展至1M),视频理解与多模态推理突出,适用于复杂多模态工作流、长文档检索及智能交互场景。
Alibaba
更新时间:
2025-09-23

Qwen3 Max
文本生成工具调用
最新发布
Qwen3-Max是阿里Qwen3系列最高阶大模型,万亿参数,预训练36T tokens,支持26万+tokens上下文,多语言覆盖,显式推理模式。适用于企业级政策问答、代码审查、数据分析等复杂任务。
Alibaba
更新时间:
2025-09-23

Qianfan Lightning
文本生成中文,英文工具调用
高性价比
Qianfan-Lightning(千帆-极速版/闪电版)是百度智能云千帆大模型平台上推出的一个高性能、超低延迟的模型系列或服务模式。
Baidu
更新时间:
2025-09-23

Wan2.5 I2i Preview
图片生成
最新发布
Wan2.5-i2i-preview 是一款图像生成模型,支持图像编辑功能,属于阿里云图像生成服务中的一员,适用于图像创作与编辑场景。
Alibaba
更新时间:
2025-09-23

Qwen Image Edit
图片生成多语言
最新发布
Qwen-Image-Edit是阿里开源的Omni产品级扩散模型,基于200亿参数Qwen-Image构建,支持语义与外观双重编辑。特点包括精准中英文字编辑(保留字体样式)、SOTA基准性能,可用于图像内容生成、图文结合输出及多模态助手应用。
Alibaba
更新时间:
2025-09-22

Qwen3 Livetranslate Flaltimeash Re 2025 09 22
语音识别多语言
最新发布
Qwen3-LiveTranslate-Flash是阿里通义千问推出的多语言实时音视频同传模型,基于Qwen3-Omni基座,融合多模态数据训练。支持18种语言及方言的离线/实时翻译,3秒低延迟,视觉增强技术提升复杂场景准确性,优于主流模型。适用于国际会议、远程教学、跨国协作等场景。
Alibaba
更新时间:
2025-09-22

Doubao Seed Translation
文本生成
最新发布
Doubao-Seed-Translation是字节跳动火山引擎推出的多语言翻译大模型,基于Transformer架构,支持28种语言互译。具备高准确性(BLEU评分42.5)和流畅度,适用于跨境电商、国际合作、教育学习等通用文本翻译场景。
Bytedance
更新时间:
2025-09-22

Qwen3 Next 80B A3B Instruct
文本生成多语言
最新发布
Qwen3-Next-80B-A3B-Instruct是阿里云通义团队2025年9月推出的指令微调大模型,基于高稀疏度MoE架构,800亿总参数仅激活30亿。采用混合注意力机制与多token预测,训练成本为Qwen3-32B的1/10,32k上下文推理吞吐提升10倍,原生支持262K tokens上下文,可外推至百万级文本处理。适用于长文档理解、法律分析等长上下文场景,已开源并支持主流框架部署。
Alibaba
更新时间:
2025-09-19

Wan2.5 T2i Preview
图片生成
最新发布
wan2.5-t2i-preview是阿里通义万相系列的文生图模型,属多模态生成模型。特点为支持写实场景和摄影风格,注重图像质量与响应速度平衡。适用于通用写实场景及摄影风格图像生成,可在广告、电商等领域应用。
Alibaba
更新时间:
2025-09-19

Wan2.5 T2v Preview
视频生成
最新发布
Wan2.5-t2v-preview是阿里通义推出的多模态生成模型,集成文生/图生视频、文生图及图像编辑功能,支持1080P/24fps输出,实现音画同步,可生成匹配人声、音效和配乐。具备运镜控制、元素一致性优化等特点,应用于广告、影视、教育等领域。
Alibaba
更新时间:
2025-09-19

Wan2.5 I2v Preview
视频生成
最新发布
wan2.5-i2v-preview是阿里通义万相2.5系列的图生视频模型,属多模态生成模型。它采用统一框架,融合文本、图像、视频、音频生成能力,支持1080P高清视频输出,可实现音画同步,能理解运镜语言,保持元素ID一致性,支持音频驱动视频生成,适用于广告、电商、影视、教育等领域的内容创作。
Alibaba
更新时间:
2025-09-19

Qwen3 Omni Flash Realtime
全模态多语言
最新发布
qwen3-omni-flash-realtime是阿里通义千问推出的实时全模态AI模型,支持文本、图像、音视频等多模态处理,具备流式对话、中途打断等实时交互能力,可应用于语音助手、多媒体分析、智能剪辑等场景,支持119种文本语言和20种语音交互。
Alibaba
更新时间:
2025-09-17

Qwen3 Omni 30b A3b Captioner
语音识别
最新发布
Qwen3-Omni-30B-A3B-Captioner是阿里开源的音频精细字幕模型,从Instruct微调而来,音频输入转文本输出,特点是详细且低幻觉的音频描述,适用于音视频内容分析、无障碍服务、智能剪辑等场景。
Alibaba
更新时间:
2025-09-17

Qwen3 Tts Flash Realtime
语音合成多语言
最新发布
Qwen3-TTS-Flash-Realtime是阿里通义推出的实时文本转语音模型,首包延迟97ms,支持17种音色、10种语言及17种方言,语音自然流畅。适用于智能客服、有声读物、AI教师及影视配音等场景。
Alibaba
更新时间:
2025-09-16

Qwen3 Tts Flash
语音合成多语言
最新发布
Qwen3-TTS-Flash是阿里通义推出的文本转语音模型,支持10种语言、17种音色及9种中文方言,可智能调语气,首包延迟97ms,适用于智能客服、有声创作、语音助手等场景。
Alibaba
更新时间:
2025-09-16