AgentCPM-ExploreAgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。
TranslateGemmaTranslateGemma 是 Google 推出的开放式多语言机器翻译模型系列,基于 Gemma 3 架构构建,支持 55 种语言的文本与图像内文字翻译,提供多种参数规模以适应不同部署场景。
FLUX.2 [klein]FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族,支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能,适用于研究、开发和交互式视觉智能应用。
PixVerse R1PixVerse R1 是一种实时世界模型 AI 系统,基于原生多模态基础模型与自回归流式生成机制,实现连续、低延迟的 1080P 视觉流生成,适用于互动媒体、模拟与实时视频生成等场景。
Tago AI-生成带货视频一句话,一张图,生成爆款带货/引流视频!Tago是一款为电商卖家与内容创作者打造的AI视频生成工具。它能将您的产品描述或图片,快速转化为质感媲美实拍、专业且吸引人的带货视频。我们致力于以极低的成本(低于0.3元/条),大幅降低高质量视频的制作门槛,让创意和卖货变得更简单高效。
Evai 建筑大师Evai 建筑大师(OpenEvai)是一个面向建筑师、室内设计师和相关专业用户的云端 AI 设计创作平台,提供 AI 极速渲染、智能三维重构、建筑动态视频生成与自然语言交互设计修改等功能,可将手绘草图、2D 平面图等输入转化为高质量的建筑设计成果。
VoiceSculptorVoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。
UI-TARS DesktopUI-TARS Desktop 是由字节跳动开源的桌面端 GUI Agent 工具,基于 UI-TARS 视觉语言模型(VLM),可通过自然语言控制计算机界面,实现图形界面识别与操作。
松影软著智能助手松影软著智能助手是专业的AI智能软件著作权申报平台,30分钟快速生成申报材料,包含操作手册、代码文档、申请表等完整文档,让软著申报变得简单高效。99.8%一次通过率,10000+软著下证经验。
MAI‑DxOMAI‑DxO 是微软推出的开源级 AI 诊断协调器,通过“医生面板”式多模态推理,在真实流程中对复杂病例自动发问、验血、下结论,以 85 %+ 的准确率和更低检测费用挑战人类医生,迈向医疗超智能。
DAMO GRAPEDAMO GRAPE 是阿里达摩院与浙江癌症医院联合打造的全球首款基于非增强 CT 平扫图像的 AI 胃癌筛查工具,凭借高达 85.1% 的敏感度与 96.8% 的特异性,在早期胃癌检测中显著优于放射科医生,具备大规模筛查潜力。
LingshuLingshu 是阿里巴巴达摩院开源的医疗多模态大模型,支持 12+ 医学影像类型、自然语言问答、报告生成,提供 MedEvalKit 统一评估框架,以超越 GPT-4.1 的表现推动医疗 AI 研究与落地。
元智医疗大模型元智医疗大模型(uAI NEXUS)是联影打造的多模态医疗大模型,覆盖文本、影像、语音、视觉与混合任务,并衍生 10 余款智能体赋能诊断、手术、报告书写与设备管理,是AI工具使用者了解行业创新与落地应用的专业门户。
MeWMMeWM(Medical World Model)是一种最新 AI 医疗决策支持框架,通过视觉–语言策略模型与肿瘤生成模型,模拟治疗后肿瘤演化并帮助优化 TACE 操作,为 AI 工具用户和医疗研究者带来创新辅助工具。
Teamo来自浮点奇迹的 多Agent协作AI生产力平台,通过 A2A+MCP 协议驱动“CEO Agent”统一调度专业 Agent,实现科研、营销、内容创作等复杂任务自动拆解和协同执行,提升知识工作效率与输出质量。
AgentCPM-ExploreAgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。
DiscoGoogle 最新推出的实验性 AI 浏览体验,该工具由Gemini 3 大模型驱动,通过自动将浏览器标签页转化为交互式 Web 应用(称为 GenTabs),重新定义浏览器与 AI 协作体验。本文面向 AI 工具使用者详细介绍其核心功能、使用方式、优势与常见问题。
Gemini Deep ResearchGemini Deep Research 是由 Google 发布的高级研究型 AI 代理,通过 Gemini API(Interactions API)支持复杂多步骤研究任务自动规划、搜索、阅读与综合,能够生成详尽的报告并融合 Web 与自有数据资源,是构建自动化智能研究、市场分析、竞争情报与长流程信息整合的利器。
爱派 (AiPy)爱派 (AiPy) 是一款国内开源、支持本地部署的智能 Agent 工具,基于 “Python Use” 理念,让 AI 不仅能“思考”,还能够“动手”——自动生成并执行 Python 代码、操作本地文件与应用。本文面向 AI 工具使用者,深入解析爱派 (AiPy) 的功能、技术原理、使用流程、典型场景与常见问答,助你快速上手,开启“让 AI 做实事”的新纪元。
Google Workspace StudioGoogle Workspace Studio 是 Google 推出的 no-code AI 代理构建平台,允许用户通过自然语言在 Gmail、Drive、Chat、Docs 等 Workspace 应用中一键创建、管理和共享智能 AI agent,自动化日常任务与复杂工作流程,适合企业、团队及普通用户提升办公效率。
UnityVideo一个面向 AI 研究与工具使用者的多模态、多任务视频生成框架,通过统一视觉模态(例如深度、光流、骨骼和分割掩码等)与训练范式,显著提升 AI 视频合成的质量、一致性与现实世界对齐能力。本文深度介绍 UnityVideo 的原理、技术构成、应用场景与常见问题解答。
Time‑R1一个由学者提出、面向大型语言模型(LLM)的时序推理框架,通过强化学习精炼生成的小模型(≈3 B 参数),具备对“历史时间理解”、“未来事件预测”及“创造性时间想象”的能力,推理性能优于体量大 200 倍以上的模型。
Gemini Fullstack LangGraph QuickstartGoogle 开源的全栈 AI 智能体示例项目,结合了 Gemini 2.5 大模型与 LangGraph 框架,旨在构建具备深度搜索与智能研究能力的对话式 AI 系统。
DGMDGM 是一种具备自我进化能力的 AI Agent 系统。它通过迭代修改自身代码,提升自身性能,广泛应用于自动编程、代码优化、自动修复等领域。DGM 的核心理念是通过开放式探索和自我改进,实现 AI 系统的持续进化。
Science Navigator北京科学智能研究院与深势科技联合打造的一款新一代 AI4S(AI for Science)科研平台。该平台集成了文献检索、科研问答、数据管理与多学科协同等功能,旨在通过智能技术赋能科研创新,提升科研效率。
FunBlocks AIFlowFunBlocks AIFlow 是一款面向下一代人工智能与自动化工作流设计的创新型平台,致力于通过模块化、可视化及智能化的方式,简化复杂数据处理、模型训练与应用集成的全流程。
UP简历UP简历是一款基于人工智能的简历生成与优化工具,支持快速制作个性化简历、智能排版、岗位匹配与职业发展规划。本文将全面解析UP简历 的功能亮点、应用场景、技术优势与常见问题,帮助求职者高效打造专业简历,提升面试竞争力。
Heidi Health一家总部位于澳大利亚墨尔本的医疗科技公司,成立于 2019 年,前身为 Oscer。该公司专注于开发基于人工智能的医疗文书助手,旨在通过自动化临床文档记录,减轻医生的行政负担,让医疗专业人员能够将更多时间投入到患者护理中。
302.AI302.AI是一个按需付费的一站式企业级AI应用平台,开放平台,开源生态,让AI为每个需求找到答案。这里集合了最新最全的AI模型和品牌,提供机器人、AI工具和API三类AI服务,按用量付费,开箱即用,完美适配您的所有需求。