首页
学习
活动
专区
圈层
工具
发布
综合排序最热优先最新优先
时间不限
RAG 作者:RAG 已死,RAG 万岁!
一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。 RAG 的初衷 五年前,我在 Meta 基础人工智能研究中心(FAIR,前身为 Facebook 人工智能研究中心)的团队提出了 RAG(Retrieval-Augmented Generation,检索增强生成 底线是:您同时需要长上下文 LLM 和 RAG。 但既然“RAG”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为 RAG。 我们可以就叫它 检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用 RAG 精准定位所需信息要昂贵得多。 RAG、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。
Datawhale
2025-04-24
7980
标签:
RAG】001-RAG概述
RAG】001-RAG概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:RAG 基本逻辑 补充2:RAG 知识库基本逻辑 一、RAG 介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、RAG 的概念 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、RAG 的工作原理 RAG 的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用
訾博ZiBo
2025-03-25
8490
标签:
RAG 系列 02 — Advanced RAG
系列说明:这是RAG工程化系列第二篇。第一篇我们拆了NaiveRAG的8颗雷,得出一个反直觉的结论:90%的"模型不够好",其实是"工程没做好"。 配套阅读:《RAG系列01—NaiveRAG》《从NaiveRAG到AgenticRAG》引言:2025年3月,我参加了一家toBSaaS公司的技术评审会。那天的议题是"RAG系统下一阶段升级路线"。 这就是AdvancedRAG的真实威力——它是整条RAG演进光谱上ROI最高的一站,但也是最容易被跳过的一站。 AdvancedRAG的本质,是把RAG从"一锤子买卖"重构为"多阶段管道"。 下一篇预告:《RAG系列03—ModularRAG:当一条流水线装不下你的业务》
技术方舟
2026-06-09
1310
标签:
RAG 系列 01 — Naive RAG
系列说明:这是RAG工程化系列第一篇,目标是把四代RAG(NaiveAdvancedModular/Agentic)逐一拆透。每篇聚焦一种范式,讲它真正能做什么、做不到什么、工程上怎么落地。 一、NaiveRAG到底是什么:先把定义讲清楚,否则后面全是糊涂账打开任何一篇RAG教程,你会看到几乎一样的描述:"RAG就是先检索再生成"。这种描述等于没说。 但这一行决定了你的RAG准确率上限。PDF是NaiveRAG的头号杀手。 这一段代码能解决RAG项目里50%的"幻觉投诉"。零模型成本、立竿见影。 留给读者的两个问题:你正在做的RAG项目,8颗雷里你已经踩了几颗?
技术方舟
2026-05-23
3500
标签:
RAG 系列 03 — Modular RAG
系列说明:这是RAG工程化系列第三篇。前两篇我们完成了从Naive到Advanced的进化——把基础工程做到极致,把准确率从38%推到87%。 配套阅读:《RAG系列01—NaiveRAG》《RAG系列02—AdvancedRAG》《从NaiveRAG到AgenticRAG》引言:那个"if-else套了11层"的RAG项目2024年底,我帮一家金融科技公司做 RAG系统的codereview。 这就是ModularRAG真正的价值——它不是为了更高的准确率,是为了让你的RAG系统在业务复杂度爆炸时不崩盘。 ModularRAG的本质,是把RAG从"线性管道"升级为"模块化图(Graph)"。
技术方舟
2026-06-11
210
标签:
rag
RAG技术全面解析:原理、应用与优势 引言 在当今快速发展的人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为一个备受关注的话题。 RAG工作流程 RAG的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息,RAG系统可以识别出新的实体和关系。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。
DC童生
2024-06-27
6640
标签:
RAG Logger:RAG日志记录工具
您听说过 RAG Logger 吗? 它是一款专为检索增强生成 (RAG) 应用程序设计的开源日志记录工具! 据说它可以作为 LangSmith 的轻量级替代方案,满足 RAG 特定的日志记录需求。 查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。 特点 通过查询跟踪详细了解用户问题! RAG Logger 为 RAG 应用程序的性能监控和调试提供了强大的支持,对吗? 特别推荐给那些想要提高应用程序开发效率的人。 请参阅此处的详细信息: RAG Logger GitHub 仓库
致Great
2025-01-07
3610
标签:
独家 | 进阶RAG-提升RAG效果
在我的上一篇博客中,我深入地介绍了RAG以及它是如何用LlamaIndex实现的。然而,RAG在回答问题时经常遇到许多挑战。 RAG工作流程分解 首先,为了增强对RAG的理解,我们将RAG工作流程分解为三个部分,并对每个部分进行优化以提高整体表现。 模块化RAG 模块化RAG集成了多种方法来增强RAG的不同组成部分,如在检索器中加入相似度检索的搜索模块和应用微调方法 RAG融合(RAG Fusion) RA融合技术结合了两种方法: 多查询检索 利用 总结 本文讨论了优化RAG管道各部分和增强整体RAG流水线的各种技术。您可以在您的RAG流水线中使用这些技术中的一种或多种,从而使其更加准确和高效。 原文标题:Advance RAG- Improve RAG performance 副标题:Ultimate guide to optimise RAG pipeline from zero to advance
数据派THU
2024-06-28
1.7K0
标签:
什么是 RAG,为什么要用 RAG
为什么要用 RAGRAG 引用信息来源是用户可以核实答案,因此其透明透非常高,这增强了人们对模型输出结果的信任。 透过获取与特定领域数据,RAG能够为不同领域提供专业的知识支持,定制能力非常高。 由于 RAG 不需更新模型参数,因此在处理大规模数据集时,经济效率方面更具优势。 不过虽然RAG有许多优势在,但这3种方法并不是互斥的,反而是相辅相成的。 什么是 RAG ? 这篇章旨在介绍 RAG 的过程与其使用的相关技术。 RAG 生态系 RAG 的生态系蓬勃发展,在水平领域,从最初的文本问答领域以外,RAG 的应用逐渐拓展到更多模态数据,包括图像、代码、结构化知识、影音等。 在这些领域,已经涌现许多相关研究成果。
用户1418987
2024-09-06
7840
标签:
RAG 修炼手册|如何评估 RAG 应用?
当以黑盒方式来评估 RAG 应用时,我们看不到 RAG 应用的内部,只能从输入给 RAG 应用的信息和它返回的信息来评估 RAG 的效果。 对于一般的 RAG 系统,我们只能访问这三个信息:用户提问(User's query)、RAG 系统召回的引用上下文(retrieved contexts)、RAG 系统的回答(RAG's response 我们使用这三个信息来评估 RAG 应用的效果,黑盒方式是一种端到端的评估方式,也比较适用于评估闭源的 RAG 应用。 当以白盒方式来评估 RAG 应用时,我们能看到 RAG 应用的内部所有流程。 白盒方式可以用来评估开源 RAG 应用,或者提升自研 RAG 应用。 02. )、RAG 系统的回答(RAG's response)。
Zilliz RDS
2024-04-25
1.6K0
标签:
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档