腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
RAG
作者:
RAG
已死,
RAG
万岁!
一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“
RAG
已死”的宣言。
RAG
的初衷 五年前,我在 Meta 基础人工智能研究中心(FAIR,前身为 Facebook 人工智能研究中心)的团队提出了
RAG
(Retrieval-Augmented Generation,检索增强生成 底线是:您同时需要长上下文 LLM 和
RAG
。 但既然“
RAG
”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为
RAG
。 我们可以就叫它 检索 (retrieval)。
RAG
提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用
RAG
精准定位所需信息要昂贵得多。
RAG
、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在
RAG
与长上下文窗口、微调或 MCP 之间做出选择。
Datawhale
2025-04-24
798
0
标签:
人工智能
工具
模型
数据
系统
【
RAG
】001-
RAG
概述
【
RAG
】001-
RAG
概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:
RAG
基本逻辑 补充2:
RAG
知识库基本逻辑 一、
RAG
介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、
RAG
的概念
RAG
(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、
RAG
的工作原理
RAG
的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、
RAG
的应用场景
RAG
技术在多个领域都有广泛应用
訾博ZiBo
2025-03-25
849
0
标签:
索引
优化
量化
模型
数据
RAG
系列 02 — Advanced
RAG
系列说明:这是
RAG
工程化系列第二篇。第一篇我们拆了NaiveRAG的8颗雷,得出一个反直觉的结论:90%的"模型不够好",其实是"工程没做好"。 配套阅读:《
RAG
系列01—NaiveRAG》《从NaiveRAG到AgenticRAG》引言:2025年3月,我参加了一家toBSaaS公司的技术评审会。那天的议题是"
RAG
系统下一阶段升级路线"。 这就是AdvancedRAG的真实威力——它是整条
RAG
演进光谱上ROI最高的一站,但也是最容易被跳过的一站。 AdvancedRAG的本质,是把
RAG
从"一锤子买卖"重构为"多阶段管道"。 下一篇预告:《
RAG
系列03—ModularRAG:当一条流水线装不下你的业务》
技术方舟
2026-06-09
131
0
标签:
合肥同盟
RAG
系列 01 — Naive
RAG
系列说明:这是
RAG
工程化系列第一篇,目标是把四代
RAG
(NaiveAdvancedModular/Agentic)逐一拆透。每篇聚焦一种范式,讲它真正能做什么、做不到什么、工程上怎么落地。 一、NaiveRAG到底是什么:先把定义讲清楚,否则后面全是糊涂账打开任何一篇
RAG
教程,你会看到几乎一样的描述:"
RAG
就是先检索再生成"。这种描述等于没说。 但这一行决定了你的
RAG
准确率上限。PDF是NaiveRAG的头号杀手。 这一段代码能解决
RAG
项目里50%的"幻觉投诉"。零模型成本、立竿见影。 留给读者的两个问题:你正在做的
RAG
项目,8颗雷里你已经踩了几颗?
技术方舟
2026-05-23
350
0
标签:
合肥同盟
RAG
系列 03 — Modular
RAG
系列说明:这是
RAG
工程化系列第三篇。前两篇我们完成了从Naive到Advanced的进化——把基础工程做到极致,把准确率从38%推到87%。 配套阅读:《
RAG
系列01—NaiveRAG》《
RAG
系列02—AdvancedRAG》《从NaiveRAG到AgenticRAG》引言:那个"if-else套了11层"的
RAG
项目2024年底,我帮一家金融科技公司做
RAG
系统的codereview。 这就是ModularRAG真正的价值——它不是为了更高的准确率,是为了让你的
RAG
系统在业务复杂度爆炸时不崩盘。 ModularRAG的本质,是把
RAG
从"线性管道"升级为"模块化图(Graph)"。
技术方舟
2026-06-11
21
0
标签:
合肥同盟
rag
RAG
技术全面解析:原理、应用与优势 引言 在当今快速发展的人工智能领域,检索增强生成(Retrieval-Augmented Generation,
RAG
)技术已成为一个备受关注的话题。
RAG
工作流程
RAG
的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。
RAG
技术的应用场景
RAG
技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨
RAG
技术的几个主要应用场景。
RAG
技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息,
RAG
系统可以识别出新的实体和关系。
RAG
技术的优势与挑战
RAG
技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨
RAG
技术的优势和挑战。
DC童生
2024-06-27
664
0
标签:
架构
模型
数据
系统
RAG
Logger:
RAG
日志记录工具
您听说过
RAG
Logger 吗? 它是一款专为检索增强生成 (
RAG
) 应用程序设计的开源日志记录工具! 据说它可以作为 LangSmith 的轻量级替代方案,满足
RAG
特定的日志记录需求。 查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。 特点 通过查询跟踪详细了解用户问题!
RAG
Logger 为
RAG
应用程序的性能监控和调试提供了强大的支持,对吗? 特别推荐给那些想要提高应用程序开发效率的人。 请参阅此处的详细信息:
RAG
Logger GitHub 仓库
致Great
2025-01-07
361
0
标签:
优化
工具
日志
搜索
性能监控
独家 | 进阶
RAG
-提升
RAG
效果
在我的上一篇博客中,我深入地介绍了
RAG
以及它是如何用LlamaIndex实现的。然而,
RAG
在回答问题时经常遇到许多挑战。
RAG
工作流程分解 首先,为了增强对
RAG
的理解,我们将
RAG
工作流程分解为三个部分,并对每个部分进行优化以提高整体表现。 模块化
RAG
模块化
RAG
集成了多种方法来增强
RAG
的不同组成部分,如在检索器中加入相似度检索的搜索模块和应用微调方法
RAG
融合(
RAG
Fusion) RA融合技术结合了两种方法: 多查询检索 利用 总结 本文讨论了优化
RAG
管道各部分和增强整体
RAG
流水线的各种技术。您可以在您的
RAG
流水线中使用这些技术中的一种或多种,从而使其更加准确和高效。 原文标题:Advance
RAG
- Improve
RAG
performance 副标题:Ultimate guide to optimise
RAG
pipeline from zero to advance
数据派THU
2024-06-28
1.7K
0
标签:
优化
模型
数据
搜索
压缩
什么是
RAG
,为什么要用
RAG
?
为什么要用
RAG
?
RAG
引用信息来源是用户可以核实答案,因此其透明透非常高,这增强了人们对模型输出结果的信任。 透过获取与特定领域数据,
RAG
能够为不同领域提供专业的知识支持,定制能力非常高。 由于
RAG
不需更新模型参数,因此在处理大规模数据集时,经济效率方面更具优势。 不过虽然
RAG
有许多优势在,但这3种方法并不是互斥的,反而是相辅相成的。 什么是
RAG
? 这篇章旨在介绍
RAG
的过程与其使用的相关技术。
RAG
生态系
RAG
的生态系蓬勃发展,在水平领域,从最初的文本问答领域以外,
RAG
的应用逐渐拓展到更多模态数据,包括图像、代码、结构化知识、影音等。 在这些领域,已经涌现许多相关研究成果。
用户1418987
2024-09-06
784
0
标签:
数据
系统
优化
企业
模型
RAG
修炼手册|如何评估
RAG
应用?
当以黑盒方式来评估
RAG
应用时,我们看不到
RAG
应用的内部,只能从输入给
RAG
应用的信息和它返回的信息来评估
RAG
的效果。 对于一般的
RAG
系统,我们只能访问这三个信息:用户提问(User's query)、
RAG
系统召回的引用上下文(retrieved contexts)、
RAG
系统的回答(
RAG
's response 我们使用这三个信息来评估
RAG
应用的效果,黑盒方式是一种端到端的评估方式,也比较适用于评估闭源的
RAG
应用。 当以白盒方式来评估
RAG
应用时,我们能看到
RAG
应用的内部所有流程。 白盒方式可以用来评估开源
RAG
应用,或者提升自研
RAG
应用。 02. )、
RAG
系统的回答(
RAG
's response)。
Zilliz RDS
2024-04-25
1.6K
0
标签:
工具
设计
数据
系统
性能
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档