加载中...

Agent八股文

发表于2026-04-08|更新于2026-04-08|Wiki

|总字数:1.5k|阅读时长:4分钟|浏览量:|评论数:

什么是 RAG？RAG 的主要流程是什么？

一、RAG 的定义

RAG 全称 Retrieval Augmented Generation（检索增强生成），核心是给大模型挂载外部知识库，解决大模型的两大核心痛点：

知识滞后性：训练数据有时间截止点，无法获取最新信息
私有数据缺失：不了解企业内部文档、私有业务数据等未训练过的内容，本质是让大模型基于外部实时 / 私有知识 “开卷答题”，避免幻觉，提升回答准确性。

二、RAG 的核心流程（通俗版 + 专业版）

通俗记忆：找 → 缝 → 写

找：用户提问后，先不调用大模型，去向量数据库中检索和问题语义相关的资料片段
缝：把用户问题 + 检索到的相关资料，拼接成信息量更大的 Prompt
写：将拼接后的 Prompt 输入大模型，让大模型基于资料生成准确、无幻觉的回答

什么是 RAG 中的 Rerank？具体需要怎么做？

一、Rerank 是什么

Rerank（重排序）是 RAG 流程中，对初步检索返回的候选文档列表进行二次精准排序的步骤，核心是在检索速度和回答精度之间做平衡。

通俗类比（招聘流程）

初步检索（向量检索 / Bi-Encoder）：相当于 HR 海选简历，速度快但筛选粗糙，只能按关键词 / 浅层语义匹配，选出 Top N（如 Top 100）候选文档，可能混入不相关内容。
Rerank（重排序 / Cross-Encoder）：相当于业务主管面试，对候选文档做深度语义校验，精准判断文档和用户问题的匹配度，从候选中筛选出真正相关的 Top K（如 Top 5），再喂给大模型生成答案。

二、核心价值

先用向量检索保证检索效率，再用 Rerank 保证召回精度，避免大模型因输入低质量、不相关的文档而产生幻觉、胡说八道，提升最终回答的准确性。

三、具体怎么做（执行步骤）

初步检索：用向量检索（Bi-Encoder 模型）快速从知识库中召回一批候选文档（如 Top 100），完成粗筛。
重排序计算：用 Rerank 模型（通常是 Cross-Encoder）对用户问题（Query）和每篇候选文档（Document）做深度交互计算，精准打分，衡量文档对问题的匹配度。
筛选与输出：按打分结果重新排序，筛选出匹配度最高的少量文档（如 Top 5），作为最终上下文输入大模型生成回答。

什么混合检索？在基于大模型的应用开发中，混合检索主要解决什么问题？

一、混合检索的定义

混合检索是 RAG 应用中的核心优化技术，指将向量检索（语义检索）和关键词检索（精确检索）两种方式结合，通过结果融合重排序，取长补短，大幅提升检索结果的全面性和准确性。

二、两种检索方式的优劣势对比

检索方式	核心优势	核心短板
向量检索（语义检索）	擅长语义理解，能匹配同义 / 近义表达（如 “怎么减肥” 和 “如何瘦身”）	难以精准匹配专有名词、特定术语（如 “iPhone 15”），易出现语义偏差
关键词检索（精确检索）	精准匹配专有名词、关键词，准确率高	无法理解语义，无法匹配同义表达，漏召回率高

三、核心解决的问题

单一检索的固有缺陷：弥补向量检索 “精准度不足” 和关键词检索 “语义理解缺失” 的短板，兼顾语义匹配和精确匹配。
提升 RAG 检索质量：避免因检索结果不全、不准导致大模型产生幻觉，提升最终回答的准确性和全面性。
适配复杂查询场景：同时满足用户的语义化提问和专有名词查询需求，覆盖更多业务场景。

四、完整执行流程

并行检索：用户提问后，同时执行向量检索（输出语义匹配结果）和关键词检索（输出精确匹配结果）。
结果融合重排序：通过权重加权、RRF（ reciprocal rank fusion）等算法，对两路结果进行融合、重排序，筛选出最优结果。
输入大模型：将融合后的优质结果作为上下文，喂给大模型生成最终回答。

RAG 的完整流程是怎么样的？

1. 离线索引阶段（准备阶段，前置工作）

目的是构建并入库可检索的知识向量，为在线问答做准备。

文档预处理：清洗原始文档，按逻辑切分成固定长度的文本块（如 300-500 字 / 块），保证语义完整且便于检索。
向量生成：使用 Embedding 嵌入模型，将每个文本块转换为固定维度的向量（数值数组），捕捉文本语义。
向量入库：将向量与元数据一起存入 Milvus、Pinecone 等向量数据库，并建立索引，等待检索。

2. 在线问答阶段（处理用户请求，核心流程）

目的是基于用户问题，精准获取知识并生成回答。

问题向量化：将用户的查询问题（Query），通过相同的 Embedding 模型转换为问题向量。
语义检索：拿着问题向量去向量数据库中进行相似度检索（如余弦相似度），召回最相关的 5-10 个文档块。
重排序（Rerank）：对初步召回的候选结果进行二次排序，筛选出匹配度最高的 Top-K 文档，剔除无关内容。
生成回答：将用户问题 + 检索到的高质量上下文拼接成 Prompt，输入大模型，由大模型基于检索到的真实知识生成准确、可信的回答。

文章作者: TouHouQing

文章链接: https://tohoqing.com/wiki/agent-interview-notes/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 TouHouQing's Blog！

看在baka的份上,赏口饭吃

wechat
alipay

相关推荐

JAVA学习笔记

JAVA学习笔记JAVA SE方法可变参数一种特殊形参，定义在方法，构造器的形参列表里，格式是：数据类型…参数名称; 特点：可以不传数据，也可以传一个或者多个数据，也可以传一个数组。可变参数在方法内部就是一个数组，一个形参列表中可变参数只能有一个，可变参数必须放在形参列表最后面抽象类抽象类中不一定要有抽象方法，有抽象方法的类必须是抽象类抽象类不能创建对象，仅作为一种特殊父类被子类继承并实现一个类继承抽象类必须重写完抽象类的全部抽象方法，否则这个类也必须定义为抽象类接口接口是用来被类实现(implements)的，实现接口的类被称为实现类，一个类可以同时实现多个接口。 1修饰符 class 实现类类名 implements 接口1，接口2....{} lambda可以用于替代某些匿名内部类对象，从而让程序更简洁，可读性更好 lambda表达式只能替代函数式接口的匿名内部类，有且仅有一个抽象方法的接口规则：参数类型全部可以省略不写如果只有一个参数，参数类型省略的同时”()”也可以省略，但多个参数不能省略“()” 如果lambda表达式中...

html学习笔记

一、HTML 基础：构建网页骨架1.1 HTML 基本结构1234567891011<!DOCTYPE html><html lang="zh-CN"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>我的第一个HTML页面</title> </head> <body> </body></html> 关键标签解析： <!DOCTYPE html>：声明 HTML5 文档类型 <html lang="zh-CN">：定义网页语言（有助于 SEO 和屏幕阅读器） <meta charset="UTF-8"...

算法笔记C++

算法笔记算法基础二分整数二分//在一个单调区间里面去找答案 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051bool check(int x) {/* ... */} // 检查x是否满足某种性质// 区间[l, r]被划分成[l, mid]和[mid + 1, r]时使用：int bsearch_1(int l, int r)//适用于目标值确定在数组中存在，且需要精确找到目标值位置的场景 { while (l < r) { int mid = l + r >> 1; if (check(mid)) r = mid; // check()判断mid是否满足性质 else l = mid + 1;//左加右减 } return l; } // 区间[l, r]被划分成[l, m...

函数操作pluck('')：提取指定字段从 $rawRescanLogs 集合中提取所有记录的 '' 字段值，生成一个新的集合（仅包含 m 数据）。 Eloquent 集合的 pluck() 方法：专门用于提取模型集合中指定字段的值，返回一个值的集合（非关联数组）。 filter()：过滤空值移除集合中的空值（包括 null、空字符串 ""、0 等，但需注意 0 是否为有效数据）。 Eloquent 集合的 filter() 方法：会自动过滤掉 falsy 值（默认行为），仅保留真值。 unique()：去重移除集合中重复的值，保留唯一值，生成一个新集合。 Eloquent 集合的 unique() 方法：默认根据值去重（非键名），相同值仅保留第一个出现的项。 values()：重置数组索引移除集合中的原有索引，并重新生成从 0 开始的连续整数索引。场景：当集合的键名（如原有数据库记录的索引）不需要保留时，重置索引便于后续遍历或操作。 all()：转换为普通数组将 Eloquent 集合转换为 PH...

位运算笔记

位运算笔记判断奇偶（逻辑与 &)123456if((x&1) == 1) printf("x是奇数\n"); else if((x&1) == 0) printf("x是偶数\n"); 交换两个整数（逻辑异或 ^）1234567void sswap(int *a,int *b){ *a = *a ^ *b; *b = *b ^ *a; *a = *a ^ *b;} 求整数的绝对值1234567int ffabs(int x){ if(x>0) return x; else return ~x + 1;} 获取二进制数的某一位1x>>i&1;//表示x的二进制第i位修改二进制中的某一位为11x|(1<<i); 修改二进制中的某一位为01x&~(1<<i); 快速判断一个数字是否为2的幂次方1x&(x-1);//是则为0 获取二进制位中最低位的11lowbit(x)=x&-x;//若x=0...

javascript学习笔记

一、JavaScript 基础语法1. 变量与数据类型变量声明 var（函数作用域，可重复声明） let（块作用域，不可重复声明） const（块作用域，常量，声明时必须初始化）案例： 12const name = "Alice"; // 常量（不可重新赋值）let age = 25; // 变量（可更新）数据类型原始类型：string、number、boolean、null、undefined、symbol 对象类型：Object、Array、Function 类型转换： 12const num = "123";const sum = parseInt(num) + 10; // 转为数字 133 2. 数组与对象数组操作常用方法：push()、pop()、shift()、unshift()、slice()、splice() 案例：生成金字塔结构（freeCodeCamp 项目） 12345678function buildPyramid(n) { const pyramid = [...

评论