DeepSeek扫盲1：不要混淆大模型与应用，谈一谈RAG应用框架

作者：陈勇

看到网上有人说DeepSeek没吹的那么神，用起来还不如豆包、Kimi之类，这其实是混淆了大语言模型与应用。由于DeepSeek的网站和APP也叫同名，所以更容易混淆。大语言模型要放在应用框架内，才能正常运行，通常用的是RAG框架，还会涉及到向量数据库，本文就来讲解一下这些基础概念。

先了解大语言模型与应用的区别

大语言模型（Large Language Model，英文缩写为LLM，以下均用缩写）本身是不能直接工作的，可以将它理解成核心处理模块，为了让它工作，还需要给它安上一些组件：

人机对话界面：用于输入查询和输出结果
资料检索（可选）：输入查询后，有可能先去检索资料库，再交给LLM处理
结果记忆（可选）：结合之前的输出结果，对新问题进行处理，分成短期记忆和长期记忆

LLM的组件

当然也可以省去后两者，将查询（query）直接交给LLM处理。我们输入的查询包括问题或指令，都是自然语言的形式，可以是大白话，但为了让LLM更好地运行，这就需要在提示词（prompt）上做文章。可以人工进行转化，也可以借助专门的工具。

安上组件后，才算是围绕着LLM建立起应用，LLM才能正常工作。

LLM应用框架

稍微展开说一下资料库。首先，LLM在生成时采用的数据有时间节点，比如截止到2024年12月31日，因此在这之后的数据就没有了。其次，LLM一般都是通用大模型，缺少专项的资料。基于这两点，就需要准备检索资料库，与LLM搭配使用。

LLM应用框架

见上图，应用框架分成左右两部分，左边是查询及生成，右边是资料库准备（数据获取）。在搭建好应用框架后，就要开始建资料库，将txt、pdf、doc等格式的资料存储到数据库中，就做好了数据库准备。实际应用时，检索路由会根据输入的提示词进行判断，如果需要的话就会接入资料库，要么从数据库中检索数据，要么从网上检索数据，再将结果输入LLM，运行后得到结果。

现在可以了解RAG技术了

有了上面的简化说明，接下来就可以了解RAG技术了。RAG的全称是Retrieval-Augmented Generation，意思是增强的检索生成。RAG有什么用呢？简单说就是用来优化LLM的提示词，以便LLM输出的结果更高效、更精准。

RAG应用

RAG可不只是简单地对输入的问题（或指令）进行处理，而是靠三个利器：

嵌入模型（Embedding Model）：进行资料与向量的相互转换
向量数据库（Vector Database）：向量格式的数据库
检索路由：判断是直接将提示词发给LLM，还是转入嵌入模型或连线网络

LLM所使用的资料库是一个向量数据库，它的配套工具是嵌入模型。我们日常使用的文本、图像等文档属于高维数据，很难直接进行检索，为了便于检索，就要将他们转换成低维度的向量数据，这个过程称为嵌入（embedding），就是通过嵌入模型进行的转换。

向量数据库

向量数据嵌入不是实时的，而是要提前生成向量数据库，将txt、doc、pdf等格式的文档传入，通过嵌入模型转换成向量数据，再存储到向量数据库并形成索引，这就是我们所说的本底资料库。应用的时候，我们输入的查询经过嵌入模型转换成向量数据，然后到向量数据库中进行检索，找到查询向量和相关向量，形成上下文（context）。再将上下文结合提示词输入给LLM，运行后就得到了最终结果。

最后

了解了RAG，我们就清楚了LLM应用的结果是否靠谱，不只取决于LLM本身，还跟RAG的向量数据库和检索有关，并且不同LLM对于提示词的处理也会有所区别。就拿DeepSeek来说，现在很多平台争相接入，但各平台的性能和产出质量有很大差别，就是因为硬件和RAG上的差别。

下篇文章将讲解LLM是怎么生成的、DeepSeek究竟有哪些过人之处。

展开阅读全文

更新时间：2025-06-04

标签：科技框架模型向量资料库数据数据库提示语言组件资料

1 2 3 4 5

DeepSeek扫盲1：不要混淆大模型与应用，谈一谈RAG应用框架

先了解大语言模型与应用的区别

LLM应用框架

现在可以了解RAG技术了

最后

当AI走进课堂，这所高中的教与学如何被重新定义？

2025上海科技节本周六启幕，机器人和科学家同走AI科学红毯

人民日报评外卖平台企业被约谈：摆脱无谓“内卷”

快递小哥又立功了！他觉得不对劲，往屋里一看……救下一命！

不到24小时，特朗普口风变了：90天后中美没谈拢，关税将大幅上涨

太突然！金价连续大跌，“买个手镯，半个月价值缩水2000多元”，有网友直呼：亏麻了！专家分析……

金价大跌！现在是入手好时机吗？

澄清对中美关税谈判结果的几个误读，因为很关键！很重要！

房价还能涨回到过去的高点吗？

莫迪发现被特朗普耍了，“取代中国”梦破碎，恼羞成怒报复美国！

七旬中国父母卖掉两套房产帮儿子在海外买房，却被其逐出家门！

融资需求1026亿元广元115个重点融资项目推介出炉

刚刚，常州首富被立案调查！

商务部新闻发言人就暂停17家美国实体不可靠实体清单措施答记者问

9000万元！乌达又一重点项目开工

2025上海科技节本周六启幕，机器人和科学家同走AI科学红

中药食品火热出圈专家提示应遵循“药食两用”规定范

2025年青海省林草科技活动周启动

扬州新扬光科技取得新型结构的 LED 光源专利，增强散热

红米Turbo 4 Pro很猛！但华为Nova 13才是真神，销量数据啪

大语言模型简史：从Transformer（2017）到DeepSeek-R1（2025）的

山西绿源碳索科技有限公司取得干熄焦炉及干熄焦余热利

北京中科天航云链取得基于大数据分析的元器件可靠性评

谷歌Android多年来最大更新：全新设计语言发布

凌归数字科技（四川）有限公司成立，注册资本500万人民币