AI 必知概念速查手册
编者按:LLM、RAG、Agent、MCP、Prompt、Embedding、Fine-tuning……AI 领域的”黑话”越来越多,新人常常被绕晕。这篇文章基于 CSDN 2026 年最新技术解读和 Google Machine Learning 官方文档,按使用频率精选 15 个核心概念,每个概念一句话解释 + 一张类比图 + 一个例子,让你 10 分钟扫清认知障碍。
一、概念全景地图
%%{init: {'theme': 'dark', 'themeVariables': {'primaryColor': '#4a9eff', 'lineColor': '#888'}}}%%
graph TB
subgraph 基础层
LLM["LLM<br/>大语言模型"]
Prompt["Prompt<br/>提示词"]
Token["Token<br/>词元"]
end
subgraph 能力层
CoT["CoT 思维链"]
RAG["RAG<br/>检索增强"]
Agent["Agent<br/>智能体"]
end
subgraph 协议层
MCP["MCP<br/>上下文协议"]
API["API<br/>接口"]
end
subgraph 工程层
Embedding["Embedding<br/>词嵌入"]
VectorDB["向量数据库"]
FT["Fine-tuning<br/>微调"]
end
LLM --- Prompt --- Token
Prompt --- CoT
LLM --- RAG --- Agent
Agent --- MCP --- API
RAG --- Embedding --- VectorDB
LLM --- FT
style LLM fill:#e74c3c,color:#fff
style Agent fill:#4a9eff,color:#fff
style RAG fill:#2ecc71,color:#fff
二、15 个核心概念速查
基础层(每天都要用)
1. LLM(大语言模型)
一句话:用海量文本训练出的”超级文字接龙选手”,会根据上文预测下一个最可能出现的词。
类比:心脏,提供所有智能的基础能力。
例子:GPT-5、Claude 4、Gemini 2.5、DeepSeek、Llama 4 都是 LLM。
2. Prompt(提示词)
一句话:你跟 AI 说的所有话,包含背景、指令、格式要求。
类比:给 AI 的任务书。
四个要素:
角色:你是一位资深产品经理
任务:帮我写一份用户调研报告
格式:用 Markdown,包含"背景-方法-发现-建议"四部分
限制:字数不超过 2000 字,不要编造数据
3. Token(词元)
一句话:AI 理解文本的最小单位——不一定是”字”,可能是”字/词/词组”。
类比:就像乐高——AI 把一篇文字拆成小积木,一个一个拼。
例子:
- “Hello World” → 约 2-3 个 token
- 一篇 2000 字文章 → 约 1500-3000 个 token
- GPT-5 上下文窗口:约 200K tokens(约 15 万汉字)
能力层(让 AI 变强的技术)
4. CoT(思维链)
一句话:让 AI “一步一步想”的提示技巧,显著提高复杂推理准确率。
类比:老师让你”写出解题过程”,而不只是写答案。
例子:
❌ 普通提问:"28×34=?"
✅ CoT 提问:"28×34=?请一步一步计算。"
AI 输出:
1. 34 = 30 + 4
2. 28×30 = 840
3. 28×4 = 112
4. 840+112 = 952
5. 答案:952
5. RAG(检索增强生成)
一句话:在 AI 回答之前,先从外部知识库找到相关信息,再一起喂给 AI。
类比:AI 的”外挂记忆”——让它先查资料再回答,不再胡说八道。
三个步骤:
1. 检索:从知识库找相关内容
2. 增强:把找到的内容附在问题后面
3. 生成:AI 基于 "问题 + 检索结果" 生成回答
典型技术栈:LangChain + ChromaDB + OpenAI API
6. Agent(智能体)
一句话:能自主感知环境、做出决策并执行行动的 AI 系统。
类比:ChatBot 是”客服”(你问它答),Agent 是”助理”(交任务,它自己想办法完成)。
核心循环:
while True:
observed = 检测环境变化()
thought = LLM.推理(observed) # AI 决定下一步做什么
action = 执行(thought) # 调用工具/API/代码
真实产品:Claude Computer Use、OpenAI Operator
7. Context(上下文)
一句话:Prompt 里的背景信息——告诉 AI”你是谁、在什么场景下、有什么需求”。
类比:你在点菜前告诉服务员”我们是 10 个人、预算 500 元、有素食者”。
例子:
没有 Context:"帮我写总结" → AI 写的很泛
有 Context:"我是一家 SaaS 公司的产品经理,刚做完用户调研,
帮我写一份 500 字的核心发现总结,给 CTO 看"
协议层(AI 如何连接世界)
8. MCP(模型上下文协议)
一句话:AI 领域的”USB-C 接口”——让 AI 能安全、标准化地连接外部工具和数据。
类比:蓝牙——不同设备(AI 和工具)能通过统一标准通信。
作用:以前每个 AI 工具要单独对接每个 API(M×N 工作量),有了 MCP 后只需实现一次协议(M+N 工作量)。
9. API(应用程序接口)
一句话:就像餐厅的服务员——你告诉它要什么,它传给厨房(服务端),再把菜端回来。
类比:血管——信息在不同系统之间流动的通道。
例子:
import requests
response = requests.post(
"https://api.openai.com/v1/chat/completions",
headers={"Authorization": f"Bearer {API_KEY}"},
json={"model": "gpt-5", "messages": [{"role": "user", "content": "你好"}]}
)
工程层(开发者需要理解的)
10. Embedding(词嵌入)
一句话:把文字变成一串数字(向量),让计算机能”理解”文字之间的相似度。
类比:地图上的坐标——两个坐标点越近,含义越相似。
例子:
"咖啡" → [0.8, -0.3, 0.5, 0.1, ...] (一个 1536 维的向量)
"茶" → [0.7, -0.2, 0.4, 0.2, ...]
"手机" → [0.1, 0.8, -0.6, 0.9, ...]
相似度("咖啡", "茶") > 相似度("咖啡", "手机") ✅
11. Vector DB(向量数据库)
一句话:专门存储和搜索”向量”的数据库,是 RAG 的核心组件。
类比:一个能”按含义搜”而不是”按关键词搜”的超级索引。
主流选择:
| 数据库 | 特点 | 适用 |
|---|---|---|
| ChromaDB | 开源、轻量、Python 原生 | 个人项目、小团队 |
| Qdrant | 高性能、支持过滤 | 生产环境 |
| Pinecone | 全托管、Serverless | 不想运维 |
| Milvus | 分布式、大规模 | 企业级 |
12. Fine-tuning(微调)
一句话:在已有的 LLM 基础上,用你自己的数据再”培训”一下,让它更擅长你的领域。
类比:一个通才医生,再进修一年心内科,变成心脏专家。
什么时候需要微调?
- ✅ 你需要 AI 持续输出某种特定风格/格式
- ✅ 你有大量高质量私有数据(1000+ 条)
- ❌ 你只是想接入几个文档 → 用 RAG 更合适
- ❌ 你的数据经常变化 → 用 RAG 更灵活
13. Hallucination(幻觉)
一句话:AI “一本正经地胡说八道”——生成的内容看起来合理,但实际上是编造的。
类比:一个特别能侃的人,不懂装懂,还能说得头头是道。
减少幻觉的办法:
- 用 RAG:让 AI 先查资料再回答
- 限制回答范围:“不确定就说不知道”
- 要求引用来源:“回答时请标注出处”
- 用 CoT:强制 AI 展示推理过程
14. Multimodal(多模态)
一句话:AI 不再只”看文字”,还能”看图/听声/看视频/看代码”。
类比:人类理解世界靠五感(视觉+听觉+触觉),多模态 AI 也能通过多种”感官”理解信息。
2026 年能做到什么?
- 贴一张截图 → AI 识别内容并分析
- 上传 PDF → AI 理解全文并总结
- 共享屏幕 → AI 实时看到并给出建议
- 短视频 → AI 理解内容并生成文字描述
15. RLHF(人类反馈强化学习)
一句话:让人类标注员对 AI 的回答”打分”,AI 根据分数调整自己,变得更”听话”。
类比:教狗做”坐下”——做对了给零食(高分),做错了不理(低分)。
为什么重要:没有 RLHF 的 LLM 像个”什么都会说但不懂分寸的天才”,有了 RLHF 才变成”会看场合说话的成年人”。
三、一句话总结全部
%%{init: {'theme': 'dark', 'themeVariables': {'primaryColor': '#4a9eff', 'lineColor': '#888', 'textColor': '#fff'}}}%%
mindmap
root((AI 核心概念))
LLM
猜下一个字
GPT / Claude / Gemini
Prompt
你跟AI说的话
角色+任务+格式+限制
Token
文字拆成小积木
RAG
先查资料再回答
外部知识库
Agent
能干活儿的AI
循环思考→执行
CoT
一步一步想
提高推理准确率
Embedding
文字变成数字向量
MCP
AI界的USB接口
参考来源: