AI 必知概念速查手册

编者按：LLM、RAG、Agent、MCP、Prompt、Embedding、Fine-tuning……AI 领域的”黑话”越来越多，新人常常被绕晕。这篇文章基于 CSDN 2026 年最新技术解读和 Google Machine Learning 官方文档，按使用频率精选 15 个核心概念，每个概念一句话解释 + 一张类比图 + 一个例子，让你 10 分钟扫清认知障碍。

一、概念全景地图

%%{init: {'theme': 'dark', 'themeVariables': {'primaryColor': '#4a9eff', 'lineColor': '#888'}}}%%
graph TB
    subgraph 基础层
        LLM["LLM<br/>大语言模型"]
        Prompt["Prompt<br/>提示词"]
        Token["Token<br/>词元"]
    end
    subgraph 能力层
        CoT["CoT 思维链"]
        RAG["RAG<br/>检索增强"]
        Agent["Agent<br/>智能体"]
    end
    subgraph 协议层
        MCP["MCP<br/>上下文协议"]
        API["API<br/>接口"]
    end
    subgraph 工程层
        Embedding["Embedding<br/>词嵌入"]
        VectorDB["向量数据库"]
        FT["Fine-tuning<br/>微调"]
    end
    
    LLM --- Prompt --- Token
    Prompt --- CoT
    LLM --- RAG --- Agent
    Agent --- MCP --- API
    RAG --- Embedding --- VectorDB
    LLM --- FT
    
    style LLM fill:#e74c3c,color:#fff
    style Agent fill:#4a9eff,color:#fff
    style RAG fill:#2ecc71,color:#fff

二、15 个核心概念速查

基础层（每天都要用）

1. LLM（大语言模型）

一句话：用海量文本训练出的”超级文字接龙选手”，会根据上文预测下一个最可能出现的词。

类比：心脏，提供所有智能的基础能力。

例子：GPT-5、Claude 4、Gemini 2.5、DeepSeek、Llama 4 都是 LLM。

2. Prompt（提示词）

一句话：你跟 AI 说的所有话，包含背景、指令、格式要求。

类比：给 AI 的任务书。

四个要素：

角色：你是一位资深产品经理
任务：帮我写一份用户调研报告
格式：用 Markdown，包含"背景-方法-发现-建议"四部分
限制：字数不超过 2000 字，不要编造数据

3. Token（词元）

一句话：AI 理解文本的最小单位——不一定是”字”，可能是”字/词/词组”。

类比：就像乐高——AI 把一篇文字拆成小积木，一个一个拼。

例子：

“Hello World” → 约 2-3 个 token
一篇 2000 字文章 → 约 1500-3000 个 token
GPT-5 上下文窗口：约 200K tokens（约 15 万汉字）

能力层（让 AI 变强的技术）

4. CoT（思维链）

一句话：让 AI “一步一步想”的提示技巧，显著提高复杂推理准确率。

类比：老师让你”写出解题过程”，而不只是写答案。

例子：

❌ 普通提问："28×34=？"
✅ CoT 提问："28×34=？请一步一步计算。"

AI 输出：
1. 34 = 30 + 4
2. 28×30 = 840
3. 28×4 = 112
4. 840+112 = 952
5. 答案：952

5. RAG（检索增强生成）

一句话：在 AI 回答之前，先从外部知识库找到相关信息，再一起喂给 AI。

类比：AI 的”外挂记忆”——让它先查资料再回答，不再胡说八道。

三个步骤：

1. 检索：从知识库找相关内容
2. 增强：把找到的内容附在问题后面
3. 生成：AI 基于 "问题 + 检索结果" 生成回答

典型技术栈：LangChain + ChromaDB + OpenAI API

6. Agent（智能体）

一句话：能自主感知环境、做出决策并执行行动的 AI 系统。

类比：ChatBot 是”客服”（你问它答），Agent 是”助理”（交任务，它自己想办法完成）。

核心循环：

while True:
    observed = 检测环境变化()
    thought = LLM.推理(observed)  # AI 决定下一步做什么
    action = 执行(thought)         # 调用工具/API/代码

真实产品：Claude Computer Use、OpenAI Operator

7. Context（上下文）

一句话：Prompt 里的背景信息——告诉 AI”你是谁、在什么场景下、有什么需求”。

类比：你在点菜前告诉服务员”我们是 10 个人、预算 500 元、有素食者”。

例子：

没有 Context："帮我写总结" → AI 写的很泛
有 Context："我是一家 SaaS 公司的产品经理，刚做完用户调研，
          帮我写一份 500 字的核心发现总结，给 CTO 看"

协议层（AI 如何连接世界）

8. MCP（模型上下文协议）

一句话：AI 领域的”USB-C 接口”——让 AI 能安全、标准化地连接外部工具和数据。

类比：蓝牙——不同设备（AI 和工具）能通过统一标准通信。

作用：以前每个 AI 工具要单独对接每个 API（M×N 工作量），有了 MCP 后只需实现一次协议（M+N 工作量）。

9. API（应用程序接口）

一句话：就像餐厅的服务员——你告诉它要什么，它传给厨房（服务端），再把菜端回来。

类比：血管——信息在不同系统之间流动的通道。

例子：

import requests
response = requests.post(
    "https://api.openai.com/v1/chat/completions",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={"model": "gpt-5", "messages": [{"role": "user", "content": "你好"}]}
)

工程层（开发者需要理解的）

10. Embedding（词嵌入）

一句话：把文字变成一串数字（向量），让计算机能”理解”文字之间的相似度。

类比：地图上的坐标——两个坐标点越近，含义越相似。

例子：

"咖啡" → [0.8, -0.3, 0.5, 0.1, ...]  （一个 1536 维的向量）
"茶"   → [0.7, -0.2, 0.4, 0.2, ...]
"手机" → [0.1, 0.8, -0.6, 0.9, ...]

相似度("咖啡", "茶") > 相似度("咖啡", "手机")  ✅

11. Vector DB（向量数据库）

一句话：专门存储和搜索”向量”的数据库，是 RAG 的核心组件。

类比：一个能”按含义搜”而不是”按关键词搜”的超级索引。

主流选择：

数据库	特点	适用
ChromaDB	开源、轻量、Python 原生	个人项目、小团队
Qdrant	高性能、支持过滤	生产环境
Pinecone	全托管、Serverless	不想运维
Milvus	分布式、大规模	企业级

12. Fine-tuning（微调）

一句话：在已有的 LLM 基础上，用你自己的数据再”培训”一下，让它更擅长你的领域。

类比：一个通才医生，再进修一年心内科，变成心脏专家。

什么时候需要微调？

✅ 你需要 AI 持续输出某种特定风格/格式
✅ 你有大量高质量私有数据（1000+ 条）
❌ 你只是想接入几个文档 → 用 RAG 更合适
❌ 你的数据经常变化 → 用 RAG 更灵活

13. Hallucination（幻觉）

一句话：AI “一本正经地胡说八道”——生成的内容看起来合理，但实际上是编造的。

类比：一个特别能侃的人，不懂装懂，还能说得头头是道。

减少幻觉的办法：

用 RAG：让 AI 先查资料再回答
限制回答范围：“不确定就说不知道”
要求引用来源：“回答时请标注出处”
用 CoT：强制 AI 展示推理过程

14. Multimodal（多模态）

一句话：AI 不再只”看文字”，还能”看图/听声/看视频/看代码”。

类比：人类理解世界靠五感（视觉+听觉+触觉），多模态 AI 也能通过多种”感官”理解信息。

2026 年能做到什么？

贴一张截图 → AI 识别内容并分析
上传 PDF → AI 理解全文并总结
共享屏幕 → AI 实时看到并给出建议
短视频 → AI 理解内容并生成文字描述

15. RLHF（人类反馈强化学习）

一句话：让人类标注员对 AI 的回答”打分”，AI 根据分数调整自己，变得更”听话”。

类比：教狗做”坐下”——做对了给零食（高分），做错了不理（低分）。

为什么重要：没有 RLHF 的 LLM 像个”什么都会说但不懂分寸的天才”，有了 RLHF 才变成”会看场合说话的成年人”。

三、一句话总结全部

%%{init: {'theme': 'dark', 'themeVariables': {'primaryColor': '#4a9eff', 'lineColor': '#888', 'textColor': '#fff'}}}%%
mindmap
  root((AI 核心概念))
    LLM
      猜下一个字
      GPT / Claude / Gemini
    Prompt
      你跟AI说的话
      角色+任务+格式+限制
    Token
      文字拆成小积木
    RAG
      先查资料再回答
      外部知识库
    Agent
      能干活儿的AI
      循环思考→执行
    CoT
      一步一步想
      提高推理准确率
    Embedding
      文字变成数字向量
    MCP
      AI界的USB接口

参考来源：

2026年AI核心概念全拆解 - CSDN

LLM：什么是大语言模型 - Google Developers

什么是 RAG - AWS

Chain-of-Thought Prompting - Prompt Engineering Guide

AI 必知概念速查手册

AI 必知概念速查手册

一、概念全景地图

二、15 个核心概念速查

基础层（每天都要用）

1. LLM（大语言模型）

2. Prompt（提示词）

3. Token（词元）

能力层（让 AI 变强的技术）

4. CoT（思维链）

5. RAG（检索增强生成）

6. Agent（智能体）

7. Context（上下文）

协议层（AI 如何连接世界）

8. MCP（模型上下文协议）

9. API（应用程序接口）

工程层（开发者需要理解的）

10. Embedding（词嵌入）

11. Vector DB（向量数据库）

12. Fine-tuning（微调）

13. Hallucination（幻觉）

14. Multimodal（多模态）

15. RLHF（人类反馈强化学习）

三、一句话总结全部

相关文章

2026 AI 新手学习路线图

AI 常见误区与 FAQ

AI 到底是什么？2026 版通俗解读