AI 必知概念速查手册

AI必知概念速查手册:LLM、RAG、Agent、多模态等核心概念的系统化梳理与通俗解释。

A
AGISeed Team
AGISeed 作者

AI 必知概念速查手册

编者按:LLM、RAG、Agent、MCP、Prompt、Embedding、Fine-tuning……AI 领域的”黑话”越来越多,新人常常被绕晕。这篇文章基于 CSDN 2026 年最新技术解读和 Google Machine Learning 官方文档,按使用频率精选 15 个核心概念,每个概念一句话解释 + 一张类比图 + 一个例子,让你 10 分钟扫清认知障碍。


一、概念全景地图

%%{init: {'theme': 'dark', 'themeVariables': {'primaryColor': '#4a9eff', 'lineColor': '#888'}}}%%
graph TB
    subgraph 基础层
        LLM["LLM<br/>大语言模型"]
        Prompt["Prompt<br/>提示词"]
        Token["Token<br/>词元"]
    end
    subgraph 能力层
        CoT["CoT 思维链"]
        RAG["RAG<br/>检索增强"]
        Agent["Agent<br/>智能体"]
    end
    subgraph 协议层
        MCP["MCP<br/>上下文协议"]
        API["API<br/>接口"]
    end
    subgraph 工程层
        Embedding["Embedding<br/>词嵌入"]
        VectorDB["向量数据库"]
        FT["Fine-tuning<br/>微调"]
    end
    
    LLM --- Prompt --- Token
    Prompt --- CoT
    LLM --- RAG --- Agent
    Agent --- MCP --- API
    RAG --- Embedding --- VectorDB
    LLM --- FT
    
    style LLM fill:#e74c3c,color:#fff
    style Agent fill:#4a9eff,color:#fff
    style RAG fill:#2ecc71,color:#fff

二、15 个核心概念速查

基础层(每天都要用)

1. LLM(大语言模型)

一句话:用海量文本训练出的”超级文字接龙选手”,会根据上文预测下一个最可能出现的词。

类比:心脏,提供所有智能的基础能力。

例子:GPT-5、Claude 4、Gemini 2.5、DeepSeek、Llama 4 都是 LLM。


2. Prompt(提示词)

一句话:你跟 AI 说的所有话,包含背景、指令、格式要求。

类比:给 AI 的任务书。

四个要素

角色:你是一位资深产品经理
任务:帮我写一份用户调研报告
格式:用 Markdown,包含"背景-方法-发现-建议"四部分
限制:字数不超过 2000 字,不要编造数据

3. Token(词元)

一句话:AI 理解文本的最小单位——不一定是”字”,可能是”字/词/词组”。

类比:就像乐高——AI 把一篇文字拆成小积木,一个一个拼。

例子

  • “Hello World” → 约 2-3 个 token
  • 一篇 2000 字文章 → 约 1500-3000 个 token
  • GPT-5 上下文窗口:约 200K tokens(约 15 万汉字)

能力层(让 AI 变强的技术)

4. CoT(思维链)

一句话:让 AI “一步一步想”的提示技巧,显著提高复杂推理准确率。

类比:老师让你”写出解题过程”,而不只是写答案。

例子

❌ 普通提问:"28×34=?"
✅ CoT 提问:"28×34=?请一步一步计算。"

AI 输出:
1. 34 = 30 + 4
2. 28×30 = 840
3. 28×4 = 112
4. 840+112 = 952
5. 答案:952

5. RAG(检索增强生成)

一句话:在 AI 回答之前,先从外部知识库找到相关信息,再一起喂给 AI。

类比:AI 的”外挂记忆”——让它先查资料再回答,不再胡说八道。

三个步骤

1. 检索:从知识库找相关内容
2. 增强:把找到的内容附在问题后面
3. 生成:AI 基于 "问题 + 检索结果" 生成回答

典型技术栈:LangChain + ChromaDB + OpenAI API


6. Agent(智能体)

一句话:能自主感知环境、做出决策并执行行动的 AI 系统。

类比:ChatBot 是”客服”(你问它答),Agent 是”助理”(交任务,它自己想办法完成)。

核心循环

while True:
    observed = 检测环境变化()
    thought = LLM.推理(observed)  # AI 决定下一步做什么
    action = 执行(thought)         # 调用工具/API/代码

真实产品:Claude Computer Use、OpenAI Operator


7. Context(上下文)

一句话:Prompt 里的背景信息——告诉 AI”你是谁、在什么场景下、有什么需求”。

类比:你在点菜前告诉服务员”我们是 10 个人、预算 500 元、有素食者”。

例子

没有 Context:"帮我写总结" → AI 写的很泛
有 Context:"我是一家 SaaS 公司的产品经理,刚做完用户调研,
          帮我写一份 500 字的核心发现总结,给 CTO 看"

协议层(AI 如何连接世界)

8. MCP(模型上下文协议)

一句话:AI 领域的”USB-C 接口”——让 AI 能安全、标准化地连接外部工具和数据。

类比:蓝牙——不同设备(AI 和工具)能通过统一标准通信。

作用:以前每个 AI 工具要单独对接每个 API(M×N 工作量),有了 MCP 后只需实现一次协议(M+N 工作量)。


9. API(应用程序接口)

一句话:就像餐厅的服务员——你告诉它要什么,它传给厨房(服务端),再把菜端回来。

类比:血管——信息在不同系统之间流动的通道。

例子

import requests
response = requests.post(
    "https://api.openai.com/v1/chat/completions",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={"model": "gpt-5", "messages": [{"role": "user", "content": "你好"}]}
)

工程层(开发者需要理解的)

10. Embedding(词嵌入)

一句话:把文字变成一串数字(向量),让计算机能”理解”文字之间的相似度。

类比:地图上的坐标——两个坐标点越近,含义越相似。

例子

"咖啡" → [0.8, -0.3, 0.5, 0.1, ...]  (一个 1536 维的向量)
"茶"   → [0.7, -0.2, 0.4, 0.2, ...]
"手机" → [0.1, 0.8, -0.6, 0.9, ...]

相似度("咖啡", "茶") > 相似度("咖啡", "手机")  ✅

11. Vector DB(向量数据库)

一句话:专门存储和搜索”向量”的数据库,是 RAG 的核心组件。

类比:一个能”按含义搜”而不是”按关键词搜”的超级索引。

主流选择

数据库特点适用
ChromaDB开源、轻量、Python 原生个人项目、小团队
Qdrant高性能、支持过滤生产环境
Pinecone全托管、Serverless不想运维
Milvus分布式、大规模企业级

12. Fine-tuning(微调)

一句话:在已有的 LLM 基础上,用你自己的数据再”培训”一下,让它更擅长你的领域。

类比:一个通才医生,再进修一年心内科,变成心脏专家。

什么时候需要微调?

  • ✅ 你需要 AI 持续输出某种特定风格/格式
  • ✅ 你有大量高质量私有数据(1000+ 条)
  • ❌ 你只是想接入几个文档 → 用 RAG 更合适
  • ❌ 你的数据经常变化 → 用 RAG 更灵活

13. Hallucination(幻觉)

一句话:AI “一本正经地胡说八道”——生成的内容看起来合理,但实际上是编造的。

类比:一个特别能侃的人,不懂装懂,还能说得头头是道。

减少幻觉的办法

  1. 用 RAG:让 AI 先查资料再回答
  2. 限制回答范围:“不确定就说不知道”
  3. 要求引用来源:“回答时请标注出处”
  4. 用 CoT:强制 AI 展示推理过程

14. Multimodal(多模态)

一句话:AI 不再只”看文字”,还能”看图/听声/看视频/看代码”。

类比:人类理解世界靠五感(视觉+听觉+触觉),多模态 AI 也能通过多种”感官”理解信息。

2026 年能做到什么?

  • 贴一张截图 → AI 识别内容并分析
  • 上传 PDF → AI 理解全文并总结
  • 共享屏幕 → AI 实时看到并给出建议
  • 短视频 → AI 理解内容并生成文字描述

15. RLHF(人类反馈强化学习)

一句话:让人类标注员对 AI 的回答”打分”,AI 根据分数调整自己,变得更”听话”。

类比:教狗做”坐下”——做对了给零食(高分),做错了不理(低分)。

为什么重要:没有 RLHF 的 LLM 像个”什么都会说但不懂分寸的天才”,有了 RLHF 才变成”会看场合说话的成年人”。


三、一句话总结全部

%%{init: {'theme': 'dark', 'themeVariables': {'primaryColor': '#4a9eff', 'lineColor': '#888', 'textColor': '#fff'}}}%%
mindmap
  root((AI 核心概念))
    LLM
      猜下一个字
      GPT / Claude / Gemini
    Prompt
      你跟AI说的话
      角色+任务+格式+限制
    Token
      文字拆成小积木
    RAG
      先查资料再回答
      外部知识库
    Agent
      能干活儿的AI
      循环思考→执行
    CoT
      一步一步想
      提高推理准确率
    Embedding
      文字变成数字向量
    MCP
      AI界的USB接口

参考来源

相关文章

快速入门

2026 AI 新手学习路线图

2026年AI新手学习路线图:从编程基础到Prompt工程、Agent开发、模型部署的完整进阶路径。

阅读更多
快速入门

AI 常见误区与 FAQ

AI常见误区与FAQ:澄清关于AI的12个常见误解,从AGI焦虑到AI替代人工的真相。

阅读更多
快速入门

AI 到底是什么?2026 版通俗解读

2026年AI通俗解读:用5分钟建立对大语言模型、生成式AI和智能代理的清晰认知框架。

阅读更多