一、为什么要学“大模型通识”

真正做 AI 应用时,很多人不是卡在“不会调 API”,而是卡在:

  • 不知道大模型擅长什么
  • 不知道提示词该怎么设计
  • 不知道什么时候该上 RAG
  • 不知道 Agent 到底是不是刚需

所以“大模型通识”并不是玄学,而是帮助你回答一个核心问题:

面对一个真实需求,应该怎样把大模型正确接进来

二、提示词(Prompt)到底是什么

Prompt 可以理解成:

你给模型的任务说明书

它通常包含这些部分:

  • 角色设定
  • 背景信息
  • 任务目标
  • 输出格式
  • 限制条件
  • 示例

2.1 Prompt 的常见分类

1. 按样例数量分

  • Zero-shot:不给示例
  • One-shot:给 1 个示例
  • Few-shot:给多个示例

2. 按内容结构分

  • 指令型 Prompt
  • 角色扮演型 Prompt
  • 格式约束型 Prompt
  • 带检索上下文的 Prompt

2.2 Prompt 写得好到底好在哪

一个好 Prompt 的目标不是“写得长”,而是:

  • 任务边界清晰
  • 输出形式明确
  • 模型知道优先级
  • 模型知道什么不能做

2.3 常见 Prompt 误区

  • 把所有要求堆成一段大白话
  • 不限制输出格式
  • 想让模型同时完成太多任务
  • 没给示例,却希望模型 100% 稳定

三、上下文窗口意味着什么

上下文窗口指的是模型一次能“看到”的输入与历史内容总量。

这会直接影响:

  • 能不能处理长文档
  • 能不能做多轮对话
  • 能不能把足够多的参考资料塞进去

但上下文长不代表效果一定更好。
如果塞进去的大量内容本身就杂乱,模型一样会困惑。

所以更重要的是:

  • 上下文是否相关
  • 信息是否结构化
  • 是否有冗余噪音

四、RAG 什么时候需要上

RAG 的核心场景是:

  • 模型内置知识不够
  • 业务知识经常更新
  • 你希望回答必须基于指定资料

4.1 RAG 解决的是哪两类问题

1. 知识冻结

模型训练完成后,它的知识不是实时更新的。

2. 幻觉

模型在不知道时,也可能一本正经地编。

RAG 的作用就是:

  • 先检索资料
  • 再把资料交给模型生成答案

4.2 不是所有场景都要上 RAG

以下情况不一定需要:

  • 只是闲聊
  • 只做通用写作
  • 任务完全不依赖私有知识

所以判断标准不是“RAG 很火”,而是:

这个任务是不是强依赖外部知识

五、Agent 到底是什么

很多场景里,Agent 被说得很神秘。
其实可以先简单理解成:

具有任务分解、工具调用和流程决策能力的系统

它通常比单次问答更进一步,因为它会:

  • 判断该做什么
  • 决定调用哪个工具
  • 根据工具结果继续下一步

5.1 Agent 不等于“会聊天”

聊天机器人可以只有对话能力;
但 Agent 往往还具备:

  • 搜索
  • 调接口
  • 查数据库
  • 执行工作流

5.2 什么场景适合 Agent

  • 多步骤任务
  • 需要工具联动
  • 需要“看结果再决定下一步”

比如:

  • 自动做资料搜集
  • 先检索再总结
  • 先调用 API 再组织答复

六、Workflow 和 Agent 的区别

这两个很容易混。

6.1 Workflow

更像:

人提前设计好的固定流程

优点:

  • 稳定
  • 可控
  • 可复现

6.2 Agent

更像:

在给定目标后,由系统动态决定路径

优点:

  • 灵活
  • 适合复杂任务

缺点:

  • 不稳定性更高
  • 调试更难

6.3 实践建议

如果流程固定、可预见,优先 Workflow。
如果步骤依赖中间结果、需要动态决策,再考虑 Agent。

七、如何评价一个大模型应用是否做得好

很多人只看“模型回答得像不像人”。
但真正评估应用效果,应该至少看:

  • 准确性
  • 稳定性
  • 时延
  • 成本
  • 可控性
  • 可解释性

7.1 常见评估维度

1. 准确性

回答是不是对的。

2. 格式一致性

输出是不是总能符合要求。

3. 鲁棒性

换个问法后,系统是否还稳定。

4. 成本

同样效果下,是否花了过多 token 和模型费用。

八、做大模型应用时最常见的误区

8.1 把问题全归咎于模型

很多失败并不是模型不够强,而是:

  • Prompt 混乱
  • 检索质量差
  • 工具链设计不合理
  • 输出格式没约束

8.2 过度迷信“全自动”

越复杂的自动化系统,越需要:

  • 明确边界
  • 做失败兜底
  • 提供人工接管点

8.3 只追最新模型,不重视系统设计

模型升级有帮助,但很多时候:

一个设计合理的系统 + 次顶级模型
比一个设计混乱的系统 + 顶级模型 更稳定

九、一个实用的学习路径

建议顺序:

  1. 先理解 Prompt
  2. 再理解上下文与 Token 限制
  3. 学 RAG
  4. 学工具调用
  5. 学 Workflow
  6. 最后学 Agent

这样比一上来堆所有概念更容易建立体系。

十、总结

大模型应用层真正要学的不是“神奇技巧”,而是:

  • 怎样清晰表达任务
  • 怎样给模型提供正确上下文
  • 怎样在需要时引入检索和工具
  • 怎样让输出稳定、可控、可评估

当你把 Prompt、RAG、Workflow、Agent 放在一张图里理解,很多概念都会突然清楚。