大模型通识学习笔记
一、为什么要学“大模型通识”
真正做 AI 应用时,很多人不是卡在“不会调 API”,而是卡在:
- 不知道大模型擅长什么
- 不知道提示词该怎么设计
- 不知道什么时候该上 RAG
- 不知道 Agent 到底是不是刚需
所以“大模型通识”并不是玄学,而是帮助你回答一个核心问题:
面对一个真实需求,应该怎样把大模型正确接进来
二、提示词(Prompt)到底是什么
Prompt 可以理解成:
你给模型的任务说明书
它通常包含这些部分:
- 角色设定
- 背景信息
- 任务目标
- 输出格式
- 限制条件
- 示例
2.1 Prompt 的常见分类
1. 按样例数量分
- Zero-shot:不给示例
- One-shot:给 1 个示例
- Few-shot:给多个示例
2. 按内容结构分
- 指令型 Prompt
- 角色扮演型 Prompt
- 格式约束型 Prompt
- 带检索上下文的 Prompt
2.2 Prompt 写得好到底好在哪
一个好 Prompt 的目标不是“写得长”,而是:
- 任务边界清晰
- 输出形式明确
- 模型知道优先级
- 模型知道什么不能做
2.3 常见 Prompt 误区
- 把所有要求堆成一段大白话
- 不限制输出格式
- 想让模型同时完成太多任务
- 没给示例,却希望模型 100% 稳定
三、上下文窗口意味着什么
上下文窗口指的是模型一次能“看到”的输入与历史内容总量。
这会直接影响:
- 能不能处理长文档
- 能不能做多轮对话
- 能不能把足够多的参考资料塞进去
但上下文长不代表效果一定更好。
如果塞进去的大量内容本身就杂乱,模型一样会困惑。
所以更重要的是:
- 上下文是否相关
- 信息是否结构化
- 是否有冗余噪音
四、RAG 什么时候需要上
RAG 的核心场景是:
- 模型内置知识不够
- 业务知识经常更新
- 你希望回答必须基于指定资料
4.1 RAG 解决的是哪两类问题
1. 知识冻结
模型训练完成后,它的知识不是实时更新的。
2. 幻觉
模型在不知道时,也可能一本正经地编。
RAG 的作用就是:
- 先检索资料
- 再把资料交给模型生成答案
4.2 不是所有场景都要上 RAG
以下情况不一定需要:
- 只是闲聊
- 只做通用写作
- 任务完全不依赖私有知识
所以判断标准不是“RAG 很火”,而是:
这个任务是不是强依赖外部知识
五、Agent 到底是什么
很多场景里,Agent 被说得很神秘。
其实可以先简单理解成:
具有任务分解、工具调用和流程决策能力的系统
它通常比单次问答更进一步,因为它会:
- 判断该做什么
- 决定调用哪个工具
- 根据工具结果继续下一步
5.1 Agent 不等于“会聊天”
聊天机器人可以只有对话能力;
但 Agent 往往还具备:
- 搜索
- 调接口
- 查数据库
- 执行工作流
5.2 什么场景适合 Agent
- 多步骤任务
- 需要工具联动
- 需要“看结果再决定下一步”
比如:
- 自动做资料搜集
- 先检索再总结
- 先调用 API 再组织答复
六、Workflow 和 Agent 的区别
这两个很容易混。
6.1 Workflow
更像:
人提前设计好的固定流程
优点:
- 稳定
- 可控
- 可复现
6.2 Agent
更像:
在给定目标后,由系统动态决定路径
优点:
- 灵活
- 适合复杂任务
缺点:
- 不稳定性更高
- 调试更难
6.3 实践建议
如果流程固定、可预见,优先 Workflow。
如果步骤依赖中间结果、需要动态决策,再考虑 Agent。
七、如何评价一个大模型应用是否做得好
很多人只看“模型回答得像不像人”。
但真正评估应用效果,应该至少看:
- 准确性
- 稳定性
- 时延
- 成本
- 可控性
- 可解释性
7.1 常见评估维度
1. 准确性
回答是不是对的。
2. 格式一致性
输出是不是总能符合要求。
3. 鲁棒性
换个问法后,系统是否还稳定。
4. 成本
同样效果下,是否花了过多 token 和模型费用。
八、做大模型应用时最常见的误区
8.1 把问题全归咎于模型
很多失败并不是模型不够强,而是:
- Prompt 混乱
- 检索质量差
- 工具链设计不合理
- 输出格式没约束
8.2 过度迷信“全自动”
越复杂的自动化系统,越需要:
- 明确边界
- 做失败兜底
- 提供人工接管点
8.3 只追最新模型,不重视系统设计
模型升级有帮助,但很多时候:
一个设计合理的系统 + 次顶级模型
比一个设计混乱的系统 + 顶级模型 更稳定
九、一个实用的学习路径
建议顺序:
- 先理解 Prompt
- 再理解上下文与 Token 限制
- 学 RAG
- 学工具调用
- 学 Workflow
- 最后学 Agent
这样比一上来堆所有概念更容易建立体系。
十、总结
大模型应用层真正要学的不是“神奇技巧”,而是:
- 怎样清晰表达任务
- 怎样给模型提供正确上下文
- 怎样在需要时引入检索和工具
- 怎样让输出稳定、可控、可评估
当你把 Prompt、RAG、Workflow、Agent 放在一张图里理解,很多概念都会突然清楚。


