一、这篇路线适合谁

这篇文章主要写给三类人:

  • 完全零基础,想系统学 AI 应用开发的人
  • 会一点工具使用,但还不会真正做项目的人
  • 已经接触过 Dify、Coze、ChatGPT,但知识点很散的人

如果你最后的目标是:

  • 看懂主流 AI 产品是怎么搭起来的
  • 自己做一个知识库问答、内容生成器或学习助手
  • 能把项目部署出来并持续迭代

那这条路线是合适的。


二、先给结论:零基础不要一上来就学 Agent

很多人一接触 AI,就被“智能体”“自动化”“多 Agent”这些词吸引住了,结果越学越乱。

更稳的顺序其实是:

  1. 先补开发基础
  2. 再建立大模型通识
  3. 再学 API 调用和 Prompt
  4. 再学 Embedding、向量数据库和 RAG
  5. 再学 Dify、Coze 这类工作流平台
  6. 最后再学 Agent 和完整项目

你可以把它理解成三句话:

先学会把环境跑起来
再学会把模型用起来
最后学会把系统做出来


三、阶段 0:先把开发基础补齐

很多人以为自己学的是 AI,最后卡住的却是:

  • 不会创建项目
  • 不会装依赖
  • 不会看终端报错
  • 不会用 Git 保存过程
  • 不会用 Docker 跑数据库和服务

所以第一阶段的重点不是“炫技”,而是把最基本的开发能力补上。

3.1 这一阶段必须掌握什么

建议至少补下面 5 项:

  1. Python 基础
    变量、函数、条件、循环、列表、字典、文件读写、模块、虚拟环境

  2. Git 基础
    cloneaddcommitpullpushbranchmerge

  3. 终端和 Linux 常用命令
    目录切换、文件操作、端口查看、进程查看、日志查看

  4. HTTP / JSON 基础
    要知道接口请求是什么、请求体是什么、JSON 长什么样

  5. Docker 基础
    镜像、容器、端口映射、数据卷、docker compose

3.2 为什么这一步不能跳

因为后面你无论学:

  • OpenAI API
  • Claude Code
  • Dify
  • RAG
  • 向量数据库

都会碰到这些场景:

  • 装依赖
  • 配环境变量
  • 看日志
  • 跑本地服务
  • 连数据库
  • 提交代码

开发基础不稳,后面的所有高级概念都只能停留在“看懂了几个名词”的层面。

3.3 推荐资料

3.4 可配合阅读的站内笔记

  • 《版本控制Git》
  • 《Linux 操作指南》
  • 《Docker操作指南》
  • 《Markdown语法教学》

3.5 学到什么程度算过关

至少做到下面几件事:

  1. 能在本地创建并运行一个 Python 项目
  2. 能从 GitHub 拉代码并提交一次改动
  3. 能看懂最常见的终端报错
  4. 能用 Docker 跑起一个数据库或服务

四、阶段 1:建立大模型通识

这个阶段的目标不是调模型,而是先把一些基础问题想明白:

  • 大模型到底是什么
  • 它为什么能回答问题
  • 它擅长什么,不擅长什么
  • Prompt、RAG、Workflow、Agent 分别解决什么问题

如果这一层没打通,后面很容易出现一种情况:

工具会点,名词会说,但不知道为什么这么配

4.1 这一阶段重点理解什么

建议先搞清楚这些概念:

  • Token
  • 上下文窗口
  • Prompt
  • Transformer
  • 预训练
  • SFT
  • 对齐训练
  • 幻觉
  • RAG
  • Workflow
  • Agent

4.2 更适合入门的学习顺序

推荐顺序是:

  1. 大模型是怎么“学会语言”的
  2. Prompt 为什么能影响结果
  3. 为什么模型会幻觉
  4. 为什么很多业务场景需要外部知识
  5. 为什么 Workflow 和 Agent 不是一回事

4.3 推荐资料

4.4 可配合阅读的站内笔记

  • 《大模型通识》
  • 《大模型原理》
  • 《Embeddings和向量数据库》

4.5 学到什么程度算过关

至少能清楚解释下面 3 个问题:

  1. 为什么“会聊天”不等于“会做业务”
  2. 为什么 Prompt 不能解决所有问题
  3. 为什么 RAG 和 Agent 都不是越早上越好

五、阶段 2:学会调用模型,而不是只会聊天

这一步是分水岭。

很多人会用现成 AI 工具,但不会自己调接口,不会控制输出格式,也不会把模型接进自己的程序。

如果你想做应用,这一步必须迈过去。

5.1 这一步要学什么

重点是这些能力:

  • 看懂官方 API 文档
  • 发送一次最基本的模型请求
  • 理解输入、输出、消息结构
  • 做结构化输出
  • 学会写第一版 Prompt
  • 会记录测试样例并比较效果

5.2 建议的练手顺序

建议从简单到复杂:

  1. 文本问答
  2. 文本总结
  3. 结构化提取
  4. 多轮对话
  5. 图像生成或图像理解
  6. 工具调用

5.3 为什么很多初学者总觉得“学不会”

常见原因不是模型太难,而是上来就做太大的东西。

更好的方式是每次只练一个能力,比如:

  • 只练“把一段文章提炼成 JSON”
  • 只练“把用户输入改写成更清楚的问题”
  • 只练“用一个模型接口完成单一任务”

先把“小能力”练稳,再去做大系统。

5.4 推荐资料

5.5 可配合阅读的站内笔记

  • 《Claude code使用教程》
  • 《AIGC图像生成》

5.6 学到什么程度算过关

至少能独立完成一个小程序:

  • 输入一段文本
  • 调用模型
  • 输出固定格式的结果
  • 能处理一两个常见报错

六、阶段 3:学 RAG,把知识接进应用

很多“看起来挺聪明”的 AI Demo,一旦离开通用知识就不行了。

比如:

  • 企业知识库问答
  • 产品文档问答
  • 课程资料检索
  • 私有资料总结

这时就不能只靠模型脑子里的旧知识,而要把你的资料接进来,这就是 RAG 最重要的价值。

6.1 学 RAG 时要理解的完整链路

一套最基本的 RAG 系统,通常至少包含:

  1. 文档读取
  2. 文档清洗
  3. 文档切分
  4. Embedding 向量化
  5. 向量存储
  6. 检索召回
  7. 必要时重排
  8. 把检索结果拼进 Prompt
  9. 生成最终回答
  10. 评估回答质量

6.2 初学者最容易踩的坑

  • 不切块,整篇直接喂模型
  • 只存文本,不存元数据
  • 检索不到也硬答
  • 只看生成效果,不测召回效果
  • 混淆关键词搜索和语义检索

6.3 推荐资料

6.4 可配合阅读的站内笔记

  • 《Embeddings和向量数据库》
  • 《RAG技术》

6.5 学到什么程度算过关

你至少要能做出一个最小版本:

  • 上传几篇文档
  • 能根据提问检索到相关片段
  • 能返回带上下文的答案
  • 知道答案是怎么来的

七、阶段 4:学 Dify 和 Coze,开始做工作流

当你已经知道模型接口怎么调,也知道 RAG 是怎么回事后,就可以开始学平台了。

7.1 为什么建议先学 Dify,再学 Coze

我更建议零基础先学 Dify,原因很简单:

  • 工作流节点更清楚
  • 知识库能力更直观
  • 更适合理解“一个 AI 应用是怎么编排起来的”

Coze 也很好上手,但更偏“快速把一个 Bot 或轻应用搭起来”。
如果底层概念还不牢,容易变成只会点界面。

7.2 这一阶段重点学什么

在平台里重点练这些能力:

  • 输入设计
  • Prompt 设计
  • 参数提取
  • 分支判断
  • 知识检索
  • 工具调用
  • 发布与调试

7.3 推荐资料

7.4 可配合阅读的站内笔记

  • 《Dify部署与应用》
  • 《Coze应用教程》

7.5 学到什么程度算过关

至少做出 1 个可分享的工作流应用,比如:

  • 文档问答助手
  • 内容生成器
  • 学习资料整理助手

八、阶段 5:最后再学 Agent

Agent 很重要,但不适合作为零基础第一站。

因为 Agent 不是“一个更厉害的聊天框”,而是把:

  • 模型
  • 工具
  • 状态
  • 决策
  • 失败兜底

这些东西都放到一起考虑。

8.1 什么情况下再学 Agent 最合适

当你已经会这些东西时,再学 Agent 会顺很多:

  • 会写 Prompt
  • 会调模型 API
  • 会搭 RAG
  • 会做工作流
  • 知道什么叫输入、输出、状态、工具

8.2 这一阶段重点理解什么

  • Agent 和 Workflow 的区别
  • 什么时候该让模型“自己决定下一步”
  • 工具调用怎么设计才稳
  • 多步任务怎么拆
  • 怎么做失败重试和人工接管
  • 怎么评估 Agent 是否真的有效

8.3 推荐资料

8.4 学到什么程度算过关

你能独立做一个简单 Agent,并回答清楚下面两个问题:

  1. 为什么这里必须用 Agent,而不是普通工作流
  2. 失败时系统如何停下来,而不是一直乱跑

九、阶段 6:开始做完整项目

知识只有放进项目里,才会真正变成能力。

对零基础来说,我更建议先做下面这 3 类项目。

9.1 项目 1:个人知识库问答助手

覆盖能力:

  • 文档处理
  • Embedding
  • 向量检索
  • RAG

适合练:

  • 文档切分
  • 检索质量
  • 回答可追溯

9.2 项目 2:内容生成工作流

比如:

  • 小红书文案生成
  • 公众号提纲整理
  • 多平台内容改写

覆盖能力:

  • Prompt
  • 结构化输出
  • Workflow

9.3 项目 3:学习助手或资料整理 Agent

比如:

  • 自动搜索资料并整理摘要
  • 根据课程资料生成学习清单
  • 从多份文档中提炼知识点

覆盖能力:

  • Agent
  • 工具调用
  • 多步任务编排

十、给零基础学习者的一份 12 周计划

如果你希望有更具体的时间安排,可以按这个节奏来:

第 1-2 周:开发基础

  • Python 基础语法
  • Git 基础
  • 终端基础
  • Docker 入门

输出成果:

  • 跑通一个本地 Python 小脚本
  • 用 Git 提交一次代码
  • 用 Docker 跑起一个服务

第 3-4 周:大模型通识 + Prompt

  • 理解大模型基础概念
  • 学 Prompt 设计
  • 知道上下文、幻觉、输出格式控制

输出成果:

  • 写出 3 组不同目标的 Prompt
  • 比较不同 Prompt 的效果差异

第 5-6 周:模型 API 调用

  • 跑通至少一个模型接口
  • 做文本总结、结构化提取、问答

输出成果:

  • 做一个可以运行的小工具

第 7-8 周:Embeddings + RAG

  • 学文档切分
  • 学向量化
  • 学向量数据库
  • 学检索与回答拼接

输出成果:

  • 做一个最小知识库问答 Demo

第 9-10 周:Dify / Coze 工作流

  • 用可视化平台做一个可分享应用
  • 练调试、分支、知识库接入

输出成果:

  • 发布一个工作流应用

第 11-12 周:完整项目 + 部署

  • 选一个方向做成完整项目
  • 补日志、评估、错误处理、部署

输出成果:

  • 一个能真正演示和复用的项目

十一、学习过程中最容易犯的 5 个错误

11.1 一上来就追最新名词

最容易让人焦虑的不是不会,而是学得太散。

新名词层出不穷,但真正有用的能力往往还是:

  • 调接口
  • 看日志
  • 搭检索
  • 做工作流
  • 做评估

11.2 只看视频,不自己做

看懂不等于会做。
每学完一个阶段,都要留下一个能运行的东西。

11.3 只看生成效果,不看系统设计

一个 AI 应用好不好,不只看回答像不像人,还要看:

  • 稳不稳定
  • 成本高不高
  • 能不能复现
  • 出错后怎么处理

11.4 过早依赖平台

平台很方便,但你至少要知道:

  • 节点背后做了什么
  • 为什么这样编排
  • 为什么这里要加检索或分支

11.5 不做记录

建议你把这些东西都记下来:

  • 用过的 Prompt
  • 成功样例
  • 失败样例
  • 参数设置
  • 系统结构图

长期来看,这些记录会比你看过多少教程更值钱。


十二、最后的建议

零基础学 AI 应用开发,不是比谁知道的名词多,而是比谁能一步一步把东西做出来。

真正有效的路线通常很朴素:

  1. 先把基础工具学会
  2. 再把模型接口调通
  3. 再把知识接进来
  4. 再把流程编排起来
  5. 最后再追求 Agent 和复杂系统

当你能独立做出一个:

  • 可以运行
  • 可以解释
  • 可以迭代
  • 可以部署

的项目时,你就已经不只是“会用 AI”,而是真的进入 AI 应用开发了。


参考资料