一、这篇路线适合谁

这篇文章主要写给三类人：

完全零基础，想系统学 AI 应用开发的人
会一点工具使用，但还不会真正做项目的人
已经接触过 Dify、Coze、ChatGPT，但知识点很散的人

如果你最后的目标是：

看懂主流 AI 产品是怎么搭起来的
自己做一个知识库问答、内容生成器或学习助手
能把项目部署出来并持续迭代

那这条路线是合适的。

二、先给结论：零基础不要一上来就学 Agent

很多人一接触 AI，就被“智能体”“自动化”“多 Agent”这些词吸引住了，结果越学越乱。

更稳的顺序其实是：

先补开发基础
再建立大模型通识
再学 API 调用和 Prompt
再学 Embedding、向量数据库和 RAG
再学 Dify、Coze 这类工作流平台
最后再学 Agent 和完整项目

你可以把它理解成三句话：

先学会把环境跑起来
再学会把模型用起来
最后学会把系统做出来

三、阶段 0：先把开发基础补齐

很多人以为自己学的是 AI，最后卡住的却是：

不会创建项目
不会装依赖
不会看终端报错
不会用 Git 保存过程
不会用 Docker 跑数据库和服务

所以第一阶段的重点不是“炫技”，而是把最基本的开发能力补上。

3.1 这一阶段必须掌握什么

建议至少补下面 5 项：

Python 基础
变量、函数、条件、循环、列表、字典、文件读写、模块、虚拟环境
Git 基础
clone、add、commit、pull、push、branch、merge
终端和 Linux 常用命令
目录切换、文件操作、端口查看、进程查看、日志查看
HTTP / JSON 基础
要知道接口请求是什么、请求体是什么、JSON 长什么样
Docker 基础
镜像、容器、端口映射、数据卷、docker compose

3.2 为什么这一步不能跳

因为后面你无论学：

OpenAI API
Claude Code
Dify
RAG
向量数据库

都会碰到这些场景：

装依赖
配环境变量
看日志
跑本地服务
连数据库
提交代码

开发基础不稳，后面的所有高级概念都只能停留在“看懂了几个名词”的层面。

3.3 推荐资料

Python 官方教程（简体中文）
https://docs.python.org/zh-cn/3/tutorial/index.html
Pro Git 中文版
https://git-scm.com/book/zh/v2
Docker Get Started
https://docs.docker.com/get-started/

3.4 可配合阅读的站内笔记

《版本控制Git》
《Linux 操作指南》
《Docker操作指南》
《Markdown语法教学》

3.5 学到什么程度算过关

至少做到下面几件事：

能在本地创建并运行一个 Python 项目
能从 GitHub 拉代码并提交一次改动
能看懂最常见的终端报错
能用 Docker 跑起一个数据库或服务

四、阶段 1：建立大模型通识

这个阶段的目标不是调模型，而是先把一些基础问题想明白：

大模型到底是什么
它为什么能回答问题
它擅长什么，不擅长什么
Prompt、RAG、Workflow、Agent 分别解决什么问题

如果这一层没打通，后面很容易出现一种情况：

工具会点，名词会说，但不知道为什么这么配

4.1 这一阶段重点理解什么

建议先搞清楚这些概念：

Token
上下文窗口
Prompt
Transformer
预训练
SFT
对齐训练
幻觉
RAG
Workflow
Agent

4.2 更适合入门的学习顺序

推荐顺序是：

大模型是怎么“学会语言”的
Prompt 为什么能影响结果
为什么模型会幻觉
为什么很多业务场景需要外部知识
为什么 Workflow 和 Agent 不是一回事

4.3 推荐资料

Hugging Face LLM Course
https://huggingface.co/course
Anthropic Prompt Engineering Overview
https://docs.anthropic.com/en/docs/prompt-engineering

4.4 可配合阅读的站内笔记

《大模型通识》
《大模型原理》
《Embeddings和向量数据库》

4.5 学到什么程度算过关

至少能清楚解释下面 3 个问题：

为什么“会聊天”不等于“会做业务”
为什么 Prompt 不能解决所有问题
为什么 RAG 和 Agent 都不是越早上越好

五、阶段 2：学会调用模型，而不是只会聊天

这一步是分水岭。

很多人会用现成 AI 工具，但不会自己调接口，不会控制输出格式，也不会把模型接进自己的程序。

如果你想做应用，这一步必须迈过去。

5.1 这一步要学什么

重点是这些能力：

看懂官方 API 文档
发送一次最基本的模型请求
理解输入、输出、消息结构
做结构化输出
学会写第一版 Prompt
会记录测试样例并比较效果

5.2 建议的练手顺序

建议从简单到复杂：

文本问答
文本总结
结构化提取
多轮对话
图像生成或图像理解
工具调用

5.3 为什么很多初学者总觉得“学不会”

常见原因不是模型太难，而是上来就做太大的东西。

更好的方式是每次只练一个能力，比如：

只练“把一段文章提炼成 JSON”
只练“把用户输入改写成更清楚的问题”
只练“用一个模型接口完成单一任务”

先把“小能力”练稳，再去做大系统。

5.4 推荐资料

OpenAI 平台总览
https://platform.openai.com/docs/overview
OpenAI Tutorials
https://platform.openai.com/docs/tutorials
Anthropic Prompt Engineering
https://docs.anthropic.com/en/docs/prompt-engineering
Claude Code Overview
https://docs.anthropic.com/en/docs/claude-code/overview

5.5 可配合阅读的站内笔记

《Claude code使用教程》
《AIGC图像生成》

5.6 学到什么程度算过关

至少能独立完成一个小程序：

输入一段文本
调用模型
输出固定格式的结果
能处理一两个常见报错

六、阶段 3：学 RAG，把知识接进应用

很多“看起来挺聪明”的 AI Demo，一旦离开通用知识就不行了。

比如：

企业知识库问答
产品文档问答
课程资料检索
私有资料总结

这时就不能只靠模型脑子里的旧知识，而要把你的资料接进来，这就是 RAG 最重要的价值。

6.1 学 RAG 时要理解的完整链路

一套最基本的 RAG 系统，通常至少包含：

文档读取
文档清洗
文档切分
Embedding 向量化
向量存储
检索召回
必要时重排
把检索结果拼进 Prompt
生成最终回答
评估回答质量

6.2 初学者最容易踩的坑

不切块，整篇直接喂模型
只存文本，不存元数据
检索不到也硬答
只看生成效果，不测召回效果
混淆关键词搜索和语义检索

6.3 推荐资料

OpenAI Embeddings Guide
https://platform.openai.com/docs/guides/embeddings
LangChain RAG Tutorial
https://python.langchain.com/docs/tutorials/rag/
pgvector
https://github.com/pgvector/pgvector
Dify Knowledge Base
https://docs.dify.ai/en/guides/knowledge-base

6.4 可配合阅读的站内笔记

《Embeddings和向量数据库》
《RAG技术》

6.5 学到什么程度算过关

你至少要能做出一个最小版本：

上传几篇文档
能根据提问检索到相关片段
能返回带上下文的答案
知道答案是怎么来的

七、阶段 4：学 Dify 和 Coze，开始做工作流

当你已经知道模型接口怎么调，也知道 RAG 是怎么回事后，就可以开始学平台了。

7.1 为什么建议先学 Dify，再学 Coze

我更建议零基础先学 Dify，原因很简单：

工作流节点更清楚
知识库能力更直观
更适合理解“一个 AI 应用是怎么编排起来的”

Coze 也很好上手，但更偏“快速把一个 Bot 或轻应用搭起来”。
如果底层概念还不牢，容易变成只会点界面。

7.2 这一阶段重点学什么

在平台里重点练这些能力：

输入设计
Prompt 设计
参数提取
分支判断
知识检索
工具调用
发布与调试

7.3 推荐资料

Dify 30-Minute Quick Start
https://docs.dify.ai/en/use-dify/getting-started/quick-start
Dify Workflow & Chatflow
https://docs.dify.ai/en/use-dify/build/workflow-chatflow
Dify Chunking Guide
https://docs.dify.ai/en/guides/knowledge-base/create-knowledge-and-upload-documents/chunking-and-cleaning-text

7.4 可配合阅读的站内笔记

《Dify部署与应用》
《Coze应用教程》

7.5 学到什么程度算过关

至少做出 1 个可分享的工作流应用，比如：

文档问答助手
内容生成器
学习资料整理助手

八、阶段 5：最后再学 Agent

Agent 很重要，但不适合作为零基础第一站。

因为 Agent 不是“一个更厉害的聊天框”，而是把：

模型
工具
状态
决策
失败兜底

这些东西都放到一起考虑。

8.1 什么情况下再学 Agent 最合适

当你已经会这些东西时，再学 Agent 会顺很多：

会写 Prompt
会调模型 API
会搭 RAG
会做工作流
知道什么叫输入、输出、状态、工具

8.2 这一阶段重点理解什么

Agent 和 Workflow 的区别
什么时候该让模型“自己决定下一步”
工具调用怎么设计才稳
多步任务怎么拆
怎么做失败重试和人工接管
怎么评估 Agent 是否真的有效

8.3 推荐资料

OpenAI 平台总览中的 Agentic Applications 入口
https://platform.openai.com/docs/overview
Hugging Face Agents Course
https://huggingface.co/learn/agents-course/en/unit0/introduction

8.4 学到什么程度算过关

你能独立做一个简单 Agent，并回答清楚下面两个问题：

为什么这里必须用 Agent，而不是普通工作流
失败时系统如何停下来，而不是一直乱跑

九、阶段 6：开始做完整项目

知识只有放进项目里，才会真正变成能力。

对零基础来说，我更建议先做下面这 3 类项目。

9.1 项目 1：个人知识库问答助手

覆盖能力：

文档处理
Embedding
向量检索
RAG

适合练：

文档切分
检索质量
回答可追溯

9.2 项目 2：内容生成工作流

比如：

小红书文案生成
公众号提纲整理
多平台内容改写

覆盖能力：

Prompt
结构化输出
Workflow

9.3 项目 3：学习助手或资料整理 Agent

比如：

自动搜索资料并整理摘要
根据课程资料生成学习清单
从多份文档中提炼知识点

覆盖能力：

Agent
工具调用
多步任务编排

十、给零基础学习者的一份 12 周计划

如果你希望有更具体的时间安排，可以按这个节奏来：

第 1-2 周：开发基础

Python 基础语法
Git 基础
终端基础
Docker 入门

输出成果：

跑通一个本地 Python 小脚本
用 Git 提交一次代码
用 Docker 跑起一个服务

第 3-4 周：大模型通识 + Prompt

理解大模型基础概念
学 Prompt 设计
知道上下文、幻觉、输出格式控制

输出成果：

写出 3 组不同目标的 Prompt
比较不同 Prompt 的效果差异

第 5-6 周：模型 API 调用

跑通至少一个模型接口
做文本总结、结构化提取、问答

输出成果：

做一个可以运行的小工具

第 7-8 周：Embeddings + RAG

学文档切分
学向量化
学向量数据库
学检索与回答拼接

输出成果：

做一个最小知识库问答 Demo

第 9-10 周：Dify / Coze 工作流

用可视化平台做一个可分享应用
练调试、分支、知识库接入

输出成果：

发布一个工作流应用

第 11-12 周：完整项目 + 部署

选一个方向做成完整项目
补日志、评估、错误处理、部署

输出成果：

一个能真正演示和复用的项目

十一、学习过程中最容易犯的 5 个错误

11.1 一上来就追最新名词

最容易让人焦虑的不是不会，而是学得太散。

新名词层出不穷，但真正有用的能力往往还是：

调接口
看日志
搭检索
做工作流
做评估

11.2 只看视频，不自己做

看懂不等于会做。
每学完一个阶段，都要留下一个能运行的东西。

11.3 只看生成效果，不看系统设计

一个 AI 应用好不好，不只看回答像不像人，还要看：

稳不稳定
成本高不高
能不能复现
出错后怎么处理

11.4 过早依赖平台

平台很方便，但你至少要知道：

节点背后做了什么
为什么这样编排
为什么这里要加检索或分支

11.5 不做记录

建议你把这些东西都记下来：

用过的 Prompt
成功样例
失败样例
参数设置
系统结构图

长期来看，这些记录会比你看过多少教程更值钱。

十二、最后的建议

零基础学 AI 应用开发，不是比谁知道的名词多，而是比谁能一步一步把东西做出来。

真正有效的路线通常很朴素：

先把基础工具学会
再把模型接口调通
再把知识接进来
再把流程编排起来
最后再追求 Agent 和复杂系统

当你能独立做出一个：

可以运行
可以解释
可以迭代
可以部署

的项目时，你就已经不只是“会用 AI”，而是真的进入 AI 应用开发了。

参考资料

Python 官方教程：https://docs.python.org/zh-cn/3/tutorial/index.html
Pro Git 中文版：https://git-scm.com/book/zh/v2
Docker Get Started：https://docs.docker.com/get-started/
OpenAI Docs Overview：https://platform.openai.com/docs/overview
OpenAI Tutorials：https://platform.openai.com/docs/tutorials
OpenAI Embeddings Guide：https://platform.openai.com/docs/guides/embeddings
Anthropic Prompt Engineering：https://docs.anthropic.com/en/docs/prompt-engineering
Claude Code Overview：https://docs.anthropic.com/en/docs/claude-code/overview
Hugging Face LLM Course：https://huggingface.co/course
Hugging Face Agents Course：https://huggingface.co/learn/agents-course/en/unit0/introduction
Dify Docs：https://docs.dify.ai/
LangChain RAG Tutorial：https://python.langchain.com/docs/tutorials/rag/
pgvector：https://github.com/pgvector/pgvector