AI 应用开发学习路线
一、这篇路线适合谁
这篇文章主要写给三类人:
- 完全零基础,想系统学 AI 应用开发的人
- 会一点工具使用,但还不会真正做项目的人
- 已经接触过 Dify、Coze、ChatGPT,但知识点很散的人
如果你最后的目标是:
- 看懂主流 AI 产品是怎么搭起来的
- 自己做一个知识库问答、内容生成器或学习助手
- 能把项目部署出来并持续迭代
那这条路线是合适的。
二、先给结论:零基础不要一上来就学 Agent
很多人一接触 AI,就被“智能体”“自动化”“多 Agent”这些词吸引住了,结果越学越乱。
更稳的顺序其实是:
- 先补开发基础
- 再建立大模型通识
- 再学 API 调用和 Prompt
- 再学 Embedding、向量数据库和 RAG
- 再学 Dify、Coze 这类工作流平台
- 最后再学 Agent 和完整项目
你可以把它理解成三句话:
先学会把环境跑起来
再学会把模型用起来
最后学会把系统做出来
三、阶段 0:先把开发基础补齐
很多人以为自己学的是 AI,最后卡住的却是:
- 不会创建项目
- 不会装依赖
- 不会看终端报错
- 不会用 Git 保存过程
- 不会用 Docker 跑数据库和服务
所以第一阶段的重点不是“炫技”,而是把最基本的开发能力补上。
3.1 这一阶段必须掌握什么
建议至少补下面 5 项:
-
Python 基础
变量、函数、条件、循环、列表、字典、文件读写、模块、虚拟环境 -
Git 基础
clone、add、commit、pull、push、branch、merge -
终端和 Linux 常用命令
目录切换、文件操作、端口查看、进程查看、日志查看 -
HTTP / JSON 基础
要知道接口请求是什么、请求体是什么、JSON 长什么样 -
Docker 基础
镜像、容器、端口映射、数据卷、docker compose
3.2 为什么这一步不能跳
因为后面你无论学:
- OpenAI API
- Claude Code
- Dify
- RAG
- 向量数据库
都会碰到这些场景:
- 装依赖
- 配环境变量
- 看日志
- 跑本地服务
- 连数据库
- 提交代码
开发基础不稳,后面的所有高级概念都只能停留在“看懂了几个名词”的层面。
3.3 推荐资料
- Python 官方教程(简体中文)
https://docs.python.org/zh-cn/3/tutorial/index.html - Pro Git 中文版
https://git-scm.com/book/zh/v2 - Docker Get Started
https://docs.docker.com/get-started/
3.4 可配合阅读的站内笔记
- 《版本控制Git》
- 《Linux 操作指南》
- 《Docker操作指南》
- 《Markdown语法教学》
3.5 学到什么程度算过关
至少做到下面几件事:
- 能在本地创建并运行一个 Python 项目
- 能从 GitHub 拉代码并提交一次改动
- 能看懂最常见的终端报错
- 能用 Docker 跑起一个数据库或服务
四、阶段 1:建立大模型通识
这个阶段的目标不是调模型,而是先把一些基础问题想明白:
- 大模型到底是什么
- 它为什么能回答问题
- 它擅长什么,不擅长什么
- Prompt、RAG、Workflow、Agent 分别解决什么问题
如果这一层没打通,后面很容易出现一种情况:
工具会点,名词会说,但不知道为什么这么配
4.1 这一阶段重点理解什么
建议先搞清楚这些概念:
- Token
- 上下文窗口
- Prompt
- Transformer
- 预训练
- SFT
- 对齐训练
- 幻觉
- RAG
- Workflow
- Agent
4.2 更适合入门的学习顺序
推荐顺序是:
- 大模型是怎么“学会语言”的
- Prompt 为什么能影响结果
- 为什么模型会幻觉
- 为什么很多业务场景需要外部知识
- 为什么 Workflow 和 Agent 不是一回事
4.3 推荐资料
- Hugging Face LLM Course
https://huggingface.co/course - Anthropic Prompt Engineering Overview
https://docs.anthropic.com/en/docs/prompt-engineering
4.4 可配合阅读的站内笔记
- 《大模型通识》
- 《大模型原理》
- 《Embeddings和向量数据库》
4.5 学到什么程度算过关
至少能清楚解释下面 3 个问题:
- 为什么“会聊天”不等于“会做业务”
- 为什么 Prompt 不能解决所有问题
- 为什么 RAG 和 Agent 都不是越早上越好
五、阶段 2:学会调用模型,而不是只会聊天
这一步是分水岭。
很多人会用现成 AI 工具,但不会自己调接口,不会控制输出格式,也不会把模型接进自己的程序。
如果你想做应用,这一步必须迈过去。
5.1 这一步要学什么
重点是这些能力:
- 看懂官方 API 文档
- 发送一次最基本的模型请求
- 理解输入、输出、消息结构
- 做结构化输出
- 学会写第一版 Prompt
- 会记录测试样例并比较效果
5.2 建议的练手顺序
建议从简单到复杂:
- 文本问答
- 文本总结
- 结构化提取
- 多轮对话
- 图像生成或图像理解
- 工具调用
5.3 为什么很多初学者总觉得“学不会”
常见原因不是模型太难,而是上来就做太大的东西。
更好的方式是每次只练一个能力,比如:
- 只练“把一段文章提炼成 JSON”
- 只练“把用户输入改写成更清楚的问题”
- 只练“用一个模型接口完成单一任务”
先把“小能力”练稳,再去做大系统。
5.4 推荐资料
- OpenAI 平台总览
https://platform.openai.com/docs/overview - OpenAI Tutorials
https://platform.openai.com/docs/tutorials - Anthropic Prompt Engineering
https://docs.anthropic.com/en/docs/prompt-engineering - Claude Code Overview
https://docs.anthropic.com/en/docs/claude-code/overview
5.5 可配合阅读的站内笔记
- 《Claude code使用教程》
- 《AIGC图像生成》
5.6 学到什么程度算过关
至少能独立完成一个小程序:
- 输入一段文本
- 调用模型
- 输出固定格式的结果
- 能处理一两个常见报错
六、阶段 3:学 RAG,把知识接进应用
很多“看起来挺聪明”的 AI Demo,一旦离开通用知识就不行了。
比如:
- 企业知识库问答
- 产品文档问答
- 课程资料检索
- 私有资料总结
这时就不能只靠模型脑子里的旧知识,而要把你的资料接进来,这就是 RAG 最重要的价值。
6.1 学 RAG 时要理解的完整链路
一套最基本的 RAG 系统,通常至少包含:
- 文档读取
- 文档清洗
- 文档切分
- Embedding 向量化
- 向量存储
- 检索召回
- 必要时重排
- 把检索结果拼进 Prompt
- 生成最终回答
- 评估回答质量
6.2 初学者最容易踩的坑
- 不切块,整篇直接喂模型
- 只存文本,不存元数据
- 检索不到也硬答
- 只看生成效果,不测召回效果
- 混淆关键词搜索和语义检索
6.3 推荐资料
- OpenAI Embeddings Guide
https://platform.openai.com/docs/guides/embeddings - LangChain RAG Tutorial
https://python.langchain.com/docs/tutorials/rag/ - pgvector
https://github.com/pgvector/pgvector - Dify Knowledge Base
https://docs.dify.ai/en/guides/knowledge-base
6.4 可配合阅读的站内笔记
- 《Embeddings和向量数据库》
- 《RAG技术》
6.5 学到什么程度算过关
你至少要能做出一个最小版本:
- 上传几篇文档
- 能根据提问检索到相关片段
- 能返回带上下文的答案
- 知道答案是怎么来的
七、阶段 4:学 Dify 和 Coze,开始做工作流
当你已经知道模型接口怎么调,也知道 RAG 是怎么回事后,就可以开始学平台了。
7.1 为什么建议先学 Dify,再学 Coze
我更建议零基础先学 Dify,原因很简单:
- 工作流节点更清楚
- 知识库能力更直观
- 更适合理解“一个 AI 应用是怎么编排起来的”
Coze 也很好上手,但更偏“快速把一个 Bot 或轻应用搭起来”。
如果底层概念还不牢,容易变成只会点界面。
7.2 这一阶段重点学什么
在平台里重点练这些能力:
- 输入设计
- Prompt 设计
- 参数提取
- 分支判断
- 知识检索
- 工具调用
- 发布与调试
7.3 推荐资料
- Dify 30-Minute Quick Start
https://docs.dify.ai/en/use-dify/getting-started/quick-start - Dify Workflow & Chatflow
https://docs.dify.ai/en/use-dify/build/workflow-chatflow - Dify Chunking Guide
https://docs.dify.ai/en/guides/knowledge-base/create-knowledge-and-upload-documents/chunking-and-cleaning-text
7.4 可配合阅读的站内笔记
- 《Dify部署与应用》
- 《Coze应用教程》
7.5 学到什么程度算过关
至少做出 1 个可分享的工作流应用,比如:
- 文档问答助手
- 内容生成器
- 学习资料整理助手
八、阶段 5:最后再学 Agent
Agent 很重要,但不适合作为零基础第一站。
因为 Agent 不是“一个更厉害的聊天框”,而是把:
- 模型
- 工具
- 状态
- 决策
- 失败兜底
这些东西都放到一起考虑。
8.1 什么情况下再学 Agent 最合适
当你已经会这些东西时,再学 Agent 会顺很多:
- 会写 Prompt
- 会调模型 API
- 会搭 RAG
- 会做工作流
- 知道什么叫输入、输出、状态、工具
8.2 这一阶段重点理解什么
- Agent 和 Workflow 的区别
- 什么时候该让模型“自己决定下一步”
- 工具调用怎么设计才稳
- 多步任务怎么拆
- 怎么做失败重试和人工接管
- 怎么评估 Agent 是否真的有效
8.3 推荐资料
- OpenAI 平台总览中的 Agentic Applications 入口
https://platform.openai.com/docs/overview - Hugging Face Agents Course
https://huggingface.co/learn/agents-course/en/unit0/introduction
8.4 学到什么程度算过关
你能独立做一个简单 Agent,并回答清楚下面两个问题:
- 为什么这里必须用 Agent,而不是普通工作流
- 失败时系统如何停下来,而不是一直乱跑
九、阶段 6:开始做完整项目
知识只有放进项目里,才会真正变成能力。
对零基础来说,我更建议先做下面这 3 类项目。
9.1 项目 1:个人知识库问答助手
覆盖能力:
- 文档处理
- Embedding
- 向量检索
- RAG
适合练:
- 文档切分
- 检索质量
- 回答可追溯
9.2 项目 2:内容生成工作流
比如:
- 小红书文案生成
- 公众号提纲整理
- 多平台内容改写
覆盖能力:
- Prompt
- 结构化输出
- Workflow
9.3 项目 3:学习助手或资料整理 Agent
比如:
- 自动搜索资料并整理摘要
- 根据课程资料生成学习清单
- 从多份文档中提炼知识点
覆盖能力:
- Agent
- 工具调用
- 多步任务编排
十、给零基础学习者的一份 12 周计划
如果你希望有更具体的时间安排,可以按这个节奏来:
第 1-2 周:开发基础
- Python 基础语法
- Git 基础
- 终端基础
- Docker 入门
输出成果:
- 跑通一个本地 Python 小脚本
- 用 Git 提交一次代码
- 用 Docker 跑起一个服务
第 3-4 周:大模型通识 + Prompt
- 理解大模型基础概念
- 学 Prompt 设计
- 知道上下文、幻觉、输出格式控制
输出成果:
- 写出 3 组不同目标的 Prompt
- 比较不同 Prompt 的效果差异
第 5-6 周:模型 API 调用
- 跑通至少一个模型接口
- 做文本总结、结构化提取、问答
输出成果:
- 做一个可以运行的小工具
第 7-8 周:Embeddings + RAG
- 学文档切分
- 学向量化
- 学向量数据库
- 学检索与回答拼接
输出成果:
- 做一个最小知识库问答 Demo
第 9-10 周:Dify / Coze 工作流
- 用可视化平台做一个可分享应用
- 练调试、分支、知识库接入
输出成果:
- 发布一个工作流应用
第 11-12 周:完整项目 + 部署
- 选一个方向做成完整项目
- 补日志、评估、错误处理、部署
输出成果:
- 一个能真正演示和复用的项目
十一、学习过程中最容易犯的 5 个错误
11.1 一上来就追最新名词
最容易让人焦虑的不是不会,而是学得太散。
新名词层出不穷,但真正有用的能力往往还是:
- 调接口
- 看日志
- 搭检索
- 做工作流
- 做评估
11.2 只看视频,不自己做
看懂不等于会做。
每学完一个阶段,都要留下一个能运行的东西。
11.3 只看生成效果,不看系统设计
一个 AI 应用好不好,不只看回答像不像人,还要看:
- 稳不稳定
- 成本高不高
- 能不能复现
- 出错后怎么处理
11.4 过早依赖平台
平台很方便,但你至少要知道:
- 节点背后做了什么
- 为什么这样编排
- 为什么这里要加检索或分支
11.5 不做记录
建议你把这些东西都记下来:
- 用过的 Prompt
- 成功样例
- 失败样例
- 参数设置
- 系统结构图
长期来看,这些记录会比你看过多少教程更值钱。
十二、最后的建议
零基础学 AI 应用开发,不是比谁知道的名词多,而是比谁能一步一步把东西做出来。
真正有效的路线通常很朴素:
- 先把基础工具学会
- 再把模型接口调通
- 再把知识接进来
- 再把流程编排起来
- 最后再追求 Agent 和复杂系统
当你能独立做出一个:
- 可以运行
- 可以解释
- 可以迭代
- 可以部署
的项目时,你就已经不只是“会用 AI”,而是真的进入 AI 应用开发了。
参考资料
- Python 官方教程:https://docs.python.org/zh-cn/3/tutorial/index.html
- Pro Git 中文版:https://git-scm.com/book/zh/v2
- Docker Get Started:https://docs.docker.com/get-started/
- OpenAI Docs Overview:https://platform.openai.com/docs/overview
- OpenAI Tutorials:https://platform.openai.com/docs/tutorials
- OpenAI Embeddings Guide:https://platform.openai.com/docs/guides/embeddings
- Anthropic Prompt Engineering:https://docs.anthropic.com/en/docs/prompt-engineering
- Claude Code Overview:https://docs.anthropic.com/en/docs/claude-code/overview
- Hugging Face LLM Course:https://huggingface.co/course
- Hugging Face Agents Course:https://huggingface.co/learn/agents-course/en/unit0/introduction
- Dify Docs:https://docs.dify.ai/
- LangChain RAG Tutorial:https://python.langchain.com/docs/tutorials/rag/
- pgvector:https://github.com/pgvector/pgvector
