第0阶段:起点
这是整个 AI 学习之旅的起点。
在这一阶段,我们不整那些吓人的数学公式——线性代数、概率论、微积分这些可以在需要时查阅。
我们的目标是建立直觉,搞清楚一件事:为了让机器学会做一件事,工程师到底做了什么?
这个基础不打牢,后面每一章都会像空中楼阁。
1. 编程范式的转变:从 1.0 到 2.0
我们要学的不是一种新的编程语言,而是一种全新的思考方式。

传统编程(Software 1.0)
如果你是写业务代码的工程师,你每天做的 事情大概是这样的:你告诉计算机每一条具体的规则。
如果你是写业务代码的工程师,你每天做的事情大概是这样的:你告诉计算机每一条具体的规则。
- 场景:判断一张照片里是不是猫。
- 做法:写
if (有耳朵) and (有胡须) and (毛茸茸)... - 问题:根本写不完!老虎也有耳朵胡须,玩具猫怎么算?规则稍微变一点,代码就得重写。
机器学习(Software 2.0)
既然规则太复杂写不出来,那能不能让机器自己把规则找出来?
我们不写规则了,给机器看一万张猫的照片和一万张不是猫的照片,然后告诉它:"你自己找规律,反正左边这些必须叫'猫',右边这些不行。"
机器经过一通计算,最后归纳出了一套超级复杂的数学公式(可能有一亿个参数)。这套公式,就是我们炼出来的模型(Model)。
这就是机器学习的核心:用数据换取规则。
2. 三大学习范式
和人类学习方式一样,机器学习也有三种范式。

2.1 监督学习(Supervised Learning)
类比:学生刷题(带标准答案)
这是最主流、应用最广的方法。
- 老师(工程师):给你一本《五年高考三年模拟》,每道题后面都有答案。
- 学生(模型):做题 → 对答案 → 发现错了 → 修正脑子里的思路。
- 应用:
- 分类:这封邮件是垃圾邮件吗?(是/否)
- 回归:这房子明年多少钱?(预测具体数值)
2.2 无监督学习(Unsupervised Learning)
类比:把一堆乐高积木分类(没说明书)
老师这回不给答案了,就把一堆数据扔给你:"你自己看看有什么规律。"
- 学生(模型):这几个红色的块块挺像的,堆一起;那些长条形状差不多,堆一起。
- 应用:
- 聚类:把用户分成"高价值用户"、"薅羊毛用户"(不知道谁是谁,但行为模式很像)。
- 关联规则:买了啤酒的人通常也会买尿布。
2.3 强化学习(Reinforcement Learning)
类比:训练小狗(给骨头或打屁股)
没有现成的数据集,而是通过互动来学习。本质是:没有标准答案,只有长期回报。
- 环境:给模型一个场景(比如玩《马里奥》游戏)。
- 反馈:
- 往右走吃金币 → 奖励 +1(做得好!)
- 掉坑里摔死了 → 惩罚 -10(别这么干!)
- 目标:模型疯狂试错,最后学会了怎么拿最高分。
- 现实应用:AlphaGo 下围棋、机器人走路、DeepSeek-R1 的推理能力训练(我们会在第8阶段详细介绍)。
3. 绕不开的数学直觉
虽然我们承诺不堆砌吓人的公式,但知识图谱里的这几个数学名词,是你学 AI 必须建立的核心直觉。它们构成了机器能"学"懂一切的数理基石。