3.2 进阶提示工程：CoT链式思考与多路径推理

2026年2月9日

阅读需 9 分钟

wqz

慢即是快

在上一章（3.1 基础心法）中，我们学会了用强制角色设定让模型变得更听话，用少量样例（Few-shot）让它照猫画虎。但这依然停留在相对表层的“格式复印”阶段。

当面临复杂的逻辑谜题、代码查错、或是深度数理推演时，如果你让 AI 直接给你一个终极答案，它大概率会因为步子迈得太大而彻底坠马翻车。这是因为大模型从底层的下一词推断（Next Token Prediction）本质来看，它其实是在“闭着眼睛猜词语”。

如何让这样一个狂奔的巨型文本生成机器慢下来？如何逼迫它调动那些深远的高等神经突触？唯一的诀窍，就是拉长它的思考距离。

1. 最质朴的降维打击：CoT (思维链)

在人工智能提示工程的发展史上，很少有哪个技巧能像 CoT（Chain of Thought - 思维链） 那样，仅仅凭着几个单词的改动，就凭空让模型的逻辑智商指数级飙升了几十个百分点。

1.1 直接吐答案的死穴

普通问法：一辆火车以 120km/h 的速度走 15 分钟，另一辆火车以 90km/h 的速度走半小时。哪辆车走的更远？远多少？

如果你直接抛给一个中等体量的模型，它极大可能会在内部短暂的高压运算后，直接给出一个似是而非的错误结论（比如由于惯性猜错了某个数字）。为什么？因为它没有可以依赖的“缓存纸和笔”。它在生成最后那个答案时，必须一次命中所有的隐含逻辑线。

1.2 "请一步步思考"的神奇魔力

而如果你仅仅在问题的末尾，加上提示工程里最神圣的几个字：Think step by step。

CoT 问法：一辆火车以 120km/h 的速度走 15 分钟，另一辆火车以 90km/h 的速度走半小时。哪辆车走的更远？远多少？请一步步进行计算和推理，最后再给出结果。

模型瞬间就变了一种慎重的态度。它会先输出：

计算第一辆车：速度是 120km/h，时间是 15 分钟（0.25小时）。距离 = 120 * 0.25 = 30 km。
计算第二辆车：速度是 90km/h，时间是 0.5小时。距离 = 90 * 0.5 = 45 km。
对比可知：45 > 30。45 - 30 = 15 km。
最终结论：第二辆车走的远，远了 15 km。

这背后发生了什么？ 当模型被迫把中间过程写在屏幕上的那一刻，它自己就拥有了视觉与语境记忆。在它吐出最后结论词的时候，它的注意力机制（Attention）会敏锐地回头看到纸上白纸黑字写着的“30”和“45”。它不再需要用大脑直接去空手套白狼了，它是在依靠前文刚刚吐出的绝对事实在进行终极收敛！

正是这种“将思考过程实体化外显”的核心真理，直接孕育了后来震惊世界的 DeepSeek-R1 和 OpenAI 的 o1。它们更是把这套“慢反射、长推演”的逻辑彻底刻进了骨子里（隐式思维链）。

2. 把大山切成石块：分解与提点

当任务规模从普通的选择题变成“为一款电商 APP 规划完整的春季营销方案并写出全套广告文案”时，单纯的 CoT 依然会有翻车的风险。因为这个任务太重了。

这时候可以继续叠加进阶技巧。

2.1 Prompt Chaining（提示词链路）

永远不要指望一个大模型用一次深呼吸就能写完一部 10 万字的小说，它不是写断了气就是后期剧情彻底逻辑崩盘。这就是提示词链路 (Prompt Chaining) 出现的必然性。

你必须残忍地把它拆分成一条接力流水线：

第一环：先让模型 A 生成大纲，并输出到文本文件。
第二环：让人类或者另一个苛刻的模型 B 根据大纲去审视其中的逻辑断点，并修改重构。
第三环：再丢给最擅长修辞的模型 C，每次只给它喂一章的大纲要点，让它去扩写成几千字的饱满段落。

这种流水线串联，不仅让每个节点的注意力极致聚焦，也极大避免了最后成品的格式混乱，其质量远超让一个模型一镜到底飙完。这一理念其实就是后面 5.3 节的多 Agent 协作与 LangGraph 兵团运作的绝对前置理念。

2.2 Self-Consistency（自我一致性：投票取优）

有些隐晦的密码学题目、或者是毫无线索提示的代码调试。你让它想一百遍，可能前九十九遍都在发疯。这时，我们可以靠堆算力来暴力拆解。

技巧：通过代码调用大模型接口时，把代表随机发散性的 Temperature（温度参数） 调高至 0.8 以上。并用最冷酷的代码循环发送同一个问题整整 10 遍。模型会在这 10 次回复中给你推演出十几个天马行空的答案。最后，你不再需要自己人工干预，只需拉个脚本统计出这 10 个独立计算结果中出现次数最多的那个高频共识解。大量学术顶会论文已经铁证如山：在做艰难的奥赛数学题时，这种“民主投票式”的解法准确率会瞬间拉升三十个点。

3. P2 进阶技术：ToT 与 ReAct 的呼应

在当下那些顶级极客的提示工程试验场里，对模型的压榨早就不仅仅满足于普通的链式推理。

3.1 Tree of Thoughts (ToT - 思维树)

如果这是一盘围棋死局，直线思维是必死无疑的。我们要它不仅前看三步，还得像树枝分叉一样多看几个平行变种世界。

你可以设计一段复杂的体系级系统 Prompt：

"对于接下来的物理推理，请你同时扮演三个不同的解题专家。你们各自提出三种截然不同的解法假设。第一轮过后，请作为公正的评委对这三条世界线的解法进行打分评价，并将看起来存在逻辑死胡同的那两条线彻底掐掉废弃。然后，针对最高分的那一条最优路径继续往下推理验证三步。直到最终触达真相。"

这就叫 Tree of Thoughts (ToT)。它不仅允许模型向前冲锋，更赋予了模型在走不过去时主动丢弃残局、倒车回溯（Backtracking）到树干分叉点的能力，常被用于极客视角的复杂代码破解与系统级迷局破解。

3.2 ReAct (Reason + Act: 走向物理世界的前奏)

当我们允许模型在思考的时候，利用**行动（Action）**去向外界借力，旧时代的魔法最终就会发生剧烈的质变跨越。

思绪：“我需要计算苹果这十年的复利市值，但我是个断了网的大语言模型。” 行动动作：[调用外部搜索引擎 API，搜索：苹果今年市值] 观测结果：3.3万亿美元。

这就是我们在第 5 阶段重笔墨渲染的 ReAct 引擎的原点。它将单纯的纸上谈兵破壁而出，真正让大模型借由接口长出了观察物理世界的电子眼睛和可以拔插的机械双手（Tool Calling）。

4. 总结

第二支柱进阶总结

永远要提防让大模型陷入“猜词博弈”。通过 CoT (思维链) 强制要求“一步步思考”，是逼迫模型将内隐推理外显、通过屏幕输出做临时显存的核心技巧。
将一个大山般沉重的指令强行拆碎。不论是通过 Prompt Chaining 分出流水线步骤，还是通过 Self-Consistency 反复暴力投票，都是分流算力以获得压倒性质量的最佳工程途径。
当推演深邃，赋予模型如同围棋手一样的 ToT (思维树) 平行时空抉择权；并引入 ReAct (思考与行动交替)，便是大语言模型彻底蜕凡升格为真实世界智能 Agent 前的最强铺垫。

但当你学会了压榨它的极致智力并拿到了华丽推演后，作为软件工程师，下一个棘手的问题立刻接踵而至。你那些写着高深 Prompt 的后台代码，根本无法解析大模型那一长串洋洋洒洒带有客套话的文字废料！不仅如此，总有不怀好意的黑客试图在网页对话框里插入恶毒的指令，意图让你那精心设定的高智商系统全盘招供出那价值连城的祖传 System Prompt 宝剑。

下一章预告：如何彻底斩平自然流水的格式迷途？如何像砌防弹玻璃一样在前端架起防火墙去抵御来路不明的 Prompt Injection（提示词注入）抹杀危机？欢迎进入提示工程的最后堡垒：3.3 工程防御：结构化输出与安全边界。

1. 最质朴的降维打击：CoT (思维链)​

1.1 直接吐答案的死穴​

1.2 "请一步步思考"的神奇魔力​

2. 把大山切成石块：分解与提点​

2.1 Prompt Chaining（提示词链路）​

2.2 Self-Consistency（自我一致性：投票取优）​

3. P2 进阶技术：ToT 与 ReAct 的呼应​

3.1 Tree of Thoughts (ToT - 思维树)​

3.2 ReAct (Reason + Act: 走向物理世界的前奏)​

4. 总结​

目录