3.1 提示工程基础：角色设定与上下文学习

2026年2月8日

阅读需 6 分钟

wqz

ai学习

/prompt

/in-context-learning

Code is cheap, show me the talk

在这个“Vibe Coding”（氛围编程）的时代，写代码的下限已经被 AI 无限拉高。未来衡量一个人工程能力的标准，不再是你精通多少种语言的语法，而是你与 AI 交互的深度，以及你脑海里的蓝图。

在真正进入深水区写代码训练模型之前，我们必须先掌握如何纯靠“说话”来调动这些超级大脑。这就是提示工程（Prompt Engineering）。毕竟，不写一行训练代码，仅仅通过打磨 Prompt 就能解决 80% 的日常业务问题。

1. 沟通的痛点：为什么 AI 总是“变笨”？

如果你觉得现在的各类爆款大模型常常答非所问、废话连篇，那往往是因为你的沟通模式还停留在最懒惰的阶段。

最偷懒的问法就是 Zero-shot（零样本查询）：

"给我写个数组去重的算法。"

如果你把这句话直接扔给 ChatGPT，它通常会返回一长串教科书般的废话，包含不仅限于算法的历史、五种不同的语言实现方案，以及漫长的结尾寒暄。在真实的工程流里，这种充满噪声的回答毫无价值，甚至会导致你的代码提取脚本因为找不到确切的代码块而直接崩溃。

大模型本身就是一个拥有海量知识的混沌宇宙，Zero-shot 就等同于在宇宙里漫无目的地大喊一声，回音自然也是发散且不可控的。

2. 划定边界：System Prompt 与角色扮演

为了让这团混沌的知识聚拢并凝结成锋利的利刃，我们需要用 System Prompt（系统提示词） 为它画出绝对的物理边界。这就引出了极为关键的**角色设定（Role Prompting）**机制。

2.1 为何要设定角色？

在底层的概率论里，当大模型接到一句“你是一个 20 年经验的高级工程师”时，它并不是在玩过家家。由于它的训练语料涵盖了全网所有网页，这句起手式会在概率空间里直接过滤掉那些属于初学者、论坛灌水者或百科科普文章的神经元权重，强行把接下来的词汇预测概率轨道死定在“极客论坛、高级开源项目源码”的高质量区块中。

2.2 收敛废话的实战

通过设定冷酷且严谨的角色，AI 会立刻进入高知状态：

设定目标与人设：告诉它它正在扮演谁。
强制规则约束：用“绝不”、“只输出”等强烈字眼封堵它的发散。
给出具体任务：此时再去下发真正的需求。

System: 你是一个有 20 年经验的代码洁癖 C++ 工程师。你写代码从不废话，只提供最优解代码，且必须在代码头部包含严谨的时间复杂度注释。除了代码本身，绝不允许输出任何解释性文字。 \n User: 写一个数组去重算法。

当你施加了这层护城河，大模型就会瞬间收敛，像一个真正冷酷的顶尖黑客一样，精准地把几行最优解代码扔在你的面前，绝不多说一个废字。

3. 精体模仿：Few-shot 与 In-Context Learning

有时候，你想要的输出逻辑刁钻，或是特定的 JSON 嵌套格式根本无法用自然语言的条条框框去清晰描述。当你发现用干瘪的语言制定规则总是被 AI 误解时，最有效的终极杀招就是**“给例子”**。

3.1 大模型的“现学现卖”本能

大模型就像一个学识渊博但缺乏变通常识的学徒。你只要当着它的面演示两三遍，它就能瞬间参透其中的暗含规律并进行精准复刻。这就是学术界闻名遐迩的 In-Context Learning（上下文学习）。

它之所以能在不经过任何梯度下降训练的前提下学会新任务，是因为这些例子在上下文窗口中瞬间重新激活了它深层网络里某些特定的注意力模式。

3.2 Few-shot（少样本）实战演示

假设我们在做一个极具定制化情感提取的任务，要求不仅判断情感，还要把对应实体抽出来，形成严格的字典格式：

User: 请按照以下规律，提取最后一句话中的情感和实体： \n 评价: "这手机屏幕真亮，但电池太不耐用了。" -> {"情感": "褒贬不一", "实体":["屏幕", "电池"]} 评价: "客服态度恶劣，直接挂我电话！" -> {"情感": "反感", "实体":["客服", "电话"]} 评价: "物流飞快，昨天下单今天就到了，很满意！" ->

当你把带有前两个范例的 Prompt 喂给它，它甚至不需要你再去写一段长篇大论来解释“什么是实体”或者“情感分为几类”，它会立刻根据前文节奏的惯性，完美地接下第三句话：

[图片占位:(A clean, minimalist technical diagram on a solid white background. Use simple, crisp vector line art, monochrome or with very subtle minimal color accents. Flat design, no 3D effects, no clutter. Abstract visual.)]

{"情感": "满意", "实体":["物流"]}

4. 总结

第一支柱总结

提示工程绝不是某种神秘的“玄学”，而是与多维智能进行交互的系统控制论。

永远不要寄希望于 Zero-shot 能解决复杂的工程级任务，大模型需要明确的轨道。
System Prompt (角色设定)：这是你的项目架构设计。它在概率空间里提前打下锚点，过滤掉低质量的水分数据，强制大模型以最专业的姿态接客。
Few-shot (少样本)：这是你的 Test Case。当语言本身的描述力到达极限时，直接用最坚硬客观的数据样例去强行规范它的输入输出逻辑。

掌握了如何给模型定规矩、给例子，仅仅是让它变成了一个听话的执行者。但如果我们面临的不是简单的提取格式，而是需要它像人类一样解开复杂的逻辑奥数题，或是进行多步骤的长线博弈呢？

下一章预告：当问题极难，模型闭着眼睛猜词一定会坠毁时，我们该如何逼迫它“一步步把草稿写出来”？欢迎来到榨取 AI 智力极限的刑房：3.2 进阶提示工程：CoT链式思考与多路径推理，揭开 CoT (思维链) 与多树推演的神秘面纱。

1. 沟通的痛点：为什么 AI 总是“变笨”？​

2. 划定边界：System Prompt 与角色扮演​

2.1 为何要设定角色？​

2.2 收敛废话的实战​

3. 精体模仿：Few-shot 与 In-Context Learning​

3.1 大模型的“现学现卖”本能​

3.2 Few-shot（少样本）实战演示​

4. 总结​

目录