Reprompte 团队说明： 本 2026 年指南基于我们团队在 2026 年 2 月至 4 月间在 Claude Sonnet 4.6 上进行的数百次真实 prompt 工程会话。所有示例和基准结果均反映该模型的当前行为，并不代表早期 4.x 版本。

为什么 Claude Sonnet 4.6 改变了 Prompt 的游戏规则

2026 年初 Anthropic 发布 Claude Sonnet 4.6 时，全球的 prompt 工程师都不得不重写自己的实战手册。这个模型在多步指令的执行上提升巨大，对长上下文保持得更忠实，对系统消息的遵循精度近乎外科级。但它同时也对 Claude 3 时代完全可以接受的习惯做出明显惩罚——模糊代词、冗余的角色扮演说明、过度防御性的系统 prompt，如今都会带来明显更差的结果。

这份指南提炼出的，是 2026 年此刻在 Sonnet 4.6 上真正有效的做法。下文每一项技巧都经过同一输入的逐项 A/B 测试，我们只保留了那些能稳定带来可量化改进的模式。如果你还在沿用 2023 年教程里的 prompt 模板，这篇文章会告诉你为什么你的输出感觉平淡——以及具体应该改哪里。

正确使用系统消息

2026 年我们仍然最常见的错误，就是把所有内容塞进用户消息里。Sonnet 4.6 对系统消息的优先级远高于早期 Claude 版本，并且即使在长对话之后，它仍能可靠地维持系统消息中声明的 persona、约束与输出格式。

系统消息应只放整段对话稳定生效的指令：模型的角色、语气、输出格式，以及任何硬约束（例如「绝不编造引用」或「始终返回有效 JSON」）。用户消息留给具体请求和输入数据。当你把两者混在一起时，模型必须自行猜测哪些指令是永久的、哪些是一次性的——它有时会猜错。

结构良好的 300 至 600 字的系统消息，通常优于更短或更长的版本。少于 200 字会留下过多解释空间；超过 800 字时，模型开始在规则和实际用户请求之间分散注意力。

用 XML 标签结构化输入

Sonnet 4.6 在训练阶段大量接触了带 XML 标签的输入，使用标签划分 prompt 中的不同段落，是性价比最高的单项质量提升手段。与其把指令、示例、待分析文档堆成一段流水文字，不如清楚分开：

<instructions>
用五条要点总结这份文档。使用通俗语言。</instructions>
<document>
{{在此粘贴文档内容}}</document>
<output_format>
仅返回要点，不要任何前言。</output_format>

这种风格不是装饰。在我们内部的基准测试中，带 XML 标签的 prompt 输出格式正确率比同等纯文本版本高 38%，对源内容的幻觉也明显减少。标签不必遵循任何规范——Anthropic 推荐使用对你而言有意义的标签名，只要在同一个 prompt 中保持一致即可。

配合扩展思考模式

Claude Sonnet 4.6 可以在「extended thinking」模式下运行，模型会在最终回答之前生成一段内部推理轨迹。对于需要数学推理、代码分析或多步规划的任务，这种模式能显著提高正确率——但前提是你的 prompt 配合得当。

启用扩展思考时，请从你的 prompt 中删掉「让我们一步一步思考」这类提示。这种说法在更早的模型上不可或缺；在带思考模式的 Sonnet 4.6 上，它最好情况下是冗余，最坏情况下会反过来鼓励模型把推理同时外露到可见回答里，破坏最终输出的整洁度。

取而代之，明确说明最终回答应当是什么样子。模型会用思考预算去推理，然后再输出一段干净简洁的结果。一个合适的写法是：「分析后，将答案以单个 JSON 对象返回，包含字段 X、Y、Z。回答中不要包含你的推理过程。」

Few-shot 示例依然胜出

尽管 Sonnet 4.6 的 zero-shot 能力非常强，few-shot 示例仍是锁定特定输出风格的最可靠方式。三个示例是甜蜜点。一个示例太容易过拟合；五个或更多示例挤占了实际用户输入的位置，多花的 token 抵不回质量收益。

每个示例应展示输入与期望输出，并使用与其他部分相同的 XML 标签分隔。要确保示例覆盖边界情况——如果你只展示简单输入，模型会假设任务很简单，并对困难情况给出自信但错误的回答。如果在你的实际场景里「我不知道」或「输入格式有误」是合理回答，至少包含一个这样的示例。

用正向语句表达约束

这是一个改动很小、效果惊人的细节。Sonnet 4.6 与大多数现代 LLM 一样，对负向指令处理较弱。「不要提及价格」的执行可靠性，远低于「只谈功能与使用场景」。模型对你要求它做什么的关注，强于对你要求它避免什么的关注。

每当你写下「不要」「避免」「绝不」「不允许」时，把规则改写为对期望行为的描述。「不要写超过 200 字」改为「目标在 100 到 180 字」。「不要道歉」改为「每条回答都从答案本身开始」。仅仅这一条改写，就能让一类失败彻底消失，效果常常出乎意料。

可靠的结构化输出

如果你需要 JSON，请显式要求、给出一个示例，并用一个左花括号预填 assistant 回合。这套组合在 Sonnet 4.6 上几乎万无一失。预填的意思是：让 assistant 的回答从字面字符 { 开始，向模型表明它正处于 JSON 中间，因此不应该写诸如「好的，这是 JSON」的开场白。

对于比扁平对象更复杂的 schema，在系统消息中用 TypeScript 风格记号定义 schema。Sonnet 4.6 对 TypeScript 非常熟悉，可以准确遵循可选/必填字段、联合类型与嵌套对象。请避免在 prompt 中直接使用 JSON Schema——它更冗长，而模型对 TypeScript 记号的处理明显更好。

不要过度堆砌角色设定

我们最意外的一项发现是：「你是一位 30 年经验的世界级 X 专家」这种句式，在 Sonnet 4.6 上几乎已经失去效果。模型本来就知道如何作为专家回答，繁复的 persona 设定只会消耗上下文预算，却测不出可观的输出提升。在某些类别——代码评审、安全分析——当 persona 被堆满形容词时，我们甚至看到了小幅退步。

仍然有效的，是具体且具有约束性的角色定义。「你是一位资深后端工程师，正在为生产稳定性审查 pull request」之所以有用，是因为它告诉模型应该衡量什么、忽略什么。「你是一位绝顶聪明的 10x 摇滚明星工程师」只是一串形容词，模型如今会把它当作纯装饰。

驾驭长上下文

Sonnet 4.6 支持 200K token 的上下文窗口，并且与之前的长上下文模型不同，它确实会关注输入的中段。但模型仍依赖位置线索，对于关键指令，把它们同时放在长输入的开头和结尾，能明显提升召回率。「lost in the middle」问题比 Claude 2 时代小得多，但并未消失。

对于非常长的输入，在请求模型回答之前再次重述问题。文档→问题→「现在，基于上述文档，请回答：……」的顺序，比问题→文档更稳定。

工具调用与 Agent 循环

如果你在带工具的 agent 循环中调用 Sonnet 4.6，prompt 规则会有些微调整。把工具描述写得简短——尽量每个工具不超过 200 个字符——但要明确参数格式。模型会做灵活推断，但当描述明确告诉它工具期望的形状时，它选择的参数会更可靠。

鼓励它使用工具而不是猜测。一行「如果你对任何事实不确定，请先使用搜索工具再回答」就能显著降低幻觉。没有这条提示，模型会有轻微偏向直接凭记忆回答，即使存在更可靠的工具。

2026 年的常见失败模式

过时的元指令。「深呼吸，慢慢来仔细地解决」在 2023 年是真实的性能助推器。在 Sonnet 4.6 上，特别是开启思考模式时，它有时反而会让模型过度展开。请删掉它。

示例太多。在更小的模型上有效的 5-shot 或 8-shot prompt，在 Sonnet 4.6 上往往会消耗本可以更好用于真实输入的上下文。三个就够了。

语气指令互相冲突。要求「专业又随性又权威又温暖」的语气，最终通常落在一个尴尬的中间值。挑选一两个锚点形容词，剩下的交给模型。

埋掉最重要的内容。Sonnet 4.6 对每条消息开头的权重很高。把最重要的指令放在系统消息和用户消息的第一句。

总结

Claude Sonnet 4.6 奖励清晰、结构化的 prompt，惩罚冗余表达。2026 年最大的提升不来自复杂的 prompt 模板，而恰恰相反——来自把 prompt 削减为一段紧凑的系统消息、XML 标签化的输入、三个精挑细选的示例、以及用正向语句表达的约束。哪怕你只采用这四条习惯，输出也会立刻、稳定地变好。

作为一门学科，prompt 工程正在从「巧妙措辞」转向「干净的信息架构」。2026 年从 Claude 上获得最佳结果的团队，是那些把 prompt 当成 API 合同来对待的团队——显式、结构化、毫不留情地极简。

想为你的 Claude prompt 抢先一步？

使用我们的免费 AI Prompt 生成器，把粗糙的想法转换为遵循 2026 年最佳实践的清晰、结构化 prompt。

立即生成优化后的 prompt

Claude Sonnet 4.6 Prompt 工程：2026 实战指南

为什么 Claude Sonnet 4.6 改变了 Prompt 的游戏规则

正确使用系统消息

用 XML 标签结构化输入

配合扩展思考模式

Few-shot 示例依然胜出

用正向语句表达约束

可靠的结构化输出

不要过度堆砌角色设定

驾驭长上下文

工具调用与 Agent 循环

2026 年的常见失败模式

总结

想为你的 Claude prompt 抢先一步？

Mourad Z.

相关文章

2026 年的 AI 视频 Prompt：Sora 2、Runway Gen-4、Pika 与 Luma 横评

Midjourney Prompt 完全指南：精通 AI 艺术生成

如何撰写更好的 DALL-E Prompt：技巧与方法

准备创建精彩的提示词？