Context Engineering 大于 Prompt Engineering

2026 年 02 月 18 日

98 次浏览

2184字数

AI摘要

文章讨论了AI领域中Context Engineering与Prompt Engineering的区别，强调了管理整个上下文的重要性。作者分享了自己在实践中遇到的问题，如注意力预算和上下文衰减，并介绍了Just-in-Time策略和三层记忆架构来提高AI系统的效率和回答质量。最后，作者提供了一个实战检查清单，帮助读者优化自己的AI系统设计。

你可能一直在用错的方式理解 AI

大多数人（包括几个月前的我）对 AI 的理解是这样的：
写好 prompt → 得到好结果
听起来没毛病。但 Anthropic 之前在他们的研究文档里提了一个概念，让我重新想了想这事：
Context Engineering 是 Prompt Engineering 的自然演进。
等等，这不是换个说法吗？
不是。区别其实挺大的。

简单说：

Prompt Engineering 关注的是「这条 prompt 怎么写」
Context Engineering 关注的是「整个上下文怎么管理」

一个是写好一封信，另一个是管理整个邮件系统。

为什么 context 塞太多反而变蠢？

这事我自己踩过坑。
128K 的 context window，我心想：太好了，把所有文档、历史记录、说明文档全塞进去！理论上 AI 应该更聪明才对吧？
结果呢？AI 反而开始说胡话。
后来查了一下，学术上有两个概念解释这个：
Attention Budget — Transformer 的注意力不是均匀分配的。context 太长，每个 token 分到的「注意力」就被稀释了。关键信息可能直接被淹没。
Context Rot — 长对话里，早期的信息会慢慢「衰减」。聊两小时后，AI 基本忘了开头说的啥。
这就解释了为什么有时候聊着聊着，AI 突然「失忆」了。

Claude Code 的做法：Just-in-Time

Anthropic 在 Claude Code 里用的策略叫 Just-in-Time：
不是一次性加载所有信息
而是需要时才加载相关的
具体流程大概是：

跟传统的「把所有东西塞进 system prompt」完全不一样。
我自己搞的三层记忆架构

我在用 OpenClaw（一个 AI Agent 框架）的时候，折腾出了类似的架构：

asciidoc
记忆系统/
├── MEMORY.md # 核心记忆，每次都加载
├── memory/
│ ├── 2026-02-12.md # 每日日志
│ ├── 2026-02-11.md
│ └── archive/ # 过期的自动归档
└── memory_search # 需要时再搜索

层级设计：
L1 MEMORY.md — 每次会话开始就加载
L2 每日日志 — 只加载今天和昨天的
L3 历史归档 — 通过语义搜索按需召回

还搞了个自动过期机制：
[P0] — 永不过期（核心信息）
P1 — 90天后归档
P2 — 30天后归档

每天凌晨 4 点，一个 Python 脚本自动扫描，把过期的移到 archive。

效果？Token 用量降了 78%，但回答质量反而上去了。这挺反直觉的。