feat(agents): classify context budget pressure

Gio Della-Libera · Gio Della-Libera · commit 7f8c30db2786 · 2026-05-20T21:08:22.000-07:00
diff --git a/src/auto-reply/status.test.ts b/src/auto-reply/status.test.ts
@@ -174,7 +174,7 @@ describe("buildStatusMessage", () => {
     });
     const normalized = normalizeTestText(text);
 
-    expect(normalized).toContain("Context: ~640k/1.0m (64% est)");
+    expect(normalized).toContain("Context: ~640k/1.0m (64% est) · Budget: watch");
     expect(normalized).not.toContain("Context: ?/1.0m");
     expect(normalized).not.toContain("Context: 3.8m/1.0m");
   });
@@ -220,6 +220,7 @@ describe("buildStatusMessage", () => {
     const normalized = normalizeTestText(text);
 
     expect(normalized).toContain("Context: 36k/1.0m (4%)");
+    expect(normalized).toContain("Budget: watch");
     expect(normalized).not.toContain("~640k");
   });
 
@@ -261,7 +262,7 @@ describe("buildStatusMessage", () => {
     });
     const normalized = normalizeTestText(text);
 
-    expect(normalized).toContain("Context: ~125k/1.0m (13% est)");
+    expect(normalized).toContain("Context: ~125k/1.0m (13% est) · Budget: safe");
     expect(normalized).not.toContain("Context: 0/1.0m");
   });
 
diff --git a/src/config/sessions.ts b/src/config/sessions.ts
@@ -9,6 +9,7 @@ export * from "./sessions/paths.js";
 export * from "./sessions/reset.js";
 export * from "./sessions/session-key.js";
 export * from "./sessions/store.js";
+export * from "./sessions/context-budget-policy.js";
 export * from "./sessions/types.js";
 export * from "./sessions/transcript.js";
 export * from "./sessions/session-file.js";
diff --git a/src/config/sessions/context-budget-policy.test.ts b/src/config/sessions/context-budget-policy.test.ts
@@ -0,0 +1,90 @@
+import { describe, expect, it } from "vitest";
+import { resolveSessionContextBudgetPolicy } from "./context-budget-policy.js";
+import type { SessionContextBudgetStatus } from "./types.js";
+
+function makeStatus(patch: Partial<SessionContextBudgetStatus> = {}): SessionContextBudgetStatus {
+  return {
+    schemaVersion: 1,
+    source: "pre-prompt-estimate",
+    updatedAt: 1,
+    provider: "anthropic",
+    model: "claude-opus-4-6",
+    route: "fits",
+    shouldCompact: false,
+    estimatedPromptTokens: 100,
+    contextTokenBudget: 1_000,
+    promptBudgetBeforeReserve: 900,
+    reserveTokens: 100,
+    effectiveReserveTokens: 100,
+    remainingPromptBudgetTokens: 800,
+    overflowTokens: 0,
+    toolResultReducibleChars: 0,
+    messageCount: 1,
+    unwindowedMessageCount: 1,
+    ...patch,
+  };
+}
+
+describe("resolveSessionContextBudgetPolicy", () => {
+  it("classifies low estimated prompt usage as safe", () => {
+    expect(
+      resolveSessionContextBudgetPolicy(
+        makeStatus({
+          estimatedPromptTokens: 125_000,
+          contextTokenBudget: 1_000_000,
+          promptBudgetBeforeReserve: 900_000,
+          remainingPromptBudgetTokens: 775_000,
+        }),
+      ),
+    ).toMatchObject({
+      pressure: "safe",
+      contextBudgetPct: 13,
+      promptBudgetPct: 14,
+      remainingPromptBudgetTokens: 775_000,
+    });
+  });
+
+  it("classifies reserve-budget pressure before overflow", () => {
+    expect(
+      resolveSessionContextBudgetPolicy(
+        makeStatus({
+          estimatedPromptTokens: 640_000,
+          contextTokenBudget: 1_000_000,
+          promptBudgetBeforeReserve: 900_000,
+          remainingPromptBudgetTokens: 260_000,
+        }),
+      ),
+    ).toMatchObject({
+      pressure: "watch",
+      contextBudgetPct: 64,
+      promptBudgetPct: 71,
+    });
+
+    expect(
+      resolveSessionContextBudgetPolicy(
+        makeStatus({
+          estimatedPromptTokens: 780_000,
+          contextTokenBudget: 1_000_000,
+          promptBudgetBeforeReserve: 900_000,
+          remainingPromptBudgetTokens: 120_000,
+        }),
+      )?.pressure,
+    ).toBe("pressure");
+  });
+
+  it("classifies non-fitting precheck routes as overflow risk", () => {
+    expect(
+      resolveSessionContextBudgetPolicy(
+        makeStatus({
+          route: "compact_then_truncate",
+          shouldCompact: true,
+          estimatedPromptTokens: 920_000,
+          contextTokenBudget: 1_000_000,
+          promptBudgetBeforeReserve: 900_000,
+          remainingPromptBudgetTokens: 0,
+          overflowTokens: 20_000,
+        }),
+      )?.pressure,
+    ).toBe("overflow-risk");
+  });
+});
diff --git a/src/config/sessions/context-budget-policy.ts b/src/config/sessions/context-budget-policy.ts
@@ -0,0 +1,74 @@
+import type { SessionContextBudgetStatus } from "./types.js";
+
+export type SessionContextBudgetPressure = "safe" | "watch" | "pressure" | "overflow-risk";
+
+export type SessionContextBudgetPolicy = {
+  pressure: SessionContextBudgetPressure;
+  estimatedPromptTokens: number;
+  contextBudgetPct?: number;
+  promptBudgetPct?: number;
+  remainingPromptBudgetTokens: number;
+  overflowTokens: number;
+  route: SessionContextBudgetStatus["route"];
+};
+
+const WATCH_PROMPT_BUDGET_PCT = 65;
+const PRESSURE_PROMPT_BUDGET_PCT = 85;
+
+function resolveNonNegativeInteger(value: number | undefined): number | undefined {
+  if (typeof value !== "number" || !Number.isFinite(value) || value < 0) {
+    return undefined;
+  }
+  return Math.floor(value);
+}
+
+function resolvePositiveInteger(value: number | undefined): number | undefined {
+  if (typeof value !== "number" || !Number.isFinite(value) || value <= 0) {
+    return undefined;
+  }
+  return Math.floor(value);
+}
+
+function pct(numerator: number, denominator: number | undefined): number | undefined {
+  if (denominator === undefined) {
+    return undefined;
+  }
+  return Math.min(999, Math.max(0, Math.round((numerator / denominator) * 100)));
+}
+
+export function resolveSessionContextBudgetPolicy(
+  status: SessionContextBudgetStatus | undefined,
+): SessionContextBudgetPolicy | undefined {
+  if (!status || status.source !== "pre-prompt-estimate") {
+    return undefined;
+  }
+  const estimatedPromptTokens = resolveNonNegativeInteger(status.estimatedPromptTokens);
+  if (estimatedPromptTokens === undefined) {
+    return undefined;
+  }
+  const contextTokenBudget = resolvePositiveInteger(status.contextTokenBudget);
+  const promptBudgetBeforeReserve = resolvePositiveInteger(status.promptBudgetBeforeReserve);
+  const overflowTokens = resolveNonNegativeInteger(status.overflowTokens) ?? 0;
+  const remainingPromptBudgetTokens =
+    resolveNonNegativeInteger(status.remainingPromptBudgetTokens) ??
+    Math.max(0, (promptBudgetBeforeReserve ?? 0) - estimatedPromptTokens);
+  const promptBudgetPct = pct(estimatedPromptTokens, promptBudgetBeforeReserve);
+  const contextBudgetPct = pct(estimatedPromptTokens, contextTokenBudget);
+  const pressure: SessionContextBudgetPressure =
+    overflowTokens > 0 || status.route !== "fits"
+      ? "overflow-risk"
+      : promptBudgetPct !== undefined && promptBudgetPct >= PRESSURE_PROMPT_BUDGET_PCT
+        ? "pressure"
+        : promptBudgetPct !== undefined && promptBudgetPct >= WATCH_PROMPT_BUDGET_PCT
+          ? "watch"
+          : "safe";
+  return {
+    pressure,
+    estimatedPromptTokens,
+    ...(contextBudgetPct !== undefined ? { contextBudgetPct } : {}),
+    ...(promptBudgetPct !== undefined ? { promptBudgetPct } : {}),
+    remainingPromptBudgetTokens,
+    overflowTokens,
+    route: status.route,
+  };
+}
diff --git a/src/gateway/session-utils.test.ts b/src/gateway/session-utils.test.ts
@@ -335,6 +335,41 @@ describe("gateway session utils", () => {
     });
   });
 
+  test("session rows expose derived context budget pressure", () => {
+    const row = buildGatewaySessionRow({
+      cfg: createModelDefaultsConfig({ primary: "anthropic/claude-opus-4-6" }),
+      storePath: "",
+      store: {},
+      key: "agent:main:main",
+      entry: {
+        sessionId: "session-1",
+        updatedAt: 1,
+        contextBudgetStatus: {
+          schemaVersion: 1,
+          source: "pre-prompt-estimate",
+          updatedAt: 1,
+          provider: "anthropic",
+          model: "claude-opus-4-6",
+          route: "fits",
+          shouldCompact: false,
+          estimatedPromptTokens: 640_000,
+          contextTokenBudget: 1_000_000,
+          promptBudgetBeforeReserve: 900_000,
+          reserveTokens: 100_000,
+          effectiveReserveTokens: 100_000,
+          remainingPromptBudgetTokens: 260_000,
+          overflowTokens: 0,
+          toolResultReducibleChars: 0,
+          messageCount: 2,
+          unwindowedMessageCount: 2,
+        },
+      },
+    });
+
+    expect(row.contextBudgetPressure).toBe("watch");
+    expect(row.contextBudgetStatus?.estimatedPromptTokens).toBe(640_000);
+  });
+
   test("async session list reuses thinking metadata for lightweight rows", async () => {
     const resolveThinkingProfile = vi.fn(() => ({
       levels: [{ id: "off" as const }, { id: "medium" as const }],
diff --git a/src/gateway/session-utils.ts b/src/gateway/session-utils.ts
@@ -50,6 +50,7 @@ import {
   resolveAllAgentSessionStoreTargetsSync,
   resolveAgentMainSessionKey,
   resolveFreshSessionTotalTokens,
+  resolveSessionContextBudgetPolicy,
   resolveStorePath,
   type SessionEntry,
   type SessionStoreTarget,
@@ -1861,6 +1862,7 @@ export function buildGatewaySessionRow(params: {
           allowAsyncLoad: false,
         }),
       ));
+  const contextBudgetPolicy = resolveSessionContextBudgetPolicy(entry?.contextBudgetStatus);
 
   let derivedTitle: string | undefined;
   let lastMessagePreview: string | undefined;
@@ -1946,6 +1948,7 @@ export function buildGatewaySessionRow(params: {
     agentRuntime,
     contextTokens,
     contextBudgetStatus: entry?.contextBudgetStatus,
+    contextBudgetPressure: contextBudgetPolicy?.pressure,
     deliveryContext: deliveryFields.deliveryContext,
     lastChannel: deliveryFields.lastChannel ?? entry?.lastChannel,
     lastTo: deliveryFields.lastTo ?? entry?.lastTo,
diff --git a/src/gateway/session-utils.types.ts b/src/gateway/session-utils.types.ts
@@ -1,5 +1,9 @@
 import type { ChatType } from "../channels/chat-type.js";
-import type { SessionCompactionCheckpoint, SessionEntry } from "../config/sessions/types.js";
+import type {
+  SessionCompactionCheckpoint,
+  SessionContextBudgetPressure,
+  SessionEntry,
+} from "../config/sessions.js";
 import type { PluginSessionExtensionProjection } from "../plugins/host-hooks.js";
 import type {
   GatewayAgentRuntime,
@@ -85,6 +89,7 @@ export type GatewaySessionRow = {
   agentRuntime?: GatewayAgentRuntime;
   contextTokens?: number;
   contextBudgetStatus?: SessionEntry["contextBudgetStatus"];
+  contextBudgetPressure?: SessionContextBudgetPressure;
   deliveryContext?: DeliveryContext;
   lastChannel?: SessionEntry["lastChannel"];
   lastTo?: string;
diff --git a/src/status/status-message.ts b/src/status/status-message.ts
@@ -29,7 +29,9 @@ import {
   resolveSessionPluginStatusLines,
   resolveSessionPluginTraceLines,
   resolveFreshSessionTotalTokens,
+  resolveSessionContextBudgetPolicy,
   type SessionEntry,
+  type SessionContextBudgetPressure,
   type SessionScope,
 } from "../config/sessions.js";
 import { hasSessionAutoModelFallbackProvenance } from "../config/sessions/model-override-provenance.js";
@@ -243,6 +245,13 @@ const formatEstimatedContextBudgetTokens = (
   return `~${totalLabel}/${ctxLabel}${pct !== null ? ` (${pct}% est)` : " (est)"}`;
 };
 
+const formatContextBudgetPressure = (pressure: SessionContextBudgetPressure | undefined) => {
+  if (!pressure) {
+    return null;
+  }
+  return `Budget: ${pressure}`;
+};
+
 export const formatContextUsageShort = (
   total: number | null | undefined,
   contextTokens: number | null | undefined,
@@ -857,8 +866,10 @@ export function buildStatusMessage(args: StatusArgs): string {
       ? (formatEstimatedContextBudgetTokens(entry?.contextBudgetStatus, contextTokens) ??
         formatTokens(totalTokens, contextTokens ?? null))
       : formatTokens(totalTokens, contextTokens ?? null);
+  const contextBudgetPolicy = resolveSessionContextBudgetPolicy(entry?.contextBudgetStatus);
   const contextLine = [
     `Context: ${contextUsageLabel}`,
+    formatContextBudgetPressure(contextBudgetPolicy?.pressure),
     `🧹 Compactions: ${entry?.compactionCount ?? 0}`,
   ]
     .filter(Boolean)