fix: tolerate missing streamed response content type

jalehman · web-flow · commit ab0a633ab98b · 2026-06-04T12:17:22.000-07:00
Fixes the OpenAI-compatible stream transport regression where a valid ChatGPT Codex HTTP 200 stream could arrive without a `content-type` header and be rejected before the OpenAI SDK consumed it. Prepared head SHA: 0d7f8ab Co-authored-by: jalehman <550978+jalehman@users.noreply.github.com>
diff --git a/src/agents/provider-transport-fetch.test.ts b/src/agents/provider-transport-fetch.test.ts
@@ -113,6 +113,41 @@ function latestTrustedEnvProxyParams(): Record<string, unknown> {
   return params;
 }
 
+function responseStreamText(text: string): ReadableStream<Uint8Array> {
+  return responseStreamChunks([text]);
+}
+
+function responseStreamChunks(chunks: string[]): ReadableStream<Uint8Array> {
+  const encoder = new TextEncoder();
+  return new ReadableStream({
+    start(controller) {
+      for (const chunk of chunks) {
+        controller.enqueue(encoder.encode(chunk));
+      }
+      controller.close();
+    },
+  });
+}
+
+function openResponseStreamText(text: string): {
+  close: () => void;
+  stream: ReadableStream<Uint8Array>;
+} {
+  const encoder = new TextEncoder();
+  let streamController: ReadableStreamDefaultController<Uint8Array> | undefined;
+  return {
+    close() {
+      streamController?.close();
+    },
+    stream: new ReadableStream({
+      start(controller) {
+        streamController = controller;
+        controller.enqueue(encoder.encode(text));
+      },
+    }),
+  };
+}
+
 describe("buildGuardedModelFetch", () => {
   beforeEach(() => {
     managedStreamCleanupRegistrations.length = 0;
@@ -203,6 +238,164 @@ describe("buildGuardedModelFetch", () => {
     expect(release).toHaveBeenCalled();
   });
 
+  it("allows missing content-type when streamed OpenAI-compatible responses contain SSE", async () => {
+    fetchWithSsrFGuardMock.mockResolvedValue({
+      response: new Response(responseStreamText('data: {"ok": true}\n\ndata: [DONE]\n\n')),
+      finalUrl: "https://chatgpt.com/backend-api/codex/responses",
+      release: vi.fn(async () => undefined),
+    });
+    const model = {
+      id: "gpt-5.5",
+      provider: "openai",
+      api: "openclaw-openai-responses-transport",
+      baseUrl: "https://chatgpt.com/backend-api/codex",
+    } as unknown as Model<"openai-responses">;
+
+    const response = await buildGuardedModelFetch(model)(
+      "https://chatgpt.com/backend-api/codex/responses",
+      {
+        method: "POST",
+        headers: { "content-type": "application/json" },
+        body: JSON.stringify({ model: "gpt-5.5", stream: true }),
+      },
+    );
+    const items = [];
+    for await (const item of Stream.fromSSEResponse(response, new AbortController())) {
+      items.push(item);
+    }
+
+    expect(items).toEqual([{ ok: true }]);
+  });
+
+  it("returns promptly for missing content-type SSE streams that remain open", async () => {
+    const source = openResponseStreamText('data: {"ok": true}\n\n');
+    fetchWithSsrFGuardMock.mockResolvedValue({
+      response: new Response(source.stream),
+      finalUrl: "https://chatgpt.com/backend-api/codex/responses",
+      release: vi.fn(async () => undefined),
+    });
+    const model = {
+      id: "gpt-5.5",
+      provider: "openai",
+      api: "openclaw-openai-responses-transport",
+      baseUrl: "https://chatgpt.com/backend-api/codex",
+    } as unknown as Model<"openai-responses">;
+
+    const responsePromise = buildGuardedModelFetch(model)(
+      "https://chatgpt.com/backend-api/codex/responses",
+      {
+        method: "POST",
+        headers: { "content-type": "application/json" },
+        body: JSON.stringify({ model: "gpt-5.5", stream: true }),
+      },
+    );
+    const timeout = Symbol("timeout");
+    const result = await Promise.race<Response | typeof timeout>([
+      responsePromise,
+      new Promise<typeof timeout>((resolve) => {
+        setTimeout(() => resolve(timeout), 100);
+      }),
+    ]);
+    source.close();
+
+    expect(result).not.toBe(timeout);
+    const response = result as Response;
+    const items = [];
+    for await (const item of Stream.fromSSEResponse(response, new AbortController())) {
+      items.push(item);
+    }
+
+    expect(items).toEqual([{ ok: true }]);
+  });
+
+  it("allows missing content-type when the SSE prefix is split across chunks", async () => {
+    fetchWithSsrFGuardMock.mockResolvedValue({
+      response: new Response(responseStreamChunks(["d", "ata", ': {"ok": true}\n\n'])),
+      finalUrl: "https://chatgpt.com/backend-api/codex/responses",
+      release: vi.fn(async () => undefined),
+    });
+    const model = {
+      id: "gpt-5.5",
+      provider: "openai",
+      api: "openclaw-openai-responses-transport",
+      baseUrl: "https://chatgpt.com/backend-api/codex",
+    } as unknown as Model<"openai-responses">;
+
+    const response = await buildGuardedModelFetch(model)(
+      "https://chatgpt.com/backend-api/codex/responses",
+      {
+        method: "POST",
+        headers: { "content-type": "application/json" },
+        body: JSON.stringify({ model: "gpt-5.5", stream: true }),
+      },
+    );
+    const items = [];
+    for await (const item of Stream.fromSSEResponse(response, new AbortController())) {
+      items.push(item);
+    }
+
+    expect(items).toEqual([{ ok: true }]);
+  });
+
+  it("synthesizes SSE for missing content-type JSON returned to streaming SDK requests", async () => {
+    fetchWithSsrFGuardMock.mockResolvedValue({
+      response: new Response(responseStreamText('{"ok": true}')),
+      finalUrl: "https://chatgpt.com/backend-api/codex/responses",
+      release: vi.fn(async () => undefined),
+    });
+    const model = {
+      id: "gpt-5.5",
+      provider: "openai",
+      api: "openclaw-openai-responses-transport",
+      baseUrl: "https://chatgpt.com/backend-api/codex",
+    } as unknown as Model<"openai-responses">;
+
+    const response = await buildGuardedModelFetch(model)(
+      "https://chatgpt.com/backend-api/codex/responses",
+      {
+        method: "POST",
+        headers: { "content-type": "application/json" },
+        body: JSON.stringify({ model: "gpt-5.5", stream: true }),
+      },
+    );
+    const items = [];
+    for await (const item of Stream.fromSSEResponse(response, new AbortController())) {
+      items.push(item);
+    }
+
+    expect(response.headers.get("content-type")).toContain("text/event-stream");
+    expect(items).toEqual([{ ok: true }]);
+  });
+
+  it("rejects missing content-type streamed OpenAI-compatible responses with HTML bodies", async () => {
+    const release = vi.fn(async () => undefined);
+    const model = {
+      id: "private-model",
+      provider: "custom-openai",
+      api: "openai-completions",
+      baseUrl: "https://proxy.example.com",
+    } as unknown as Model<"openai-completions">;
+    fetchWithSsrFGuardMock.mockResolvedValue({
+      response: new Response(responseStreamText("<html>not the API</html>")),
+      finalUrl: "https://proxy.example.com/chat/completions",
+      release,
+    });
+
+    await expect(
+      buildGuardedModelFetch(model)("https://proxy.example.com/chat/completions", {
+        method: "POST",
+        headers: { "content-type": "application/json" },
+        body: JSON.stringify({ model: "private-model", stream: true }),
+      }),
+    ).rejects.toMatchObject({
+      name: "ProviderHttpError",
+      status: 200,
+      code: "invalid_provider_content_type",
+      errorType: "invalid_response",
+    });
+    expect(release).toHaveBeenCalled();
+  });
+
   it("ensures configured local services before the model request", async () => {
     const release = vi.fn();
     ensureModelProviderLocalServiceMock.mockResolvedValue({ release });
diff --git a/src/agents/provider-transport-fetch.ts b/src/agents/provider-transport-fetch.ts
@@ -43,6 +43,7 @@ import {
 } from "./provider-request-config.js";
 
 const DEFAULT_MAX_SDK_RETRY_WAIT_SECONDS = 60;
+const OPENAI_SDK_STREAM_CONTENT_SNIFF_BYTES = 2 * 1024;
 const log = createSubsystemLogger("provider-transport-fetch");
 const BLOCKED_EXACT_ORIGIN_TRUST_HOSTNAME_LABELS = new Set(["instance-data"]);
 const PLAIN_DECIMAL_NUMBER_RE = /^\d+(?:\.\d+)?$/;
@@ -233,15 +234,93 @@ function isOpenAISdkStreamContentType(contentType: string): boolean {
   return /\btext\/event-stream\b/i.test(contentType) || isJsonContentType(contentType);
 }
 
-async function assertOpenAISdkStreamContentType(params: {
+type OpenAISdkStreamBodyKind = "html" | "json" | "sse" | "unknown";
+
+function classifyOpenAISdkStreamBodyPrefix(text: string): OpenAISdkStreamBodyKind {
+  const trimmed = text.replace(/^\uFEFF/u, "").trimStart();
+  if (!trimmed) {
+    return "unknown";
+  }
+  if (trimmed.startsWith("<")) {
+    return "html";
+  }
+  if (trimmed.startsWith("{") || trimmed.startsWith("[")) {
+    return "json";
+  }
+  if (/^(?::|(?:data|event|id|retry)(?::|\r?\n|\r))/u.test(trimmed)) {
+    return "sse";
+  }
+  const boundary = findSseEventBoundary(text);
+  if (boundary && hasReadableSseData(text.slice(0, boundary.index))) {
+    return "sse";
+  }
+  return "unknown";
+}
+
+async function classifyOpenAISdkStreamBody(response: Response): Promise<OpenAISdkStreamBodyKind> {
+  const reader = response.clone().body?.getReader();
+  if (!reader) {
+    return "unknown";
+  }
+
+  const decoder = new TextDecoder();
+  let total = 0;
+  let text = "";
+  try {
+    while (total < OPENAI_SDK_STREAM_CONTENT_SNIFF_BYTES) {
+      const { value, done } = await reader.read();
+      if (done) {
+        break;
+      }
+      if (!value || value.byteLength === 0) {
+        continue;
+      }
+      const remaining = OPENAI_SDK_STREAM_CONTENT_SNIFF_BYTES - total;
+      const chunk = value.byteLength > remaining ? value.subarray(0, remaining) : value;
+      total += chunk.byteLength;
+      text += decoder.decode(chunk, { stream: true });
+      const kind = classifyOpenAISdkStreamBodyPrefix(text);
+      if (kind !== "unknown") {
+        return kind;
+      }
+    }
+    text += decoder.decode();
+    return classifyOpenAISdkStreamBodyPrefix(text);
+  } finally {
+    void reader.cancel().catch(() => undefined);
+  }
+}
+
+function withOpenAISdkStreamContentType(response: Response, contentType: string): Response {
+  const headers = new Headers(response.headers);
+  headers.set("content-type", contentType);
+  return new Response(response.body, {
+    status: response.status,
+    statusText: response.statusText,
+    headers,
+  });
+}
+
+async function normalizeOpenAISdkStreamContentType(params: {
   response: Response;
   model: Model;
   release: () => Promise<void>;
   localServiceLease?: ProviderLocalServiceLease;
-}): Promise<void> {
+}): Promise<Response> {
   const contentType = params.response.headers.get("content-type") ?? "";
   if (!params.response.ok || !params.response.body || isOpenAISdkStreamContentType(contentType)) {
-    return;
+    return params.response;
+  }
+  if (!contentType.trim()) {
+    // ChatGPT Codex can stream valid SSE with no content-type header. Sniff a
+    // clone so the SDK still receives the original body once we normalize it.
+    const kind = await classifyOpenAISdkStreamBody(params.response).catch(() => "unknown" as const);
+    if (kind === "sse") {
+      return withOpenAISdkStreamContentType(params.response, "text/event-stream; charset=utf-8");
+    }
+    if (kind === "json") {
+      return withOpenAISdkStreamContentType(params.response, "application/json; charset=utf-8");
+    }
   }
   const body = await readResponseTextLimited(params.response).catch(() => "");
   await params.release().catch(() => undefined);
@@ -760,7 +839,7 @@ export function buildGuardedModelFetch(
       });
     }
     if (synthesizeJsonAsSse && options?.sanitizeSse !== false) {
-      await assertOpenAISdkStreamContentType({
+      response = await normalizeOpenAISdkStreamContentType({
         response,
         model,
         release: result.release,