test(e2e): migrate messaging compatible endpoint by cv · Pull Request #5362 · NVIDIA/NemoClaw

cv · 2026-06-12T19:18:56Z

Summary

Migrates test/e2e/test-messaging-compatible-endpoint.sh into a focused live Vitest scenario with a local OpenAI-compatible endpoint mock and Telegram-enabled custom-provider onboarding. Adds the free-standing workflow dispatch job and boundary tests needed to run the migrated scenario from CI.

Related Issue

Refs #5098

Changes

Add test/e2e-scenario/live/messaging-compatible-endpoint.test.ts covering the legacy compatible endpoint, inference.local, OpenClaw agent turn, Telegram config, and proxy hop-header stripping contracts.
Register messaging-compatible-endpoint-vitest in the free-standing E2E inventory and workflow dispatch job.
Extend workflow boundary/support tests, including transient endpoint-validation rate-limit skip classification and cleanup tolerance for pre-sandbox failures.

Type of Change

Code change (feature, bug fix, or refactor)
Code change with doc updates
Doc only (prose changes, no code sample modifications)
Doc only (includes code sample changes)

Verification

npx prek run --all-files passes
npm test passes
Tests added or updated for new or changed behavior
No secrets, API keys, or credentials committed
Docs updated for user-facing behavior changes
npm run docs builds without warnings (doc changes only)
Doc pages follow the style guide (doc changes only)
New doc pages include SPDX header and frontmatter (new pages only)

Targeted verification run:

npx biome check --write test/e2e-scenario/live/messaging-compatible-endpoint.test.ts test/e2e-scenario/live/network-policy-transient-provider.ts test/e2e-scenario/support-tests/network-policy-transient-provider.test.ts
npx vitest run --project e2e-vitest-support test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts test/e2e-scenario/support-tests/network-policy-transient-provider.test.ts --reporter=default
NEMOCLAW_RUN_E2E_SCENARIOS=1 npx vitest run --project e2e-scenarios-live test/e2e-scenario/live/messaging-compatible-endpoint.test.ts -t "messaging-compatible-endpoint live test local classifiers" --reporter=default
npm run typecheck:cli
npm run build:cli
npx tsx scripts/check-test-file-size-budget.ts test/e2e-scenario/live/messaging-compatible-endpoint.test.ts

Note: npx prek run --files ... reached the broad test-cli hook and failed on unrelated 5s timeout tests (test/cli/snapshot-shields.test.ts and src/lib/onboard/web-search-flow.test.ts). The migration-specific support tests passed in that run.

Signed-off-by: Carlos Villela cvillela@nvidia.com

Scope Note

Confirmed against #5098 migration scope: this PR intentionally migrates only the messaging-compatible endpoint Vitest slice. Deleting test/e2e/test-messaging-compatible-endpoint.sh and removing any durable legacy/nightly shell wiring remain deferred to #5098 Phase 11 cleanup.

Summary by CodeRabbit

Tests
- Added live end-to-end Vitest scenario exercising messaging-compatible endpoint flows with a mock compatible API, sandbox orchestration, and new assertions.
- Expanded transient-provider classification tests and helper-unit coverage for parsing agent output.
- Added workflow-boundary tests validating the new scenario’s CI behavior.
Chores
- Introduced a dedicated CI Vitest job for messaging-compatible endpoint and wired its result into PR reporting.
- Extended workflow validation rules to enforce job shape, env safety, and artifact upload conventions.

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

copy-pr-bot · 2026-06-12T19:18:59Z

Auto-sync is disabled for draft pull requests in this repository. Workflows must be run manually.

Contributors can view more details about this message here.

coderabbitai · 2026-06-12T19:19:04Z

Note

Reviews paused

It looks like this branch is under active development. To avoid overwhelming you with review comments due to an influx of new commits, CodeRabbit has automatically paused this review. You can configure this behavior by changing the reviews.auto_review.auto_pause_after_reviewed_commits setting.

Use the following commands to manage reviews:

@coderabbitai resume to resume automatic reviews.
@coderabbitai review to trigger a single review.

Use the checkboxes below for quick actions:

▶️ Resume reviews
🔍 Trigger review

📝 Walkthrough

Walkthrough

Adds a live Vitest e2e scenario that runs a local OpenAI-compatible mock, orchestrates host/sandbox onboarding, validates inference and agent flows (including hop-by-hop header leakage checks), provides helper utilities and tests, and wires a new free-standing workflow job plus boundary validators and dispatch tests.

Changes

Messaging-compatible endpoint scenario and workflow integration

Layer / File(s)	Summary
Cleanup and environment helpers `test/e2e-scenario/live/messaging-compatible-endpoint-helpers.ts`	`commandEnv()` assembles process env with availability probes and Nemo/OpenShell flags; `bestEffort()` suppresses teardown errors; `stopGatewayRuntime()` remotely executes gateway/Docker cleanup; `cleanupMessagingState()` sequentially destroys Nemo sandbox, OpenShell sandbox, and gateway.
Agent output and JSON extraction utilities `test/e2e-scenario/live/messaging-compatible-endpoint-helpers.ts`	`findJsonObjectEnd()` locates balanced JSON objects; `parseOpenClawAgentText()` extracts text/route tokens by strict JSON parse, recursive field scanning, and fallback object scanning of noisy output.
Helper utility tests `test/e2e-scenario/support-tests/messaging-compatible-endpoint-helpers.test.ts`	Tests verify `cleanupMessagingState()` rethrows validation errors without masking, enforces CLI cleanup call ordering, and `parseOpenClawAgentText()` ignores prompt-echo while extracting route tokens from noisy and OpenAI-style JSON outputs.
OpenAI-compatible mock HTTP server `test/e2e-scenario/live/messaging-compatible-endpoint.test.ts`	`startCompatibleMock()` implements model listing and chat/completions/responses endpoints (JSON or SSE), enforces Bearer auth, logs hop-by-hop header names, records request metadata, and polls until reachable.
Host/sandbox onboarding and orchestration `test/e2e-scenario/live/messaging-compatible-endpoint.test.ts`	`hostAddressForSandbox()` computes sandbox-reachable IP; `sourceCliAvailable()` detects prebuilt CLI; `onboardEnv()` builds onboarding env; `runCompatibleOnboard()` runs onboarding with retry and gateway-shutdown-on-retry logic.
Sandbox-side runtime assertions and liveTest scenario `test/e2e-scenario/live/messaging-compatible-endpoint.test.ts`	`assertOpenClawConfigShape()` validates openclaw.json; `assertGatewayReady()` polls TCP readiness; `assertSandboxInference()` verifies compatible route token in inference responses; `assertOpenClawAgentTurn()` runs agent, parses output, and asserts no hop-by-hop header-name leakage. Main `liveTest()` orchestrates Docker checks, cleanup, mock/onboarding, assertions, and artifact outputs.
GitHub Actions workflow job definition `.github/workflows/e2e-vitest-scenarios.yaml`	Adds `messaging-compatible-endpoint-vitest` free-standing job with selector, sandbox/artifact env, fake compatibility/Telegram env, Vitest execution, and artifact upload. Updates `report-to-pr` to depend on it.
Workflow boundary validator for job wiring and constraints `tools/e2e-scenarios/workflow-boundary.mts`	`validateMessagingCompatibleEndpointVitestJob()` enforces runner/timeout/selector wiring, required fake env values and pinned sandbox name, prohibits `NVIDIA_API_KEY`/`DOCKERHUB_USERNAME`/`DOCKERHUB_TOKEN` exposure and pre-branch Docker Hub auth steps, requires pinned checkout/setup-node and build/install/run steps, and validates artifact upload settings. Wired into workflow boundary checks.
Workflow dispatch selector and boundary validation tests `test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts`	Adds dispatch-selector coverage mapping scenario/job selection to the new vitest job and boundary tests that detect missing job/dependency and reject injected Docker Hub auth steps/env exposure.

Transient provider and network-policy test infrastructure improvements

Layer / File(s)	Summary
Transient provider validation classifier improvements `test/e2e-scenario/live/network-policy-transient-provider.ts`, `test/e2e-scenario/support-tests/network-policy-transient-provider.test.ts`	Adds `TRANSIENT_PROVIDER_DETAIL_RE` to detect rate-limit/quota/timeout failures, introduces `LOCAL_VALIDATION_FAILURE_RE` to exclude local credential/auth/policy failures, and updates `isTransientProviderValidationFailure()` predicate. Tests expanded to cover provider rate-limit and additional endpoint-validation message variants.
Network-policy test script execution and assertion updates `test/e2e-scenario/live/network-policy.test.ts`	Adds `shellEvalArg()` to base64-encode scripts for sandbox execution; updates `sandboxBash` to use it; reorders fixture imports; adjusts preset-selection regex escaping; broadens Slack before-assertion to accept `STATUS_403` or `ERROR_` outputs.

Estimated code review effort

🎯 4 (Complex) | ⏱️ ~60 minutes

Possibly related PRs

NVIDIA/NemoClaw#5370: Related free-standing job/scenario selector changes and inventory tooling that this new job relies on.
NVIDIA/NemoClaw#5243: Adds Vitest job-selector/report-to-pr wiring used by this new vitest job.
NVIDIA/NemoClaw#5221: Another PR that extends e2e Vitest workflow and boundary validation with a new free-standing vitest job.

Suggested labels

area: e2e

Suggested reviewers

prekshivyas

Poem

🐰 I spun a mock, I ran a test,
Sandbox and agent did their best,
Tokens found in noisy streams,
Hop-by-hop headers kept their seams,
E2E hops — a tidy nest!

🚥 Pre-merge checks | ✅ 4 | ❌ 1

❌ Failed checks (1 warning)

Check name	Status	Explanation	Resolution
Docstring Coverage	⚠️ Warning	Docstring coverage is 0.00% which is insufficient. The required threshold is 80.00%.	Write docstrings for the functions missing them to satisfy the coverage threshold.

✅ Passed checks (4 passed)

Check name	Status	Explanation
Description Check	✅ Passed	Check skipped - CodeRabbit’s high-level summary is enabled.
Title check	✅ Passed	The title 'test(e2e): migrate messaging compatible endpoint' directly aligns with the main change: migrating a legacy shell-based e2e test into a focused live Vitest scenario with corresponding workflow and boundary validation updates.
Linked Issues check	✅ Passed	Check skipped because no linked issues were found for this pull request.
Out of Scope Changes check	✅ Passed	Check skipped because no linked issues were found for this pull request.

_{✏️ Tip: You can configure your own custom pre-merge checks in the settings.}

✨ Finishing Touches

🧪 Generate unit tests (beta)

Create PR with unit tests
Commit unit tests in branch codex/5098-messaging-compatible-endpoint

_{Comment @coderabbitai help to get the list of available commands and usage tips.}

github-actions · 2026-06-12T19:21:34Z

E2E Advisor Recommendation

Required E2E: None
Optional E2E: None

Workflow run

Full advisor summary

E2E Recommendation Advisor

Failed: Could not parse JSON from advisor output; see /home/runner/work/NemoClaw/NemoClaw/artifacts/e2e-advisor/e2e-advisor-raw-output.txt

github-actions · 2026-06-12T19:21:35Z

Vitest E2E Scenario Recommendation

Required Vitest E2E scenarios: None
Optional Vitest E2E scenarios: None

Workflow run

Full Vitest E2E advisor summary

Vitest E2E Scenario Advisor

Failed: Could not parse JSON from advisor output; see /home/runner/work/NemoClaw/NemoClaw/artifacts/e2e-advisor/e2e-scenario-advisor-raw-output.txt

github-actions · 2026-06-12T19:25:16Z

PR Review Advisor

Findings: 0 needs attention, 1 worth checking, 0 nice ideas
Top item: PR review advisor unavailable

Review findings

🛠️ Needs attention

None.

🔎 Worth checking

PR review advisor unavailable: The automated advisor could not complete: Could not parse JSON from PR review advisor output; see /home/runner/work/NemoClaw/NemoClaw/artifacts/pr-review-advisor/pr-review-advisor-raw-output.txt
- Recommendation: Re-run the PR Review Advisor or perform a manual review.
- Evidence: Could not parse JSON from PR review advisor output; see /home/runner/work/NemoClaw/NemoClaw/artifacts/pr-review-advisor/pr-review-advisor-raw-output.txt

🌱 Nice ideas

None.

Consider writing more tests for

**Runtime validation** — Add or identify targeted runtime/integration validation for the changed behavior; do not report external E2E job pass/fail here.. Runtime/sandbox/infrastructure paths need behavioral runtime validation: .github/workflows/e2e-vitest-scenarios.yaml, tools/e2e-scenarios/workflow-boundary.mts.

Workflow run details

This is an automated advisory review. A human maintainer must make the final merge decision.

github-actions · 2026-06-12T19:26:27Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27437963918
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⚠️ cancelled
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T19:26:29Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27437963971
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: launchable-smoke-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⚠️ cancelled
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T19:26:29Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27437777296
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⚠️ cancelled
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T19:36:19Z

Vitest E2E Scenario Results — ❌ Some jobs failed

Run: 27438223514
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 1 passed, 1 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	❌ failure
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Failed jobs: messaging-compatible-endpoint-vitest. Check run artifacts for logs.

github-actions · 2026-06-12T19:38:43Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438465910
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	✅ success
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T19:41:16Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438466027
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: launchable-smoke-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⚠️ cancelled
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T19:41:23Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438465945
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⚠️ cancelled
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T19:45:27Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438779383
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⚠️ cancelled
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

+
+function nodeEvalArg(source: string): string {
+  const encoded = Buffer.from(source, "utf8").toString("base64");
+  return `eval(Buffer.from(${JSON.stringify(encoded)}, "base64").toString("utf8"))`;


github-actions · 2026-06-12T19:47:36Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438914870
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	✅ success
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T19:50:23Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438914973
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	✅ success
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T19:50:51Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27438914913
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: launchable-smoke-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	✅ success
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T20:01:02Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27439518876
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	✅ success
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T20:01:56Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27439518922
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	✅ success
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T20:03:31Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27439518985
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: launchable-smoke-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	✅ success
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T20:11:44Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27440106575
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	✅ success
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T20:14:05Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27440106503
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: launchable-smoke-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	✅ success
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T20:54:32Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27442141768
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: launchable-smoke-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	✅ success
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T20:54:48Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27442141735
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	✅ success
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T21:03:00Z

Vitest E2E Scenario Results — ❌ Some jobs failed

Run: 27442601602
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 1 passed, 1 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	❌ failure
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Failed jobs: network-policy-vitest. Check run artifacts for logs.

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T21:07:42Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27443004907
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⚠️ cancelled
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T21:07:43Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27443006263
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⚠️ cancelled
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

coderabbitai

Actionable comments posted: 3

🤖 Prompt for all review comments with AI agents

Verify each finding against current code. Fix only still-valid issues, skip the
rest with a brief reason, keep changes minimal, and validate.

Inline comments:
In `@test/e2e-scenario/live/messaging-compatible-endpoint-helpers.ts`:
- Around line 155-168: parseOpenClawAgentText currently treats record content
values as plain strings (using add(record[key])) and therefore skips structured
payloads like content: [{ type: "output_text", text: "..." }]; update the logic
in the loop that iterates containerKeys/record keys (and the choices handling)
to detect arrays/objects and recurse or traverse them to extract nested text
fields (e.g., content[].text and content[].message/delta) before calling add or
collect, keeping existing helpers add and collect and reusing the choices/record
handling to walk nested objects/arrays rather than only accepting strings.

In `@test/e2e-scenario/live/messaging-compatible-endpoint.test.ts`:
- Around line 153-159: The mock currently returns 200 for GET /v1/models and
/models even when no bearer token is provided; update the conditional handling
in the GET branch so it requires auth (e.g., check that auth is present/truthy)
before returning the model list: if auth is missing, respond with a 401 JSON
error and do not push the request to requests, otherwise proceed to push ({
method: "GET", path: requestPath, auth, hopHeaders: [] }) and return the 200
jsonResponse with the model payload using the existing jsonResponse helper and
the model variable.

In `@test/e2e-scenario/live/network-policy.test.ts`:
- Around line 67-70: The wrapper always returns a non-empty command which masks
empty-input checks in trustedSandboxShellScript; modify shellEvalArg to first
detect an empty or whitespace-only script and return an empty string immediately
(so callers can validate/handle empties), otherwise perform the base64 encoding
and return the printf|base64 -d|sh wrapper as before; ensure callers of
shellEvalArg (e.g., trustedSandboxShellScript) continue to rely on an empty
return value to signal no-op input.

🪄 Autofix (Beta)

Fix all unresolved CodeRabbit comments on this PR:

Push a commit to this branch (recommended)
Create a new PR with the fixes

ℹ️ Review info

⚙️ Run configuration

Configuration used: Path: .coderabbit.yaml

Review profile: CHILL

Plan: Enterprise

Run ID: a1de2f9f-18bd-4cf0-9cc4-aae0fc7239c0

📥 Commits

Reviewing files that changed from the base of the PR and between 7f583ed and c97fd9d.

📒 Files selected for processing (10)

.github/workflows/e2e-vitest-scenarios.yaml
test/e2e-scenario/live/messaging-compatible-endpoint-helpers.ts
test/e2e-scenario/live/messaging-compatible-endpoint.test.ts
test/e2e-scenario/live/network-policy-transient-provider.ts
test/e2e-scenario/live/network-policy.test.ts
test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts
test/e2e-scenario/support-tests/messaging-compatible-endpoint-helpers.test.ts
test/e2e-scenario/support-tests/network-policy-transient-provider.test.ts
tools/e2e-scenarios/free-standing-jobs.env
tools/e2e-scenarios/workflow-boundary.mts

github-actions · 2026-06-12T21:14:07Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27443238420
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	✅ success
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T21:16:32Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27443236917
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	✅ success
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-actions · 2026-06-12T21:36:33Z

Vitest E2E Scenario Results — ❌ Some jobs failed

Run: 27444186648
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 1 passed, 1 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	❌ failure
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

Failed jobs: network-policy-vitest. Check run artifacts for logs.

github-actions · 2026-06-12T21:37:10Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27444185425
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: messaging-compatible-endpoint-vitest
Summary: 2 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	✅ success
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⏭️ skipped
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

github-actions · 2026-06-12T21:38:44Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27444255765
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: messaging-compatible-endpoint,network-policy
Requested jobs: (default — all free-standing when no scenarios are requested)
Summary: 3 passed, 0 failed, 21 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	✅ success
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	✅ success
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

cv · 2026-06-12T21:40:52Z

PR Advisor follow-up: confirmed against the #5098 migration scope for this task that this PR intentionally migrates only the messaging-compatible-endpoint Vitest slice. Legacy shell deletion and durable nightly shell wiring removal remain deferred to the #5098 Phase 11 cleanup so this PR can preserve the existing shell/system boundary while adding the new live Vitest coverage.

github-actions · 2026-06-12T21:45:17Z

Vitest E2E Scenario Results — ✅ All jobs passed

Run: 27444600238
Workflow ref: codex/5098-messaging-compatible-endpoint
Requested scenarios: (default — all supported)
Requested jobs: network-policy-vitest
Summary: 1 passed, 0 failed, 22 skipped

Job	Result
credential-migration-vitest	⏭️ skipped
credential-sanitization-vitest	⏭️ skipped
double-onboard-vitest	⏭️ skipped
gateway-guard-recovery	⏭️ skipped
generate-matrix	✅ success
hermes-e2e-vitest	⏭️ skipped
hermes-root-entrypoint-smoke-vitest	⏭️ skipped
inference-routing-vitest	⏭️ skipped
issue-4434-tui-unreachable-inference-vitest	⏭️ skipped
launchable-smoke-vitest	⏭️ skipped
live-scenarios	⏭️ skipped
messaging-compatible-endpoint-vitest	⏭️ skipped
model-router-provider-routed-inference-vitest	⏭️ skipped
network-policy-vitest	⚠️ cancelled
onboard-negative-paths-vitest	⏭️ skipped
openclaw-tui-chat-correlation-vitest	⏭️ skipped
openshell-version-pin-vitest	⏭️ skipped
rebuild-openclaw-vitest	⏭️ skipped
runtime-overrides-vitest	⏭️ skipped
sandbox-rebuild-vitest	⏭️ skipped
sandbox-survival-vitest	⏭️ skipped
shields-config-vitest	⏭️ skipped
skill-agent-vitest	⏭️ skipped
token-rotation-vitest	⏭️ skipped

coderabbitai

🧹 Nitpick comments (2)

test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts (2)
677-686: ⚡ Quick win

Assert the derived report-to-pr failure here too.

This synthetic FREE_STANDING_VITEST_JOB test only checks the per-job violations. If the inventory-to-report-to-pr coupling regresses, this still passes even though PR reporting would stop waiting on ad-hoc-derived-vitest. Add report-to-pr job must wait for ad-hoc-derived-vitest to the expected errors.
🤖 Prompt for AI Agents
Verify each finding against current code. Fix only still-valid issues, skip the
rest with a brief reason, keep changes minimal, and validate.

In `@test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts` around lines
677 - 686, The test's expected violations list for
validateE2eVitestScenariosWorkflowBoundary is missing the coupling assertion
that the report-to-pr job depends on ad-hoc-derived-vitest; update the array
passed to expect.arrayContaining in the test (the block where
validateE2eVitestScenariosWorkflowBoundary(workflowPath) is asserted) to include
the string "report-to-pr job must wait for ad-hoc-derived-vitest" so the
synthetic FREE_STANDING_VITEST_JOB scenario also asserts the
inventory-to-report-to-pr dependency regression.
701-708: ⚡ Quick win

Stop mutating the workflow fixture with exact-string replacements.

Both tests depend on literal indentation and newline matches to rename the job and remove its report-to-pr need. A harmless YAML reformat or reordered needs list will leave the fixture unchanged and make these tests fail for the wrong reason. Parse the workflow and edit jobs[...] / jobs["report-to-pr"].needs structurally, like the object-based mutation used above.

Also applies to: 730-737
🤖 Prompt for AI Agents
Verify each finding against current code. Fix only still-valid issues, skip the
rest with a brief reason, keep changes minimal, and validate.

In `@test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts` around lines
701 - 708, The tests currently mutate the workflow fixture via fragile string
replacements on the workflow variable when writing to renamedWorkflowPath and
missingReportNeedPath; instead parse the YAML into an object, locate and rename
the job under jobs (e.g., update jobs["runtime-overrides-vitest"] to
jobs["runtime-overrides-missing"] or move its entry), and remove the
"runtime-overrides-vitest" entry from jobs["report-to-pr"].needs structurally,
then serialize the YAML back to disk and write to
renamedWorkflowPath/missingReportNeedPath; use the same object-based mutation
pattern used elsewhere in the file (jobs[...] and jobs["report-to-pr"].needs) to
avoid brittle exact-string edits.

🤖 Prompt for all review comments with AI agents

Verify each finding against current code. Fix only still-valid issues, skip the
rest with a brief reason, keep changes minimal, and validate.

Nitpick comments:
In `@test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts`:
- Around line 677-686: The test's expected violations list for
validateE2eVitestScenariosWorkflowBoundary is missing the coupling assertion
that the report-to-pr job depends on ad-hoc-derived-vitest; update the array
passed to expect.arrayContaining in the test (the block where
validateE2eVitestScenariosWorkflowBoundary(workflowPath) is asserted) to include
the string "report-to-pr job must wait for ad-hoc-derived-vitest" so the
synthetic FREE_STANDING_VITEST_JOB scenario also asserts the
inventory-to-report-to-pr dependency regression.
- Around line 701-708: The tests currently mutate the workflow fixture via
fragile string replacements on the workflow variable when writing to
renamedWorkflowPath and missingReportNeedPath; instead parse the YAML into an
object, locate and rename the job under jobs (e.g., update
jobs["runtime-overrides-vitest"] to jobs["runtime-overrides-missing"] or move
its entry), and remove the "runtime-overrides-vitest" entry from
jobs["report-to-pr"].needs structurally, then serialize the YAML back to disk
and write to renamedWorkflowPath/missingReportNeedPath; use the same
object-based mutation pattern used elsewhere in the file (jobs[...] and
jobs["report-to-pr"].needs) to avoid brittle exact-string edits.

ℹ️ Review info

⚙️ Run configuration

Configuration used: Path: .coderabbit.yaml

Review profile: CHILL

Plan: Enterprise

Run ID: 78f15341-2644-459f-9d28-38180ae3b81e

📥 Commits

Reviewing files that changed from the base of the PR and between 1a9e586 and e09fde8.

📒 Files selected for processing (3)

.github/workflows/e2e-vitest-scenarios.yaml
test/e2e-scenario/support-tests/e2e-scenarios-workflow.test.ts
tools/e2e-scenarios/workflow-boundary.mts

🚧 Files skipped from review as they are similar to previous changes (2)

.github/workflows/e2e-vitest-scenarios.yaml
tools/e2e-scenarios/workflow-boundary.mts

…compatible-endpoint

test(e2e): migrate messaging compatible endpoint

30d7e03

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

cv self-assigned this Jun 12, 2026

test(e2e): address messaging endpoint review

fe649c6

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

test(e2e): harden messaging compatible endpoint checks

825a2af

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

test(e2e): tighten messaging endpoint assertions

9f0d468

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

github-advanced-security AI found potential problems Jun 12, 2026

View reviewed changes

Comment thread test/e2e-scenario/live/messaging-compatible-endpoint.test.ts

function nodeEvalArg(source: string): string {

const encoded = Buffer.from(source, "utf8").toString("base64");

return `eval(Buffer.from(${JSON.stringify(encoded)}, "base64").toString("utf8"))`;

test(e2e): prove messaging endpoint rate-limit source

c316b75

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

test(e2e): narrow messaging endpoint rate-limit skip

03fdfc0

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

test(e2e): fail closed for messaging endpoint migration

2956eb5

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

test(e2e): preserve network policy shell quoting

bc3b9da

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

test(e2e): cover messaging endpoint helpers

c97fd9d

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

cv marked this pull request as ready for review June 12, 2026 21:03

cv assigned jyaunches Jun 12, 2026

test(e2e): fix network policy preset selector

c1d0f58

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

coderabbitai Bot reviewed Jun 12, 2026

View reviewed changes

Comment thread test/e2e-scenario/live/messaging-compatible-endpoint-helpers.ts

Comment thread test/e2e-scenario/live/messaging-compatible-endpoint.test.ts

Comment thread test/e2e-scenario/live/network-policy.test.ts

test(e2e): refine live scenario helpers

1a9e586

Signed-off-by: Carlos Villela <cvillela@nvidia.com>

cv added the v0.0.65 Release target label Jun 13, 2026

chore: merge main into messaging compatible endpoint PR

e09fde8

coderabbitai Bot reviewed Jun 13, 2026

View reviewed changes

cv added 5 commits June 12, 2026 18:59

Merge remote-tracking branch 'origin/main' into codex/5098-messaging-…

6bf2bad

…compatible-endpoint

Merge branch 'main' into codex/5098-messaging-compatible-endpoint

073f89b

Merge remote-tracking branch 'origin/main' into codex/5098-messaging-…

34a648e

…compatible-endpoint

Merge remote-tracking branch 'origin/main' into codex/5098-messaging-…

c6ed241

…compatible-endpoint

Merge remote-tracking branch 'origin/main' into codex/5098-messaging-…

eca4368

…compatible-endpoint

cv merged commit 1015077 into main Jun 13, 2026
38 checks passed

cv deleted the codex/5098-messaging-compatible-endpoint branch June 13, 2026 05:53

cv mentioned this pull request Jun 13, 2026

Epic: Migrate legacy bash E2E into the Vitest E2E system #5098

Open

79 tasks

Conversation

cv commented Jun 12, 2026 • edited by coderabbitai Bot Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Summary

Related Issue

Changes

Type of Change

Verification

Scope Note

Summary by CodeRabbit

Uh oh!

copy-pr-bot Bot commented Jun 12, 2026

Uh oh!

coderabbitai Bot commented Jun 12, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Reviews paused

Walkthrough

Changes

Estimated code review effort

Possibly related PRs

Suggested labels

Suggested reviewers

Poem

❌ Failed checks (1 warning)

Uh oh!

github-actions Bot commented Jun 12, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

E2E Advisor Recommendation

E2E Recommendation Advisor

Uh oh!

github-actions Bot commented Jun 12, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Vitest E2E Scenario Recommendation

Vitest E2E Scenario Advisor

Uh oh!

github-actions Bot commented Jun 12, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

PR Review Advisor

🛠️ Needs attention

🔎 Worth checking

🌱 Nice ideas

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ❌ Some jobs failed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

Uh oh!

github-actions Bot commented Jun 12, 2026

Vitest E2E Scenario Results — ✅ All jobs passed

cv commented Jun 12, 2026 •

edited by coderabbitai Bot

Loading

coderabbitai Bot commented Jun 12, 2026 •

edited

Loading

github-actions Bot commented Jun 12, 2026 •

edited

Loading

github-actions Bot commented Jun 12, 2026 •

edited

Loading

github-actions Bot commented Jun 12, 2026 •

edited

Loading