server : handle context overflow during decode by ggerganov · Pull Request #17267 · ggml-org/llama.cpp

ggerganov · 2025-11-14T10:03:48Z

If we overrun the total context size, clear the active slots
Rename purge -> clear
Remove obsolete kv_cache_clear()

* server : handle context overflow during decode * server : minor refactor

ggerganov mentioned this pull request Nov 14, 2025

Eval bug: Recent updates lead to /infill requests on the Qwen2.5-Coder model failing and ultimately crashing. #17260

Closed

github-actions bot added examples server labels Nov 14, 2025

Base automatically changed from gg/server-fix-can-batch-with to master November 14, 2025 12:03

ggerganov added 2 commits November 14, 2025 14:04

server : handle context overflow during decode

b951161

server : minor refactor

741baaf

ggerganov force-pushed the gg/server-fix-decode-error-handling branch from 82eb17b to 741baaf Compare November 14, 2025 12:04

ggerganov marked this pull request as ready for review November 14, 2025 12:05

ggerganov requested a review from ngxson as a code owner November 14, 2025 12:05

ngxson approved these changes Nov 14, 2025

View reviewed changes

ggerganov merged commit 5b2093b into master Nov 16, 2025
72 checks passed

ggerganov deleted the gg/server-fix-decode-error-handling branch November 16, 2025 07:23

Anico2 added a commit to Anico2/llama.cpp that referenced this pull request Jan 15, 2026

server : handle context overflow during decode (ggml-org#17267)

7f7ae14

* server : handle context overflow during decode * server : minor refactor

blime4 referenced this pull request in blime4/llama.cpp Feb 5, 2026

server : handle context overflow during decode (#17267)

626d6d3

* server : handle context overflow during decode * server : minor refactor

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

server : handle context overflow during decode#17267

server : handle context overflow during decode#17267
ggerganov merged 2 commits intomasterfrom
gg/server-fix-decode-error-handling

ggerganov commented Nov 14, 2025 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

ggerganov commented Nov 14, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

ggerganov commented Nov 14, 2025 •

edited

Loading