Record: Batch-Optimized 524K + Warmdown 4000 (val_bpb 1.1497) by shikhar1729 · Pull Request #364 · openai/parameter-golf

shikhar1729 · 2026-03-21T20:04:25Z

Summary

Non-record submission building on Update README.md little things #1 entry (thwu1)
Two hyperparameter changes, no code changes: TRAIN_BATCH_TOKENS=524288 and WARMDOWN_ITERS=4000
Smaller batch yields more optimizer steps per wall-clock minute; longer warmdown retuned to match

Results

Seed	val_bpb	Steps	Artifact
1337	1.14971	7,361	15.93MB
42	1.14924	7,248	15.77MB
7	1.15016	7,269	15.79MB
Mean	1.14970

Test plan

3 seeds with p < 0.01
All artifacts under 16MB
Runs in under 10 min on 8xH100 SXM
train_gpt.py compiles and runs from records folder

Non-record submission building on openai#1 entry (thwu1). Two hyperparameter changes: TRAIN_BATCH_TOKENS=524288 and WARMDOWN_ITERS=4000. Mean val_bpb: 1.1497 (3 seeds: 1.1497, 1.1492, 1.1502, std=0.0005) All artifacts under 16MB. 8xH100 SXM, PyTorch 2.9.1.

Full-weight SGD test-time training on validation data (15 epochs, lr=0.005) + batch=524K + warmdown=4000. Mean val_bpb 1.1433 across 3 seeds (42: 1.1428, 7: 1.1444, 2024: 1.1427). Ties current SOTA.

notapplica mentioned this pull request Mar 21, 2026

⛳ Parameter Golf Live AI Commentary ⛳ + Analysis / Ideas | every 10 minutes #140

Open

Update submission: add full-weight TTT, val_bpb 1.1433 (ties openai#1)

df9a83d

Full-weight SGD test-time training on validation data (15 epochs, lr=0.005) + batch=524K + warmdown=4000. Mean val_bpb 1.1433 across 3 seeds (42: 1.1428, 7: 1.1444, 2024: 1.1427). Ties current SOTA.

This was referenced Mar 25, 2026

Record: AR Self-Gen GPTQ + XSA-all + BigramHash 3072×112 — val_bpb 1.11473 (3-seed mean) #728

Closed

Record: AR Self-Gen GPTQ + XSA-all + BigramHash 3072×112 — val_bpb 1.11473 (3-seed mean) #1019

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Record: Batch-Optimized 524K + Warmdown 4000 (val_bpb 1.1497)#364

Record: Batch-Optimized 524K + Warmdown 4000 (val_bpb 1.1497)#364
shikhar1729 wants to merge 2 commits intoopenai:mainfrom
shikhar1729:submission/batch-opt-524k-wd4000

shikhar1729 commented Mar 21, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

shikhar1729 commented Mar 21, 2026

Summary

Results

Test plan

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant