jmeadlock

jmeadlock

Popular repositories Loading

Calculator Calculator Public
milo-bench milo-bench Public

Frozen, deterministic, longitudinal benchmark suite for LLMs. Tests inference engine + model combinations for fair year-over-year comparisons.

Python