FrontierMath: Benchmarking AI against advanced mathematical research

FrontierMath includes both carefully crafted challenge problems and open research problems that remain unsolved by mathematicians.

FrontierMath Tiers 1–4

A benchmark of several hundred unpublished, highly challenging mathematics problems. Difficulty Tiers 1-3 cover undergraduate through early postdoc level problems, while Tier 4 is research-level mathematics.

Open Problems

A collection of unsolved mathematics problems that have resisted serious attempts by professional mathematicians. AI solutions would meaningfully advance the state of human mathematical knowledge.

Research & Commentary

More

Datasets

Benchmarking Data

By Epoch AI

FrontierMath: Benchmarking AI against advanced mathematical research

FrontierMath Tiers 1–4

Open Problems

FrontierMath

Research & Commentary

More

Datasets

Benchmarking Data

By Epoch AI

AI Trends & Statistics

Papers & Reports

Newsletter: Gradient Updates

Data Insights

Podcast: Epoch After Hours

Models

Frontier Data Centers

Hardware

Companies

Chip Sales

Polling on Usage

AI Capabilities

FrontierMath

FrontierMath: Benchmarking AI against advanced mathematical research

FrontierMath Tiers 1–4

Open Problems