o3

Release date

Models

Release Date: 4/16/2025

Accuracy (Average)

71.23%

Latency (Average)

33.47s

Avg. Cost (In/Out)

2 / 8

Context Window

200k

Max Output Tokens

100k

Input Modality

Hyperparameter settings

Default Provider : OpenAI

Temperature

Default

Top P

Default

Top K

Default

Max Output Tokens

100,000

Reasoning Effort

high

Benchmarks

Accuracy

Rankings

0.0%

± 0.96

57/ 115

0.0%

± 2.16

18/ 67

0.0%

± 1.87

36/ 64

0.0%

± 0.93

29/ 80

0.0%

± 3.31

32/ 61

0.0%

± 0.85

19/ 121

0.0%

± 1.86

32/ 115

0.0%

± 1.03

28/ 121

0.0%

± 0.42

27/ 118

0.0%

± 0.34

34/ 114

0.0%

± 0.95

28/ 76

Contact us

Proprietary Benchmarks (contact us to get access)

Academic Benchmarks

Read about our methodology.