Vals AI News

X (Twitter)LinkedIn

Download Press Kit

Featured Articles

BlogAnnouncements

07/02/2026

Vals Public Sector Memo

We're bringing independent AI evaluation to government.

Rayan Krishnan & Glenn Parham

Media

06/12/2026

SpaceX Has the Worst AI. But It’s Still Reaping the Benefits of Being the First Big AI Company to IPO

Media

05/05/2026

Anthropic deepens push into Wall Street with new AI agents, full Microsoft 365 integration, Moody's data partnership

All Articles

Benchmark

Excel Modeling Benchmark Released

Vals AI

07/01/2026

Model

Anthropic's Claude Sonnet 5 evaluated on the Vals Index

CyberBench Released

Legal Research Bench Released

Vals AI

06/23/2026

Benchmark

Harvey's Legal Agent Benchmark Released

Vals AI

06/17/2026

Model

z.AI's GLM 5.2 evaluated across our benchmark suite

Vals AI

06/17/2026

Benchmark

Code Migration Released

Vals AI

06/16/2026

Model

Kimi K2.7 Code evaluated across our coding benchmarks

Vals AI

06/13/2026

Media

Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI

TechCrunch

06/12/2026

Model

Anthropic's Claude Fable 5 evaluated across our benchmark suite

Vals AI

06/09/2026