Question 1

What is SWE-bench Multilingual?

Accepted Answer

Cross-language extension of SWE-bench Verified - real GitHub issues across multiple programming languages.

Question 2

What is the current top score on SWE-bench Multilingual?

Accepted Answer

The top reported score is 72.7% by Gemini 3 Flash, across 11 models reporting (7 from frontier labs).

Question 3

How can a model improve its SWE-bench Multilingual score?

Accepted Answer

Tools linked to SWE-bench Multilingual on Sophon include Agent Bench RL Env (Prime Community), SWE RL Env (Prime Intellect) - RL environments, datasets, and scaffolds that target this eval.

SWE-bench Multilingual

Score history

Top models

Related tools

Agent Bench RL Env (Prime Community)

SWE RL Env (Prime Intellect)

FAQ