Question 1

What is SWE-bench Verified: Resolving Real-World GitHub Issues?

Accepted Answer

Evaluates AI's ability to resolve genuine software engineering issues sourced from 12 popular Python GitHub repositories, reflecting realistic coding and debugging scenarios.

Question 2

How can a model improve its SWE-bench Verified: Resolving Real-World GitHub Issues score?

Accepted Answer

Tools linked to SWE-bench Verified: Resolving Real-World GitHub Issues on Sophon include Agent Bench RL Env (Prime Community), Deepswe RL Env (Prime Intellect), Agent PLUS RL Env (Prime Intellect), Opencode SWE RL Env (Prime Intellect) - RL environments, datasets, and scaffolds that target this eval.

Question 3

What license is SWE-bench Verified: Resolving Real-World GitHub Issues under?

Accepted Answer

SWE-bench Verified: Resolving Real-World GitHub Issues is available under mit.

SWE-bench Verified: Resolving Real-World GitHub Issues

Related tools

Agent Bench RL Env (Prime Community)

Deepswe RL Env (Prime Intellect)

Agent PLUS RL Env (Prime Intellect)

Opencode SWE RL Env (Prime Intellect)

Papers

SWE-bench: Can Language Models Resolve Real-World GitHub Issues?

FAQ