SATBench

Fresh

SATBench is a benchmark for evaluating the logical reasoning capabilities of large language models (LLMs) through logical puzzles derived from Boolean satisfiability (SAT) problems.

Type: RL Env
Tags: Logical Reasoning Boolean Satisfiability Problem Sat Solving
Runtime: ORS
License: unknown
Size: 2100 tasks
Published: Mar 2026
Canonical: openreward.ai/anjiang/SATBench

Cite

Notes

Only stored in your browser.

Attribution

README: openreward.ai/anjiang/SATBench

Attribution policy →

Contributors

Anjiang Wei