ScholarSearch

Fresh

ScholarSearch is designed to evaluate the complex information retrieval capabilities of Large Language Models (LLMs) in academic research.

Type: RL Env
Publisher: General Reasoning
Tags: Academic Information Retrieval
Runtime: ORS
License: unknown
Size: 223 tasks
Published: Jan 2026
Canonical: openreward.ai/GeneralReasoning/ScholarSearch

Cite

Notes

Only stored in your browser.

Attribution

README: openreward.ai/GeneralReasoning/ScholarSearch
Scores: OpenReward

Attribution policy →

Public scores on this env

6

6 vf-eval reports across 6 models

1GPT 4o Search PreviewOpenAI19.05 2DeepSeek R1DeepSeek12.38 3GPT 4o Mini Search PreviewOpenAI10.48 4GPT-4.1OpenAI8.57 5GPT-4oOpenAI5.71 6GPT-4o-miniOpenAI3.81

Open the scoring view →