Junqi Gao

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Graph Counselor: Adaptive Graph Exploration via Multi-Agent Synergy to Enhance LLM Reasoning

arXiv 2025

A Survey of Reinforcement Learning for Large Reasoning Models

arXiv 2025

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

arXiv 2025

GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning

arXiv 2025

No known affiliations.

from 4 papers

Biqing Qi

Bowen Zhou

professor

Dong Li

Kaiyan Zhang

Runze Liu

Jian Zhao

Xiu Li

Bingxiang He

Che Jiang

Ermo Hua