Shang Qu

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

TTRL: Test-Time Reinforcement Learning

arXiv 2025

MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding

arXiv 2025

A Survey of Reinforcement Learning for Large Reasoning Models

arXiv 2025

No known affiliations.

from 3 papers

Bowen Zhou

professor

Kaiyan Zhang

Ning Ding

researcher

Xuekai Zhu

Yuxin Zuo

Biqing Qi

Ermo Hua

Ganqu Cui

researcher

Youbang Sun

Bingxiang He