Xinwei Long

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

SSRL: Self-Search Reinforcement Learning

arXiv 2025

A Survey of Reinforcement Learning for Large Reasoning Models

arXiv 2025

PaD: Program-aided Distillation Can Teach Small Models Reasoning Better than Chain-of-thought Fine-tuning

arXiv 2023

CRaSh: Clustering, Removing, and Sharing Enhance Fine-tuning without Full Large Language Model

arXiv 2023

No known affiliations.

from 4 papers

Bowen Zhou

professor

Kaiyan Zhang

Xuekai Zhu

Biqing Qi

Ning Ding

researcher

Che Jiang

Yu Fu

Yuchen Fan

Yuchen Zhang

Yuxin Zuo