Yijia Luo

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

One Sample to Rule Them All: Extreme Data Efficiency in RL Scaling

arXiv 2026

Reinforcement Learning Optimization for Large-Scale Learning: An Efficient and User-Friendly Scaling Library

arXiv 2025

Deconstructing Long Chain-of-Thought: A Structured Reasoning Optimization Framework for Long CoT Distillation

arXiv 2025

No known affiliations.

from 3 papers

Bo Zheng

Weixun Wang

Wenbo Su

Gengru Chen

Jiaheng Liu

Xingyao Zhang

Yanan Wu

Dakai An

Feilei Du

Haizhou Zhao