Cai Chen

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Every Step Evolves: Scaling Reinforcement Learning for Trillion-Scale Thinking Model

arXiv 2025

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

arXiv 2025

No known affiliations.

from 2 papers

Bin Hu

Deng Zhao

Hao Dai

Jia Guo

Jiaming Liu

Jun Mei

Jun Zhou

Junbo Zhao

Kuan Xu

Liang Jiang