Zhixiang Zhou

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models

arXiv 2025

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

arXiv 2025

No known affiliations.

from 2 papers

Fanqing Meng

Lingxiao Du

Qiaosheng Zhang

Wenqi Shao

Zongkai Liu

Chao Yu

Ping Luo