Ding Zou

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Bridging SFT and RL: Dynamic Policy Optimization for Robust Reasoning

arXiv 2026

Boosting the Generalization and Reasoning of Vision Language Models with Curriculum Reinforcement Learning

arXiv 2025

No known affiliations.

from 2 papers

Dongyang Xu

Hongchen Luo

Huilin Deng

Qiaobo Hao

Rui Ma

Sen Zhao

Taojie Zhu

Yang Cao

Yonghong He

Yu Kang