Qiaosheng Zhang

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

MAGIC: A Co-Evolving Attacker-Defender Adversarial Game for Robust LLM Safety

arXiv 2026

CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models

arXiv 2025

The Avengers: A Simple Recipe for Uniting Smaller Language Models to Challenge Proprietary Giants

arXiv 2025

Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute

arXiv 2025

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

arXiv 2025

No known affiliations.

from 5 papers

Fanqing Meng

Han Qi

Lingxiao Du

Shuyue Hu

Wanli Ouyang

Wenqi Shao

Zhixiang Zhou

Zongkai Liu

Bocheng Zhou

Chao Yu