Xiao Zhu

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL

arXiv 2026

CodeScaler: Scaling Code LLM Training and Test-Time Inference via Execution-Free Reward Models

arXiv 2026

CHARM: Calibrating Reward Models With Chatbot Arena Scores

arXiv 2025

No known affiliations.

from 3 papers

Boyu Zhu

Hanxu Hu

Zhijiang Guo

Baiyu Huang

Chao Chen

Chenmien Tan

Fei Mi

Haotian Zhang

Heyuan Deng

Huiming Wang