Xuesong Yao

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning

arXiv 2025

Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments

arXiv 2025

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

arXiv 2025

No known affiliations.

from 3 papers

Jiecao Chen

Junjie Ye

Qi Zhang

Tao Gui

Xuanjing Huang

Yufei Xu

Zhengyin Du

Zhiheng Xi

Jixuan Huang

Rui Zheng