Zhenghai Xue

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

arXiv 2025

Group-in-Group Policy Optimization for LLM Agent Training

arXiv 2025

Two-Stage Constrained Actor-Critic for Short Video Recommendation

arXiv 2023

No known affiliations.

from 3 papers

Bo An

Chi Zhang

researcher

Dong Zheng

Kun Gai

Lang Feng

Longtao Zheng

Peng Jiang

Qian Liu

Qingpeng Cai

Ruohan Zhan