Hangyu Mao

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

Agentic Reinforced Policy Optimization

arXiv 2025

Tool-Star: Empowering LLM-Brained Multi-Tool Reasoner via Reinforcement Learning

arXiv 2025

Agentic Entropy-Balanced Policy Optimization

arXiv 2025

GARDO: Reinforcing Diffusion Models without Reward Hacking

arXiv 2025

PET-SQL: A Prompt-Enhanced Two-Round Refinement of Text-to-SQL with Cross-consistency

arXiv 2024

No known affiliations.

from 5 papers

Guanting Dong

Guorui Zhou

Ji-Rong Wen

Yutao Zhu

Zhicheng Dou

Fuzheng Zhang

Jiajie Jin

Licheng Bao

Xiaoxi Li

Yifei Chen