Zefang Zong

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

A^2TGPO: Agentic Turn-Group Policy Optimization with Adaptive Turn-level Clipping

arXiv 2026

AT^2PO: Agentic Turn-based Policy Optimization via Tree Search

arXiv 2026

Efficient Agentic Reinforcement Learning with On-Policy Intrinsic Knowledge Boundary Enhancement

arXiv 2026

No known affiliations.

from 3 papers

Chengming Li

Dingwei Chen

Jie Jiang

Peng Chen

Yang Li

Leo Luo

Zhipeng Ma

Bo Qian

Bo Zhou

Qi Yi