Qi Yi

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

AT^2PO: Agentic Turn-based Policy Optimization via Tree Search

arXiv 2026

Low-probability Tokens Sustain Exploration in Reinforcement Learning with Verifiable Reward

arXiv 2025

Online Prototype Alignment for Few-shot Policy Transfer

arXiv 2023

Unlearnable Clusters: Towards Label-agnostic Unlearnable Examples

CVPR 2023 1

No known affiliations.

from 4 papers

Bo Zhou

Bo Qian

Changsheng Xu

Chengming Li

Dingwei Chen

Guanhua Huang

Jiaming Guo

Jiaming Zhang

Jie Jiang

Jitao Sang