Weijie Shi

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

TCOD: Exploring Temporal Curriculum in On-Policy Distillation for Multi-turn Autonomous Agents

arXiv 2026

R^3L: Reflect-then-Retry Reinforcement Learning with Language-Guided Exploration, Pivotal Credit, and Positive Amplification

arXiv 2026

DIDS: Domain Impact-aware Data Sampling for Large Language Model Training

arXiv 2025

No known affiliations.

from 3 papers

Jiajie Xu

Xiaofang Zhou

Yaliang Li

Hao Chen

James Cheng

Jia Zhu

Jiaqi Wang

Jingzhi Fang

Jipeng Zhang

Ruiyuan Zhang