Zhepei Wei

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

arXiv 2026

G-Zero: Self-Play for Open-Ended Generation from Zero Data

arXiv 2026

The Surprising Effectiveness of Negative Reinforcement in LLM Reasoning

arXiv 2025

WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning

arXiv 2025

No known affiliations.

from 4 papers

Yu Meng

Chengsong Huang

Jiaxin Huang

Wei-Lin Chen

Xinyu Zhu

Bing Yin

Changlong Yu

Chao Zhang

Danqi Chen

professor

Haolin Liu