Kongcheng Zhang

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

SeRL: Self-Play Reinforcement Learning for Large Language Models with Limited Data

arXiv 2025

Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning

arXiv 2025

Consistent Paths Lead to Truth: Self-Rewarding Reinforcement Learning for LLM Reasoning

arXiv 2025

Reasoning with Reinforced Functional Token Tuning

arXiv 2025

Odyssey: Empowering Minecraft Agents with Open-World Skills

arXiv 2024

No known affiliations.

from 5 papers

Mingli Song

Shunyu Liu

Wenkai Fang

DaCheng Tao

Baisheng Lai

Qi Yao

Tongya Zheng

Yang Zhou

Hengtong Lu

Jiale Zhao