Baisheng Lai

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Consistent Paths Lead to Truth: Self-Rewarding Reinforcement Learning for LLM Reasoning

arXiv 2025

Reasoning with Reinforced Functional Token Tuning

arXiv 2025

No known affiliations.

from 2 papers

DaCheng Tao

Kongcheng Zhang

Mingli Song

Qi Yao

Shunyu Liu

Jiaxing Huang

Jieping Ye

Wenkai Fang

Yingjie Wang