Qi Yao

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Reasoning with Reinforced Functional Token Tuning

arXiv 2025

Consistent Paths Lead to Truth: Self-Rewarding Reinforcement Learning for LLM Reasoning

arXiv 2025

No known affiliations.

from 2 papers

Baisheng Lai

DaCheng Tao

Kongcheng Zhang

Mingli Song

Shunyu Liu

Jiaxing Huang

Jieping Ye

Wenkai Fang

Yingjie Wang