Leiyu Pan

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning

arXiv 2025

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

arXiv 2025

Multilingual Large Language Models: A Systematic Survey

arXiv 2024

FuxiTranyu: A Multilingual Large Language Model Trained with Balanced Data

arXiv 2024

No known affiliations.

from 4 papers

Deyi Xiong

Fuzheng Zhang

Guorui Zhou

Haoran Sun

Jiangcun Du

Kun Gai

Menglong Cui

Renren Jin

Shaolin Zhu

Shaoyang Xu