Changlong Yu

Papers: 6

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

6papers

Authored papers

Approximation of Log-Partition Function in Policy Mirror Descent Induces Implicit Regularization for LLM Post-Training

arXiv 2026

2026

Beyond Test-Time Memory: State-Space Optimal Control for LLM Reasoning

arXiv 2026

2026

WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning

arXiv 2025

2025

Learning to Optimize Multi-Objective Alignment Through Dynamic Reward Weighting

arXiv 2025

2025

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

arXiv 2025

2025

Discriminative Finetuning of Generative Large Language Models without Reward Models and Human Preference Data

arXiv 2025

2025

Affiliations

No known affiliations.

Frequent co-authors

from 6 papers

Xin Liu

Liang Qiu

Qin Lu

Tuo Zhao

Chao Zhang

Haoming Jiang

Ilgee Hong

Zhenghao Xu

Bing Yin

Hyokun Yun