Zhaolin Gao

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

Value-Guided Search for Efficient Chain-of-Thought Reasoning

arXiv 2025

Pre-trained Large Language Models Learn Hidden Markov Models In-context

arXiv 2025

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

arXiv 2024

End-to-end Training for Recommendation with Language-based User Profiles

arXiv 2024

REBEL: Reinforcement Learning via Regressing Relative Rewards

arXiv 2024

No known affiliations.

from 5 papers

Kianté Brantley

Wen Sun

Gokul Swamy

Jason D. Lee

Jonathan D. Chang

Thorsten Joachims

Wenhao Zhan

Yijia Dai

J. Andrew Bagnell

Jennifer J. Sun