Noah Lee

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Margin-aware Preference Optimization for Aligning Diffusion Models without Reference

arXiv 2024

ORPO: Monolithic Preference Optimization without Reference Model

arXiv 2024

Cross-lingual Transfer of Reward Models in Multilingual Alignment

arXiv 2024

Can Large Language Models Capture Dissenting Human Voices?

arXiv 2023

No known affiliations.

from 4 papers

James Thorne

Jiwoo Hong

César Rodríguez

Jongheon Jeong

Kashif Rasul

researcher

Na Min An

Rodrigo Martínez-Castaño

Sayak Paul