Chaoqi Wang

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment

arXiv 2025

GRAPE: Generalizing Robot Policy via Preference Alignment

arXiv 2024

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

arXiv 2024

Multi-IF: Benchmarking LLMs on Multi-Turn and Multilingual Instructions Following

arXiv 2024

No known affiliations.

from 4 papers

Zhaorun Chen

Chen Zhu

Hao Ma

Huaxiu Yao

Sinong Wang

Zhuokai Zhao

Aditya Tayade

Canyu Chen

Chelsea Finn

Chenguang Zhu