Zhengyi Yang

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization

arXiv 2024

$β$-DPO: Direct Preference Optimization with Dynamic $β$

arXiv 2024

A Bi-Step Grounding Paradigm for Large Language Models in Recommendation Systems

arXiv 2023

No known affiliations.

from 3 papers

Bolin Ding

Jiancan Wu

Jinyang Gao

Junkang Wu

Xiang Wang

Xiangnan He

Yuexiang Xie

Chong Chen

Fuli Feng

Jiawei Chen