Rong Bao

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

RMB: Comprehensively Benchmarking Reward Models in LLM Alignment

arXiv 2024

Aligning Large Language Models from Self-Reference AI Feedback with one General Principle

arXiv 2024

Orthogonal Subspace Learning for Language Model Continual Learning

arXiv 2023

No known affiliations.

from 3 papers

Qi Zhang

Rui Zheng

Enyu Zhou

Shihan Dou

Tao Gui

Xiao Wang

Xuanjing Huang

Binghai Wang

Bo wang

DaCheng Tao