Qing-Shan Jia

Cite

Notes

Only stored in your browser.

Attribution

1papers

Authored papers

Query-Policy Misalignment in Preference-Based Reinforcement Learning

arXiv 2023

No known affiliations.

from 1 papers

Jianxiong Li

Xianyuan Zhan

Xiao Hu

Ya-Qin Zhang