Mickel Liu

PKU-Alignment / Peking University researcher; co-first author on PKU-SafeRLHF and BeaverTails safety dataset.

Role: researcher
Currently at: Peking University
Twitter: Unknown
GitHub: github.com/mickel-liu
Scholar: scholar.google.com/scholar
Papers: 4

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: scholar.google.com/scholar

Attribution policy →

4papers

Authored papers

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

arXiv 2025

2025

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset

NeurIPS

2023

Baichuan 2: Open Large-scale Language Models

arXiv 2023

2023

Safe RLHF: Safe Reinforcement Learning from Human Feedback

arXiv 2023

2023

Affiliations

Currently at

Peking University

researcher · university lab

Previously

PKU-Alignmentuniversity lab

Frequent co-authors

from 4 papers

Jiaming Ji

researcher

3 shared papers

Ruiyang Sun

researcher

3 shared papers

Xuehai Pan

grad-student

3 shared papers

Ce Bian

researcher

2 shared papers

Juntao Dai

researcher

2 shared papers

Yaodong Yang

professor

2 shared papers

Yizhou Wang

professor

Aiyuan Yang

Bin Xiao

Bingning Wang