Jiaming Ji

Peking University PhD; first author of PKU-SafeRLHF / BeaverTails; core member of PKU-Alignment group.

Role: researcher
Currently at: Peking University
Twitter: twitter.com/jiamingji_
GitHub: github.com/calico-1226
Scholar: scholar.google.com/citations
Papers: 11

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: scholar.google.com/citations

Attribution policy →

11papers

Authored papers

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

arXiv 2026

2026

FinMME: Benchmark Dataset for Financial Multi-Modal Reasoning Evaluation

arXiv 2025

2025

PHYBench: Holistic Evaluation of Physical Perception and Reasoning in Large Language Models

arXiv 2025

2025

A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment

arXiv 2025

2025

Align Anything: Training All-Modality Models to Follow Instructions with Language Feedback

arXiv 2024

2024

Language Models Resist Alignment: Evidence From Data Compression

arXiv 2024

2024

ProgressGym: Alignment with a Millennium of Moral Progress

arXiv 2024

2024

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset

NeurIPS

2023

SafeDreamer: Safe Reinforcement Learning with World Models

arXiv 2023

2023

Baichuan 2: Open Large-scale Language Models

arXiv 2023

2023

Safe RLHF: Safe Reinforcement Learning from Human Feedback

arXiv 2023

2023

Affiliations

Currently at

Peking University

researcher · university lab

Previously

PKU-Alignmentuniversity lab

Frequent co-authors

from 11 papers

Yaodong Yang

professor

8 shared papers

Boyuan Chen

researcher

3 shared papers

Josef Dai

researcher

3 shared papers

Juntao Dai

researcher

3 shared papers

Mickel Liu

researcher

3 shared papers

Ruiyang Sun

researcher

3 shared papers

Tianyi Qiu

3 shared papers

Xuehai Pan

grad-student

3 shared papers

Borong Zhang

2 shared papers

Ce Bian

researcher

2 shared papers