Song Mei

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Improving LLM Safety Alignment with Dual-Objective Optimization

arXiv 2025

Simplicity Prevails: Rethinking Negative Preference Optimization for LLM Unlearning

arXiv 2024

Active-Dormant Attention Heads: Mechanistically Demystifying Extreme-Token Phenomena in LLMs

arXiv 2024

Transformers as Decision Makers: Provable In-Context Reinforcement Learning via Supervised Pretraining

arXiv 2023

No known affiliations.

from 4 papers

Licong Lin

Yu Bai

Chongyu Fan

David Huang

Dawn Song

professor

Druv Pai

Jiancheng Liu

Jiantao Jiao

professor

Jinghan Jia

Michael. I. Jordan