Ryan S. Kwon

Cite

Notes

Only stored in your browser.

Attribution

1papers

Authored papers

Representation Bending for Large Language Model Safety

arXiv 2025

No known affiliations.

from 1 papers

Alvin Wan

Ashkan Yousefpour

Harrison Ngan

Jonghyun Choi

Seungbeen Lee

Seungju Han

Taeheon Kim

Wonje Jeung

Youngjae Yu