Apurv Verma

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Watermarking Degrades Alignment in Language Models: Analysis and Mitigation

arXiv 2025

Operationalizing a Threat Model for Red-Teaming Large Language Models (LLMs)

arXiv 2024

No known affiliations.

from 2 papers

NhatHai Phan

Anu Pradhan

David Rabinowitz

John Doucette

Leslie Barrett

Madhavan Seshadri

Satyapriya Krishna

Sebastian Gehrmann

researcher

Shubhendu Trivedi

Tom Ault