Zhiwei Steven Wu

Papers: 7

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

7papers

Authored papers

Rubrics as an Attack Surface: Stealthy Preference Drift in LLM Judges

arXiv 2026

2026

Guardrail Baselines for Unlearning in LLMs

arXiv 2024

2024

Inverse Reinforcement Learning without Reinforcement Learning

arXiv 2023

2023

Learning Shared Safety Constraints from Multi-task Demonstrations

learning-shared-safety-constraints-from-multi

2023

Generating Private Synthetic Data with Genetic Algorithms

arXiv 2023

2023

Differentially Private SGD Without Clipping Bias: An Error-Feedback Approach

arXiv 2023

2023

Nonparametric extensions of randomized response for private confidence sets

arXiv 2022

2022

Affiliations

No known affiliations.

Frequent co-authors

from 7 papers

Gokul Swamy

Sanjiban Choudhury

Aaditya Ramdas

Ding Zhao

Giuseppe Vietri

He Sun

Ian Waudby-Smith

J. Andrew Bagnell

Jingwu Tang

Konwoo Kim