David Duvenaud

Papers: 7

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

7papers

Authored papers

Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training

arXiv 2024

2024

Alignment faking in large language models

arXiv 2024

2024

Sycophancy to Subterfuge: Investigating Reward-Tampering in Large Language Models

arXiv 2024

2024

Residual Flows for Invertible Generative Modeling

residual-flows-for-invertible-generative-2

2019

Isolating Sources of Disentanglement in Variational Autoencoders

isolating-sources-of-disentanglement-in-1

2018

Explaining Image Classifiers by Counterfactual Generation

explaining-image-classifiers-by-1

2018

Convolutional Networks on Graphs for Learning Molecular Fingerprints

convolutional-networks-on-graphs-for-learning-1

2015

Affiliations

No known affiliations.

Frequent co-authors

from 7 papers

Buck Shlegeris

Carson Denison

Ethan Perez

Evan Hubinger

Jared Kaplan

co-founder / Chief Science Officer

Monte MacDiarmid

Samuel R. Bowman

Fazl Barez

Nicholas Schiefer

Ricky T. Q. Chen