Aditya Varre

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Why Do We Need Weight Decay in Modern Deep Learning?

arXiv 2023

SGD with Large Step Sizes Learns Sparse Features

arXiv 2022

No known affiliations.

from 2 papers

Maksym Andriushchenko

Nicolas Flammarion

Francesco D'Angelo

Loucas Pillaud-Vivien