Zhi-Quan Luo

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

Adam-mini: Use Fewer Learning Rates To Gain More

arXiv 2024

Why Transformers Need Adam: A Hessian Perspective

arXiv 2024

ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models

arXiv 2023

TeleQnA: A Benchmark Dataset to Assess Large Language Models Telecommunications Knowledge

arXiv 2023

Towards Memory- and Time-Efficient Backpropagation for Training Spiking Neural Networks

ICCV 2023 1

No known affiliations.

from 5 papers

Ruoyu Sun

Yushun Zhang

Ziniu Li

Congliang Chen

Tian Ding

Ali Maatouk

Antonio De Domenico

Chenwei Wu

Diederik P. Kingma

Fadhel Ayed