Devang Naik

Cite

Notes

Only stored in your browser.

Attribution

1papers

Authored papers

Scaling Smart: Accelerating Large Language Model Pre-training with Small Model Initialization

arXiv 2024

No known affiliations.

from 1 papers

Fartash Faghri

Iman Mirzadeh

Keivan Alizadeh Vahid

Mehrdad Farajtabar

Minsik Cho

Mohammad Samragh

Moin Nabi