Aviv Bick

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Llamba: Scaling Distilled Recurrent Models for Efficient Language Processing

arXiv 2025

Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models

arXiv 2024

No known affiliations.

from 2 papers

Albert Gu

Arjun Desai

Eric P. Xing

J. Zico Kolter

Kevin Y. Li

Nimit Sohoni

Tobias Katsch