Alina Shutova

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models

arXiv 2025

Hogwild! Inference: Parallel LLM Generation via Concurrent Attention

arXiv 2025

No known affiliations.

from 2 papers

Dan Alistarh

Denis Kuznedelev

Vage Egiazarian

Anton Sinitsin

Denis Mazur

Erik Schultheis

George Yakushev

Gleb Rodionov

Ivan Ermakov

Nikita Surkov