Utkarsh Saxena

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

ResQ: Mixed-Precision Quantization of Large Language Models with Low-Rank Residuals

arXiv 2024

Eigen Attention: Attention in Low-Rank Space for KV Cache Compression

arXiv 2024

No known affiliations.

from 2 papers

Kaushik Roy

Gobinda Saha

Sakshi Choudhary

Sayeh Sharify

Xin Wang