Shivaram Venkataraman

Papers: 3

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

3papers

Authored papers

3

Scaling Inference-Efficient Language Models

arXiv 2025

CHAI: Clustered Head Attention for Efficient LLM Inference

arXiv 2024

Decoding Speculative Decoding

arXiv 2024

Affiliations

No known affiliations.

Frequent co-authors

9

from 3 papers

Minghao Yan

2 shared papers

Saurabh Agarwal

2 shared papers

Basil Hosmer

Bilge Acun

Carole-Jean Wu

Dimitris Papailiopoulos

Mostafa Elhoushi

Song Bian

Yejin Lee