Acyr Locatelli

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

SnapKV: LLM Knows What You are Looking for Before Generation

arXiv 2024

Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models

arXiv 2024

Pushing Mixture of Experts to the Limit: Extremely Parameter Efficient MoE for Instruction Tuning

arXiv 2023

No known affiliations.

from 3 papers

Ahmet Üstün

researcher

Arash Ahmadian

Beyza Ermiş

Bharat Venkitesh

Bowen Yang

Deming Chen

Dwarak Talupuru

Edward Grefenstette

Hanchen Ye

Juhan Bae