Yunsheng Ni

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

EMS-SD: Efficient Multi-sample Speculative Decoding for Accelerating Large Language Models

arXiv 2024

Rethinking Optimization and Architecture for Tiny Language Models

arXiv 2024

Kangaroo: Lossless Self-Speculative Decoding via Double Early Exiting

arXiv 2024

No known affiliations.

from 3 papers

Kai Han

Yehui Tang

Yunhe Wang

Fangcheng Liu

Chuanjian Liu

Shangling Jui

Sichao Liu

Yi-Qi Hu

Yuchuan Tian

Zhenhua Liu