Li-Wen Chang

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts

arXiv 2025

R-KV: Redundancy-aware KV Cache Compression for Training-Free Reasoning Models Acceleration

arXiv 2025

ShadowKV: KV Cache in Shadows for High-Throughput Long-Context LLM Inference

arXiv 2024

No known affiliations.

from 3 papers

Hanshi Sun

Ningxin Zheng

Size Zheng

Wenlei Bao

Xin Liu

Abedelkadir Asi

Anima Anandkumar

professor

Beidi Chen

Cheng Luo

Chengquan Jiang