Luning Wang

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Evaluating Quantized Large Language Models

arXiv 2024

CSKV: Training-Efficient Channel Shrinking for KV Cache in Long-Context Scenarios

arXiv 2024

No known affiliations.

from 2 papers

Guohao Dai

Shengen Yan

Shiyao Li

Xuefei Ning

Yu Wang

Huazhong Yang

Tengxuan Liu

Xiangsheng Shi

Zhihang Yuan