Boju Chen

Cite

Notes

Only stored in your browser.

Attribution

1papers

Authored papers

MoA: Mixture of Sparse Attention for Automatic Large Language Model Compression

arXiv 2024

No known affiliations.

from 1 papers

Genghan Zhang

Guohao Dai

Haofeng Huang

Hongyi Wang

Huazhong Yang

Shengen Yan

Shiyao Li

Tianqi Wu

Tianyu Fu

Xuefei Ning