Xiaojian Wang

Cite

Notes

Only stored in your browser.

Attribution

1papers

Authored papers

ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models

arXiv 2024

No known affiliations.

from 1 papers

Chao Zeng

Fangmin Chen

Hong Liu

Miao Wei

Shu Yang

Songwei Liu

Xing Mei

Yusheng Xie