Jianyi Cheng

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Refining Salience-Aware Sparse Fine-Tuning Strategies for Language Models

arXiv 2024

LQER: Low-Rank Quantization Error Reconstruction for LLMs

arXiv 2024

Revisiting Block-based Quantisation: What is Important for Sub-8-bit LLM Inference?

arXiv 2023

No known affiliations.

from 3 papers

Cheng Zhang

Yiren Zhao

George A. Constantinides

Aaron Thomas

Ilia Shumailov

Xinxin Liu

Xitong Gao