Xiao Yan

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference

arXiv 2025

SPT: Fine-Tuning Transformer-based Language Models Efficiently with Sparsification

arXiv 2023

No known affiliations.

from 2 papers

Bailu Ding

Baotong Lu

Chen Chen

Chengruidong Zhang

Di Liu

Fan Yang

Han Yang

Huiqiang Jiang

James Cheng

Jiawei Jiang