Guiming Xie

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models

arXiv 2025

CritiPrefill: A Segment-wise Criticality-based Approach for Prefilling Acceleration in LLMs

arXiv 2024

No known affiliations.

from 2 papers

Huan Li

Jue Wang

Jun Zhang

Junlin Lv

Ke Chen

Kunlong Zhou

Lidan Shou

Qirong Peng

Xike Xie

Xin Jia