Hongfang Yu

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Prima.cpp: Fast 30-70B LLM Inference on Heterogeneous and Low-Resource Home Clusters

arXiv 2025

TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices

arXiv 2024

No known affiliations.

from 2 papers

Mohsen Guizani

Wenjiao Feng

Zonghang Li

Tao Li