Chengruidong Zhang

Papers: 6

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

6papers

Authored papers

MMInference: Accelerating Pre-filling for Long-Context VLMs via Modality-Aware Permutation Sparse Attention

arXiv 2025

2025

RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference

arXiv 2025

2025

Region-Adaptive Sampling for Diffusion Transformers

arXiv 2025

2025

Chain-of-Model Learning for Language Model

arXiv 2025

2025

MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

arXiv 2024

2024

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

arXiv 2024

2024

Affiliations

No known affiliations.

Frequent co-authors

from 6 papers

Yuqing Yang

Huiqiang Jiang

Lili Qiu

Dongsheng Li

Amir H. Abdi

Bailu Ding

Baotong Lu

Chen Chen

Di Liu

Fan Yang