Zhiyi Hong

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Elastic Attention: Test-time Adaptive Sparsity Ratios for Efficient Transformers

arXiv 2026

Flux Attention: Context-Aware Hybrid Attention for Efficient LLMs Inference

arXiv 2026

No known affiliations.

from 2 papers

Juntao Li

Kebin Liu

Min Zhang

Qingqing Dang

Quantong Qiu

Yi Yang

Haitian Wang

Haiya Xiang

Zecheng Tang