Renshan Zhang

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

FALCON: Resolving Visual Redundancy and Fragmentation in High-resolution Multimodal Large Language Models via Visual Registers

ICCV 2025

CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification

arXiv 2025

Token-level Correlation-guided Compression for Efficient Multimodal Document Understanding

arXiv 2024

No known affiliations.

from 3 papers

Liqiang Nie

Rui Shao

Gongwei Chen

Weili Guan

Jie He

Kaiwen Zhou

Wei Li

Yibo Lyu