Aosong Cheng

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

DesignEdit: Multi-Layered Latent Decomposition and Fusion for Unified & Accurate Image Editing

arXiv 2024

Beyond Text-Visual Attention: Exploiting Visual Cues for Effective Token Pruning in VLMs

ICCV 2025

MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions

arXiv 2024

No known affiliations.

from 3 papers

Shanghang Zhang

Chuke Wang

Huizhu Jia

Ji Li

Jiahao Pan

Jiajun Cao

Mengfei Li

Ming Lu

Pengjun Fang

Qi She