Wenxuan Ma

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

From Local Details to Global Context: Advancing Vision-Language Models with Attention-Based Selection

arXiv 2025

Emu3.5: Native Multimodal Models are World Learners

arXiv 2025

No known affiliations.

from 2 papers

Binhui Xie

Chengyuan Wang

Fan Zhang

Haoge Deng

Honghao Chen

Jian Liang

Jingxuan Kang

Jinsheng Wang

Jirong Liu

Lincan Cai