Zejun Li

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

VoCoT: Unleashing Visually Grounded Multi-Step Reasoning in Large Multi-Modal Models

arXiv 2024

EmbSpatial-Bench: Benchmarking Spatial Understanding for Embodied Tasks with Large Vision-Language Models

arXiv 2024

No known affiliations.

from 2 papers

Zhongyu Wei

Binhao Wu

Jiwen Zhang

Mengfei Du

Minghui Qiu

Ruipu Luo

Xuanjing Huang