Zhangyang Qi

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models

arXiv 2025

Gemini vs GPT-4V: A Preliminary Comparison and Combination of Vision-Language Models Through Qualitative Cases

arXiv 2023

No known affiliations.

from 2 papers

Hengshuang Zhao

Jiaqi Wang

Ye Fang

Dahua Lin

Mengchen Zhang

Tong Wu

Zeyi Sun

Zhixiong Zhang

Ziwei Liu