Ali Vosoughi

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models

arXiv 2025

MMPerspective: Do MLLMs Understand Perspective? A Comprehensive Benchmark for Perspective Perception, Reasoning, and Robustness

arXiv 2025

Caption Anything in Video: Fine-grained Object-centric Captioning via Spatiotemporal Multimodal Prompting

arXiv 2025

Video Understanding with Large Language Models: A Survey

arXiv 2023

No known affiliations.

from 4 papers

Chao Huang

Chenliang Xu

Jing Bi

Luchuan Song

Pinxin Liu

Susan Liang

Yunlong Tang

Zeliang Zhang

Hang Hua

Jiebo Luo