Daiki Shimada

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models

arXiv 2025

Video-R4: Reinforcing Text-Rich Video Reasoning with Visual Rumination

arXiv 2025

Caption Anything in Video: Fine-grained Object-centric Captioning via Spatiotemporal Multimodal Prompting

arXiv 2025

No known affiliations.

from 3 papers

Chao Huang

Chenliang Xu

Hang Hua

Jing Bi

Ali Vosoughi

Jiebo Luo

Junjia Guo

Luchuan Song

Pinxin Liu

Susan Liang