Yatai Ji

Papers: 6

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

6papers

Authored papers

Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation

arXiv 2026

2026

From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model

arXiv 2025

2025

IDA-VLM: Towards Movie Understanding via ID-Aware Large Vision-Language Model

arXiv 2024

2024

Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM

arXiv 2024

2024

Control-A-Video: Controllable Text-to-Video Diffusion Models with Motion Prior and Reward Feedback Learning

arXiv 2023

2023

MAP: Multimodal Uncertainty-Aware Vision-Language Pre-training Model

CVPR 2023 1

2022

Affiliations

No known affiliations.

Frequent co-authors

from 6 papers

Ping Luo

Jie Wu

Weifeng Chen

Xuefeng Xiao

Peize Sun

Shilong Zhang

Shoufa Chen

Sidi Yang

Yujiu Yang

Zhiheng Liu