Yanghao Li

Papers: 14

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

14papers

Authored papers

Cheers: Decoupling Patch Details from Semantic Representations Enables Unified Multimodal Comprehension and Generation

arXiv 2026

2026

Imagination Helps Visual Reasoning, But Not Yet in Latent Space

arXiv 2026

2026

MiniCPM4: Ultra-Efficient LLMs on End Devices

arXiv 2025

2025

Improve Vision Language Model Chain-of-thought Reasoning

arXiv 2024

2024

Idempotence and Perceptual Image Compression

arXiv 2024

2024

Hiera: A Hierarchical Vision Transformer without the Bells-and-Whistles

arXiv 2023

2023

R-MAE: Regions Meet Masked Autoencoders

arXiv 2023

2023

Efficient Semantic Segmentation by Altering Resolutions for Compressed Videos

CVPR 2023 1

2023

Exploring Plain Vision Transformer Backbones for Object Detection

arXiv 2022

2022

Scaling Language-Image Pre-training via Masking

CVPR 2023 1

2022

Masked Autoencoders As Spatiotemporal Learners

arXiv 2022

2022

MViTv2: Improved Multiscale Vision Transformers for Classification and Detection

CVPR 2022 1

2021

Masked Autoencoders Are Scalable Vision Learners

CVPR 2022 1

2021

Ego4D: Around the World in 3,000 Hours of Egocentric Video

CVPR 2022 1

2021

Affiliations

No known affiliations.

Frequent co-authors

from 14 papers

Christoph Feichtenhofer

Haoqi Fan

Kaiming He

Jitendra Malik

Maosong Sun

professor

Chi Chen

Karttikeya Mangalam

Ross Girshick

Shuo Wang

Vaibhav Aggarwal