Haoyu Lu

Papers: 15

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

15papers

Authored papers

BabyVision: Visual Reasoning Beyond Language

arXiv 2026

2026

WorldVQA: Measuring Atomic World Knowledge in Multimodal Large Language Models

arXiv 2026

2026

Attention Residuals

arXiv 2026

2026

Towards Pixel-Level VLM Perception via Simple Points Prediction

arXiv 2026

2026

Kimi K2.5: Visual Agentic Intelligence

arXiv 2026

2026

Kimi-VL Technical Report

arXiv 2025

2025

R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization

arXiv 2025

2025

Kimi k1.5: Scaling Reinforcement Learning with LLMs

arXiv 2025

2025

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

arXiv 2024

2024

DeepSeek-VL: Towards Real-World Vision-Language Understanding

arXiv 2024

2024

Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs

arXiv 2024

2024

Towards Event-oriented Long Video Understanding

arXiv 2024

2024

Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining

arXiv 2024

2024

VDT: General-purpose Video Diffusion Transformers via Mask Modeling

arXiv 2023

2023

UniAdapter: Unified Parameter-Efficient Transfer Learning for Cross-modal Modeling

arXiv 2023

2023

Affiliations

No known affiliations.

Frequent co-authors

from 15 papers

Y. Charles

Hao Yang

Xinyu Zhou

Yiping Bao

Zaida Zhou

Zhiqi Huang

Zijia Zhao

HaoNing Wu

Lin Sui

Yuqi Huo