Zekun Qi

Papers: 13

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

13papers

Authored papers

VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model

arXiv 2026

2026

Disentangled Robot Learning via Separate Forward and Inverse Dynamics Pretraining

arXiv 2026

2026

SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation

arXiv 2025

2025

OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models

arXiv 2025

2025

DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge

dreamvla-a-vision-language-action-model

2025

Hybrid-grained Feature Aggregation with Coarse-to-fine Language Guidance for Self-supervised Monocular Depth Estimation

arXiv 2025

2025

Reasoning in Space via Grounding in the World

arXiv 2025

2025

ShapeLLM: Universal 3D Object Understanding for Embodied Interaction

arXiv 2024

2024

DreamLLM: Synergistic Multimodal Comprehension and Creation

arXiv 2023

2023

Contrast with Reconstruct: Contrastive 3D Representation Learning Guided by Generative Pretraining

arXiv 2023

2023

Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast

arXiv 2023

2023

VPP: Efficient Conditional 3D Generation via Voxel-Point Progressive Representation

vpp-efficient-conditional-3d-generation-via

2023

Autoencoders as Cross-Modal Teachers: Can Pretrained 2D Image Transformers Help 3D Representation Learning?

arXiv 2022

2022

Affiliations

No known affiliations.

Frequent co-authors

from 13 papers

Kaisheng Ma

Li Yi

Runpei Dong

Wenyao Zhang

Xin Jin

JiaWei He

Xinqiang Yu

Zheng Ge

Guofan Fan

He Wang