Hang Song

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

Vision-Language-Action Models for Autonomous Driving: Past, Present, and Future

arXiv 2025

Mixed-R1: Unified Reward Perspective For Reasoning Capability in Multimodal Large Language Models

arXiv 2025

GroundingGPT:Language Enhanced Multi-modal Grounding Model

arXiv 2024

UnifiedMLLM: Enabling Unified Representation for Multi-modal Multi-tasks With Large Language Model

arXiv 2024

Advancing Fine-Grained Visual Understanding with Multi-Scale Alignment in Multi-Modal Models

arXiv 2024

No known affiliations.

from 5 papers

Linfeng Li

Qi Xu

Yiqing Cai

Zhaowei Li

Botian Jiang

Dong Zhang

Pengyu Wang

Tao Wang

Wei Wang

Xiangtai Li