Zhenye Gan

Papers: 11

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

11papers

Authored papers

YOLO-Master: MOE-Accelerated with Specialized Transformers for Enhanced Real-time Detection

arXiv 2025

2025

UniCombine: Unified Multi-Conditional Combination with Diffusion Transformer

ICCV 2025

2025

Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation

arXiv 2025

2025

Transform Trained Transformer: Accelerating Naive 4K Video Generation Over 10times

arXiv 2025

2025

MobileMamba: Lightweight Multi-Receptive Visual Mamba Network

CVPR 2025 1

2024

Efficient Multimodal Large Language Models: A Survey

arXiv 2024

2024

MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection

arXiv 2024

2024

LLaVA-KD: A Framework of Distilling Multimodal Large Language Models

arXiv 2024

2024

A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection

arXiv 2024

2024

A Survey on Benchmarks of Multimodal Large Language Models

arXiv 2024

2024

LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description

arXiv 2024

2024

Affiliations

No known affiliations.

Frequent co-authors

from 11 papers

Chengjie Wang

Jiangning Zhang

Yabiao Wang

Haoyang He

Xiaobin Hu

Jian Li

Lei Xie

Qingdong He

Yizhang Jin

Yuxuan Cai