Zhiheng Liu

Papers: 12

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

12papers

Authored papers

Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation

arXiv 2026

2026

WavFlow: Audio Generation in Waveform Space

arXiv 2026

2026

VecGlypher: Unified Vector Glyph Generation with Language Models

arXiv 2026

2026

DanceGRPO: Unleashing GRPO on Visual Generation

arXiv 2025

2025

Scaling Zero-Shot Reference-to-Video Generation

arXiv 2025

2025

HiStream: Efficient High-Resolution Video Generation via Redundancy-Eliminated Streaming

arXiv 2025

2025

From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model

arXiv 2025

2025

INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

arXiv 2025

2025

Soundwave: Less is More for Speech-Text Alignment in LLMs

arXiv 2025

2025

TUNA: Taming Unified Visual Representations for Native Unified Multimodal Models

arXiv 2025

2025

MagicQuill: An Intelligent Interactive Image Editing System

CVPR 2025 1

2024

AniDoc: Animation Creation Made Easier

CVPR 2025 1

2024

Affiliations

No known affiliations.

Frequent co-authors

from 12 papers

Ping Luo

5 shared papers

Sen He

5 shared papers

Tao Xiang

5 shared papers

Weiming Ren

grad-student

Yuren Cong

Haonan Qiu

Shoufa Chen

Xiaoke Huang

Zhaochong An

Zijian Zhou