Yongdong Zhang

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

arXiv 2026

Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles

arXiv 2026

Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation

arXiv 2026

Mask$^2$DiT: Dual Mask-based Diffusion Transformer for Multi-Scene Long Video Generation

arXiv 2025

2025

DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations

CVPR 2024 1

RealCustom++: Representing Images as Real-Word for Real-Time Customization

arXiv 2024

MotionGS: Exploring Explicit Motion Guidance for Deformable 3D Gaussian Splatting

arXiv 2024

ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation

arXiv 2024

RealCustom: Narrowing Real Text Word for Real-Time Open-Domain Text-to-Image Customization

CVPR 2024 1

ExpertPrompting: Instructing Large Language Models to be Distinguished Experts

arXiv 2023

Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization

towards-accurate-image-coding-improved

ChiMed-GPT: A Chinese Medical Large Language Model with Full Training Regime and Better Alignment to Human Preferences

arXiv 2023

Air-Decoding: Attribute Distribution Reconstruction for Decoding-Time Controllable Text Generation

arXiv 2023