Xiaohui Shen

Papers: 12

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

12papers

Authored papers

Vidi: Large Multimodal Models for Video Understanding and Editing

arXiv 2025

2025

Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation

arXiv 2025

2025

FlowAR: Scale-wise Autoregressive Image Generation Meets Flow Matching

arXiv 2024

2024

ViTamin: Designing Scalable Vision Models in the Vision-Language Era

CVPR 2024 1

2024

Alleviating Distortion in Image Generation via Multi-Resolution Diffusion Models and Time-Dependent Layer Normalization

arXiv 2024

2024

MaskBit: Embedding-free Image Generation via Bit Tokens

arXiv 2024

2024

A Simple Video Segmenter by Tracking Objects Along Axial Trajectories

arXiv 2023

2023

Towards Open-Ended Visual Recognition with Large Language Model

arXiv 2023

2023

Convolutions Die Hard: Open-Vocabulary Segmentation with Single Frozen Convolutional CLIP

convolutions-die-hard-open-vocabulary

2023

Adversarial Open Domain Adaptation for Sketch-to-Photo Synthesis

arXiv 2021

2021

EnlightenGAN: Deep Light Enhancement without Paired Supervision

arXiv 2019

2019

Free-Form Image Inpainting with Gated Convolution

free-form-image-inpainting-with-gated-1

2018

Affiliations

No known affiliations.

Frequent co-authors

from 12 papers

Liang-Chieh Chen

Qihang Yu

Ju He

Alan Yuille

Xueqing Deng

Ding Liu

Sucheng Ren

Celong Liu

Chen Fang

Chia-Wen Kuo