Ye Tian

Papers: 24

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

24papers

Authored papers

SAMTok: Representing Any Mask with Two Words

arXiv 2026

2026

Towards Customized Multimodal Role-Play

arXiv 2026

2026

Turning the TIDE: Cross-Architecture Distillation for Diffusion Large Language Models

arXiv 2026

2026

MMaDA: Multimodal Large Diffusion Language Models

arXiv 2025

2025

Co-Evolving LLM Coder and Unit Tester via Reinforcement Learning

arXiv 2025

2025

Diffusion-Sharpening: Fine-tuning Diffusion Models with Denoising Trajectory Sharpening

arXiv 2025

2025

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

arXiv 2025

2025

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

arXiv 2025

2025

VMoBA: Mixture-of-Block Attention for Video Diffusion Models

arXiv 2025

2025

PairUni: Pairwise Training for Unified Multimodal Language Models

arXiv 2025

2025

HermesFlow: Seamlessly Closing the Gap in Multimodal Understanding and Generation

arXiv 2025

2025

Don't Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls

arXiv 2025

2025

Training-free Diffusion Acceleration with Bottleneck Sampling

arXiv 2025

2025

MMaDA-Parallel: Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation

arXiv 2025

2025

Does Hearing Help Seeing? Investigating Audio-Video Joint Denoising for Video Generation

arXiv 2025

2025

Multi-Agent Collaboration via Cross-Team Orchestration

arXiv 2024

2024

VideoTetris: Towards Compositional Text-to-Video Generation

arXiv 2024

2024

RealCompo: Balancing Realism and Compositionality Improves Text-to-Image Diffusion Models

arXiv 2024

2024

Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching

arXiv 2024

2024

Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing

arXiv 2024

2024

DivScene: Benchmarking LVLMs for Object Navigation with Diverse Scenes and Objects

arXiv 2024

2024

VQGraph: Rethinking Graph Representation Space for Bridging GNNs and MLPs

arXiv 2023

2023

Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend Existing Ones?

arXiv 2023

2023

EQ-Net: Elastic Quantization Neural Networks

ICCV 2023 1

2023

Affiliations

No known affiliations.

Frequent co-authors

from 24 papers

Ling Yang

Yunhai Tong

Bin Cui

Mengdi Wang

Anran Wang

Haochen Wang

Xiangtai Li

Xinchen Zhang

Zhuochen Wang

Dong Yu