Yizhe Zhang

CLaRa: Bridging Retrieval and Generation with Continuous Latent Reasoning

arXiv 2025

SAGE: Steering and Refining Dialog Generation with State-Action Augmentation

arXiv 2025

DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation

arXiv 2025

Reversal Blessing: Thinking Backward May Outpace Thinking Forward in Multi-choice Questions

arXiv 2025

Learn to Reason Efficiently with Adaptive Length-based Reward Shaping

arXiv 2025

SWE-Gym: An Open Environment for Training Software Engineering Agents and Verifiers

preprint

OpenHands: An Open Platform for AI Software Developers as Generalist Agents

arXiv 2024

Scaling Diffusion Language Models via Adaptation from Autoregressive Models

arXiv 2024

Divide-or-Conquer? Which Part Should You Distill Your LLM?

arXiv 2024

ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities

arXiv 2024

How Far Are We from Intelligent Visual Deductive Reasoning?

arXiv 2024

Matryoshka Diffusion Models

arXiv 2023

Probing the Multi-turn Planning Capabilities of LLMs via 20 Question Games

arXiv 2023

Stabilizing Transformer Training by Preventing Attention Entropy Collapse

arXiv 2023

PLANNER: Generating Diversified Paragraph via Latent Language Diffusion Model

planner-generating-diversified-paragraph-via