Song Jiang

Papers: 2

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

2papers

Authored papers

2

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

arXiv 2025

SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks

arXiv 2025

Affiliations

No known affiliations.

Frequent co-authors

10

from 2 papers

Yuandong Tian

2 shared papers

Bo Liu

researcher

Cai Zhou

Chenyu Wang

DiJia Su

Feiyu Chen

Jason Weston

Paria Rashidinejad

Sainbayar Sukhbaatar

Sergey Levine

professor