Hao Bai

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

InT: Self-Proposed Interventions Enable Credit Assignment in LLM Reasoning

arXiv 2026

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

arXiv 2025

Digi-Q: Learning Q-Value Functions for Training Device-Control Agents

arXiv 2025

No known affiliations.

from 3 papers

Aviral Kumar

Amrith Setlur

Yifei Zhou

Ameet Talwalkar

Diego Caples

Gene Yang

Ian Wu

Junhong Shen

Li Erran Li

Lunjun Zhang