Andrea Zanette

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Training Language Models to Reason Efficiently

arXiv 2025

Accelerating Unbiased LLM Evaluation via Synthetic Feedback

arXiv 2025

ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL

arXiv 2024

Fast Best-of-N Decoding via Speculative Rejection

arXiv 2024

No known affiliations.

from 4 papers

Aviral Kumar

Daman Arora

Hanshi Sun

Huitao Yang

Jiahao Qiu

Jiayi Pan

grad-student

Mengdi Wang

Ming Yin

Momin Haider

Peter Bartlett