Huaijie Wang

Cite

Notes

Only stored in your browser.

Attribution

1papers

Authored papers

Offline Reinforcement Learning for LLM Multi-Step Reasoning

arXiv 2024

No known affiliations.

from 1 papers

Hanze Dong

Shenao Zhang

Shibo Hao

Yi Wu

Yilin Bao

Ziran Yang