Cosmin Paduraru

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Training Language Models to Self-Correct via Reinforcement Learning

arXiv 2024

Transformers Meet Directed Graphs

arXiv 2023

No known affiliations.

from 2 papers

Aleksandra Faust

Ali Taylan Cemgil

Avi Singh

Aviral Kumar

Colton Bishop

Daniel Mankowitz

Disha Shrivastava

Doina Precup

Feryal Behbahani

George Tucker