Philip S. Thomas

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Reinforcement Learning from Human Feedback with High-Confidence Safety Constraints

arXiv 2025

ICU-Sepsis: A Benchmark MDP Built from Real Medical Data

arXiv 2024

Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy Evaluation

arXiv 2024

No known affiliations.

from 3 papers

Ameet Deshpande

Austin Hoag

Blossom Metevier

Bruno Castro da Silva

Dhawal Gupta

Kartik Choudhary

Scott Niekum

Shreyas Chaudhari

Will Schwarzer

Yaswanth Chittepu