Ninareh Mehrabi

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

Towards Safety Reasoning in LLMs: AI-agentic Deliberation for Policy-embedded CoT Data Creation

arXiv 2025

Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models

arXiv 2024

No known affiliations.

from 2 papers

Aram Galstyan

Kai-Wei Chang

Rahul Gupta

Anil Ramakrishna

Charith Peris

Fei Wang

Palash Goyal

Richard Zemel

Tharindu Kumarage

Xinyan Zhao