Lei Sha

Papers: 9

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

9papers

Authored papers

Reasoning-to-Defend: Safety-Aware Reasoning Can Defend Large Language Models from Jailbreaking

arXiv 2025

2025

How Far are LLMs from Being Our Digital Twins? A Benchmark for Persona-Based Behavior Chain Simulation

arXiv 2025

2025

Benchmarking Multi-Step Legal Reasoning and Analyzing Chain-of-Thought Effects in Large Language Models

arXiv 2025

2025

Derail Yourself: Multi-turn LLM Jailbreak Attack through Self-discovered Clues

arXiv 2024

2024

ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator

arXiv 2024

2024

Omni-MATH: A Universal Olympiad Level Mathematic Benchmark For Large Language Models

arXiv 2024

2024

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors

arXiv 2024

2024

Towards a Unified View of Preference Learning for Large Language Models: A Survey

arXiv 2024

2024

Bird-Eye Transformers for Text Generation Models

arXiv 2022

2022

Affiliations

No known affiliations.

Frequent co-authors

from 9 papers

Qingxiu Dong

Zhifang Sui

Baobao Chang

Bofei Gao

Daoguang Zan

Dawei Yin

Feifan Song

Ge Zhang

researcher

2 shared papers

Junda Zhu

2 shared papers

Liang Chen

2 shared papers