Jixuan Huang

Cite

Notes

Only stored in your browser.

Attribution

5papers

Authored papers

SciAgentGym: Benchmarking Multi-Step Scientific Tool-use in LLM Agents

arXiv 2026

FRoM-W1: Towards General Humanoid Whole-Body Control with Language Instructions

arXiv 2026

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning

arXiv 2025

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

arXiv 2025

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

arXiv 2025

No known affiliations.

from 5 papers

Qi Zhang

Tao Gui

Xuanjing Huang

Zhiheng Xi

Rui Zheng

Yu-Gang Jiang

Enyu Zhou

Honglin Guo

Jiaqi Liu

Jiazheng Zhang