Junkai Zhang

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Chasing the Tail: Effective Rubric-based Reward Modeling for Large Language Model Post-Training

arXiv 2025

WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization

arXiv 2025

WebSailor: Navigating Super-human Reasoning for Web Agent

arXiv 2025

Enhancing LLM Safety Through a Theoretical Minimax Game Lens

arXiv 2025

No known affiliations.

from 4 papers

Baixuan Li

Fei Huang

Jialong Wu

Jingren Zhou

Kuan Li

Liwen Zhang

Pengjun Xie

Wei Wang

Wenbiao Yin

Xinyu Wang