Yi-Kai Zhang

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

LongCat-Flash-Thinking-2601 Technical Report

arXiv 2026

CoBA-RL: Capability-Oriented Budget Allocation for Reinforcement Learning in LLMs

arXiv 2026

V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

arXiv 2026

Capability Instruction Tuning: A New Paradigm for Dynamic LLM Routing

arXiv 2025

No known affiliations.

from 4 papers

Qi Gu

Xunliang Cai

Yueqing Sun

De-Chuan Zhan

Han-Jia Ye

Hongyan Hao

Hui Su

Tianhao Hu

Yuxin Chen

Zhiyuan Yao