Jiakang Wang

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

ASPO: Asymmetric Importance Sampling Policy Optimization

arXiv 2025

Stabilizing Knowledge, Promoting Reasoning: Dual-Token Constraints for RLVR

arXiv 2025

Capybara-OMNI: An Efficient Paradigm for Building Omni-Modal Language Models

arXiv 2025

No known affiliations.

from 3 papers

Fuzheng Zhang

Guorui Zhou

Runze Liu

Xiu Li

Chenxi Sun

Haonan Zhou

Hongzhi Zhang

Jingyuan Zhang

Kun Gai

Lei Lin