Jinyuan Li

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

RelayLLM: Efficient Reasoning via Collaborative Decoding

arXiv 2026

Process Rewards with Learned Reliability

arXiv 2026

Training Data Efficiency in Multimodal Process Reward Models

arXiv 2026

G-Zero: Self-Play for Open-Ended Generation from Zero Data

arXiv 2026

No known affiliations.

from 4 papers

Chengsong Huang

Jiaxin Huang

Langlin Huang

Haolin Liu

Shaoyang Xu

Tong Zheng

Wenxuan Zhang

Donghong Cai

Runpeng Dai

Yu Meng