Zecheng Wang

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

Baichuan-M1: Pushing the Medical Capability of Large Language Models

arXiv 2025

Surrogate Signals from Format and Length: Reinforcement Learning for Solving Mathematical Problems without Ground Truth Answers

arXiv 2025

Pruning via Merging: Compressing LLMs via Manifold Alignment Based Layer Merging

arXiv 2024

Pre-training with Synthetic Data Helps Offline Reinforcement Learning

arXiv 2023

No known affiliations.

from 4 papers

Bingning Wang

Dianbo Sui

Han Liu

Rihui Xin

Yupeng Zhang

Bo Li

Che Wang

Cunhang Fan

Da Pan

Deyuan Liu