Zhanfeng Mo

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

arXiv 2025

Multi-Agent Tool-Integrated Policy Optimization

arXiv 2025

Panda LLM: Training Data and Evaluation for Open-Sourced Chinese Instruction-Following Large Language Models

arXiv 2023

No known affiliations.

from 3 papers

Lidong Bing

Xingxuan Li

Bin Wang

Bosheng Ding

Chong Zhang

researcher

Dianwen Ng

Fangkai Jiao

Feng Ji

Hai Ye

Han Zhao