Zhengxin Zhang

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

HAPO: Training Language Models to Reason Concisely via History-Aware Policy Optimization

arXiv 2025

Better LLM Reasoning via Dual-Play

arXiv 2025

Quantized Side Tuning: Fast and Memory-Efficient Tuning of Quantized Large Language Models

arXiv 2024

No known affiliations.

from 3 papers

Chengyu Huang

Claire Cardie

professor

Aochong Oliver Li

Dan Zhao

Gabriele Oliaro

Qing Li

Xupeng Miao

Yong Jiang

Zhihao Jia