Kuan Wang

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

arXiv 2025

ToolQA: A Dataset for LLM Question Answering with External Tools

toolqa-a-dataset-for-llm-question-answering

APQ: Joint Search for Network Architecture, Pruning and Quantization Policy

apq-joint-search-for-network-architecture

No known affiliations.

from 3 papers

Baolin Peng

Chao Zhang

Han Cai

Hao Cheng

Haotian Sun

Ji Lin

Jianfeng Gao

Liliang Ren

Lucas Liu

Qing Yang