Haiyu Xu

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

AutoResearchBench: Benchmarking AI Agents on Complex Scientific Literature Discovery

arXiv 2026

Do Vision-Language Models Measure Up? Benchmarking Visual Measurement Reading with MeasureBench

arXiv 2025

Beyond Multiple Choice: Verifiable OpenQA for Robust Vision-Language RFT

arXiv 2025

No known affiliations.

from 3 papers

Xi Yang

Yesheng Liu

Chen Yue

Hao Li

JG Yao

Mingxuan Zhao

Zheqi He

Baoqi Pei

Bowen Qin

Fenfen Lin