Guozhi Tang

Cite

Notes

Only stored in your browser.

Attribution

2papers

Authored papers

OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning

arXiv 2024

ParGo: Bridging Vision-Language with Partial and Global Views

arXiv 2024

No known affiliations.

from 2 papers

Bin Shan

Can Huang

Jingqun Tang

An-Lan Wang

Biao Yang

Binghong Wu

Chunhui Lin

Hao Feng

Hao liu

Hao Lu