Zhenjiang Jin

Cite

Notes

Only stored in your browser.

Attribution

4papers

Authored papers

MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

arXiv 2025

WanJuanSiLu: A High-Quality Open-Source Webtext Dataset for Low-Resource Languages

arXiv 2025

OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text

arXiv 2024

WanJuan: A Comprehensive Multimodal Dataset for Advancing English and Chinese Large Models

arXiv 2023

No known affiliations.

from 4 papers

Conghui He

Dahua Lin

Wei Li

Bin Wang

Chao Xu

Pei Chu

Yu Qiao

Zhenxiang Li

Zhongying Tu

Bo Zhang