Bohong Wu

Cite

Notes

Only stored in your browser.

Attribution

3papers

Authored papers

Seeing the Image: Prioritizing Visual Correlation by Contrastive Alignment

arXiv 2024

World to Code: Multi-modal Data Generation via Self-Instructed Compositional Captioning and Filtering

arXiv 2024

Benchmarking and Improving Detail Image Caption

arXiv 2024

No known affiliations.

from 3 papers

Haoyuan Guo

Jiacong Wang

Xin Xiao

Xun Zhou

Chunyuan Li

Haiyong Jiang

Hongyuan Dong

Jiawen Li

Jun Xiao

Yuan Zhang