Samuel Cahyawijaya

WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines

arXiv 2024

Subobject-level Image Tokenization

arXiv 2024

SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages

arXiv 2024

Towards Efficient and Robust VQA-NLE Data Generation with Large Vision-Language Models

arXiv 2024

A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity

arXiv 2023

NusaWrites: Constructing High-Quality Corpora for Underrepresented and Extremely Low-Resource Languages

arXiv 2023

Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition

arXiv 2023

InstructAlign: High-and-Low Resource Language Alignment via Continual Crosslingual Instruction Tuning

arXiv 2023

Which One Are You Referring To? Multimodal Object Identification in Situated Dialogue

arXiv 2023

IndoToD: A Multi-Domain Indonesian Benchmark For End-to-End Task-Oriented Dialogue Systems

arXiv 2023

Can Question Rewriting Help Conversational Question Answering?

insights (ACL) 2022 5

BigBIO: A Framework for Data-Centric Biomedical Natural Language Processing

arXiv 2022

Automatic Speech Recognition Datasets in Cantonese: A Survey and New Dataset

LREC 2022 6

NusaCrowd: Open Source Initiative for Indonesian NLP Resources

arXiv 2022