Kyunghyun Cho

MIST: Mutual Information Estimation Via Supervised Training

arXiv 2025

AION-1: Omnimodal Foundation Model for Astronomical Sciences

arXiv 2025

HERITAGE: An End-to-End Web Platform for Processing Korean Historical Documents in Hanja

arXiv 2025

Aioli: A Unified Optimization Framework for Language Model Data Mixing

arXiv 2024

When Does Classical Chinese Help? Quantifying Cross-Lingual Transfer in Hanja and Kanbun

arXiv 2024

Large-Scale Targeted Cause Discovery with Data-Driven Learning

arXiv 2024

Jointly Modeling Inter- & Intra-Modality Dependencies for Multi-modal Learning

arXiv 2024

AstroCLIP: A Cross-Modal Foundation Model for Galaxies

arXiv 2023

Improving Code Generation by Training with Natural Language Feedback

arXiv 2023

Regularizing with Pseudo-Negatives for Continual Self-Supervised Learning

arXiv 2023

Sudden Drops in the Loss: Syntax Acquisition, Phase Transitions, and Simplicity Bias in MLMs

arXiv 2023

System-Level Natural Language Feedback

arXiv 2023

Training Language Models with Language Feedback at Scale

arXiv 2023

Towards Understanding and Improving GFlowNet Training

arXiv 2023

Latent State Models of Training Dynamics

arXiv 2023

A Non-monotonic Self-terminating Language Model

arXiv 2022

2022

KLUE: Korean Language Understanding Evaluation

arXiv 2021

2021

NaturalProofs: Mathematical Theorem Proving in Natural Language

arXiv 2021

2021

AdapterHub: A Framework for Adapting Transformers

EMNLP 2020 11

2020

Capacity, Bandwidth, and Compositionality in Emergent Language Learning

arXiv 2019

Passage Re-ranking with BERT

arXiv 2019

BERT has a Mouth, and It Must Speak: BERT as a Markov Random Field Language Model

bert-has-a-mouth-and-it-must-speak-bert-as-a-1

Mixout: Effective Regularization to Finetune Large-scale Pretrained Language Models

ICLR 2020 1