Question 1

What is MMLU: Measuring Massive Multitask Language Understanding?

Accepted Answer

Evaluate models on 57 tasks including elementary mathematics, US history, computer science, law, and more.

Question 2

How can a model improve its MMLU: Measuring Massive Multitask Language Understanding score?

Accepted Answer

Tools linked to MMLU: Measuring Massive Multitask Language Understanding on Sophon include MMLU RL Env (Prime Community), MMLU RL Env (Community), Openmed Medknowledge RL Env (Community) - RL environments, datasets, and scaffolds that target this eval.

Question 3

What license is MMLU: Measuring Massive Multitask Language Understanding under?

Accepted Answer

MMLU: Measuring Massive Multitask Language Understanding is available under mit.

MMLU: Measuring Massive Multitask Language Understanding

Related tools

MMLU RL Env (Prime Community)

MMLU RL Env (Community)

Openmed Medknowledge RL Env (Community)

Papers

Measuring Massive Multitask Language Understanding

FAQ