0

Multilingual MMLU

Active

MMLU translated into 14-26 languages (community variants exist); measures world knowledge and reasoning across non-English languages.

Publisher
OpenAI
Domain
multilingual
Format
HF Dataset
Size
14000 tasks
License
MIT
Published
May 2026
Notable for
Benchmark for evaluating factual recall and multilingual in the multilingual domain.

Cite

Notes

Only stored in your browser.

Sample tasks

5

from the eval dataset

abstract_algebra

أوجد درجة امتداد الحقل المحدد Q(sqrt(2)، sqrt(3)، sqrt(18)) على Q.

  • A0
  • B4
  • C2
  • D6
Show 4 more examples
abstract_algebra

لتكن p = (1, 2, 5, 4)(2, 3) في S_5 . أوجد دليل <p> في S_5.

  • A8
  • B2
  • C24
  • D120
abstract_algebra

أوجد جميع الأصفار في الحقل المحدود المشار إليه في كثيرة الحدود المعطاة مع المعاملات في هذا الحقل. x^5 + 3x^3 + x^2 + 2x في Z_5

  • A0
  • B1
  • C0,1
  • D0,4
abstract_algebra

العبارة 1 | مجموعة عوامل لمجموعة غير آبلية هي غير آبلية. العبارة 2 | إذا كانت K مجموعة فرعية عادية من H وH مجموعة فرعية عادية من G، فإن K هي مجموعة فرعية عادية من G.

  • Aصواب، صواب
  • Bخطأ، خطأ
  • Cصواب، خطأ
  • Dخطأ، صواب
abstract_algebra

أوجد حاصل ضرب كثيرات الحدود المعطاة في حلقة كثيرات الحدود المعطاة. f(x) = 4x - 5، g(x) = 2x^2 - 4x + 2 في Z_8[x].

  • A2x^2 + 5
  • B6x^2 + 4x + 6
  • C0
  • Dx^2 + 1

Related tools

2
View all

Implementations, trainers, datasets and scaffolds linked to this eval.

FAQ

What is Multilingual MMLU?
MMLU translated into 14-26 languages (community variants exist); measures world knowledge and reasoning across non-English languages.
What capabilities does Multilingual MMLU test?
Multilingual MMLU evaluates factual recall, multilingual.
How can a model improve its Multilingual MMLU score?
Tools linked to Multilingual MMLU on Sophon include Mmmlu RL Env (Community), Aya Dataset - RL environments, datasets, and scaffolds that target this eval.
What license is Multilingual MMLU under?
Multilingual MMLU is available under MIT.