Multilingual MMLU
MMLU translated into 14-26 languages (community variants exist); measures world knowledge and reasoning across non-English languages.
- Publisher
- OpenAI
- Capabilities
- Factual RecallMultilingual
- Domain
- multilingual
- Format
- HF Dataset
- Size
- 14000 tasks
- License
- MIT
- Published
- May 2026
- Notable for
- Benchmark for evaluating factual recall and multilingual in the multilingual domain.
- Canonical
- huggingface.co/datasets/openai/MMMLU
Cite
Notes
Only stored in your browser.
Sample tasks
5from the eval dataset
أوجد درجة امتداد الحقل المحدد Q(sqrt(2)، sqrt(3)، sqrt(18)) على Q.
- A0
- B4
- C2
- D6
Show 4 more examples
لتكن p = (1, 2, 5, 4)(2, 3) في S_5 . أوجد دليل <p> في S_5.
- A8
- B2
- C24
- D120
أوجد جميع الأصفار في الحقل المحدود المشار إليه في كثيرة الحدود المعطاة مع المعاملات في هذا الحقل. x^5 + 3x^3 + x^2 + 2x في Z_5
- A0
- B1
- C0,1
- D0,4
العبارة 1 | مجموعة عوامل لمجموعة غير آبلية هي غير آبلية. العبارة 2 | إذا كانت K مجموعة فرعية عادية من H وH مجموعة فرعية عادية من G، فإن K هي مجموعة فرعية عادية من G.
- Aصواب، صواب
- Bخطأ، خطأ
- Cصواب، خطأ
- Dخطأ، صواب
أوجد حاصل ضرب كثيرات الحدود المعطاة في حلقة كثيرات الحدود المعطاة. f(x) = 4x - 5، g(x) = 2x^2 - 4x + 2 في Z_8[x].
- A2x^2 + 5
- B6x^2 + 4x + 6
- C0
- Dx^2 + 1
Related tools
2Implementations, trainers, datasets and scaffolds linked to this eval.
FAQ
- What is Multilingual MMLU?
- MMLU translated into 14-26 languages (community variants exist); measures world knowledge and reasoning across non-English languages.
- What capabilities does Multilingual MMLU test?
- Multilingual MMLU evaluates factual recall, multilingual.
- How can a model improve its Multilingual MMLU score?
- Tools linked to Multilingual MMLU on Sophon include Mmmlu RL Env (Community), Aya Dataset - RL environments, datasets, and scaffolds that target this eval.
- What license is Multilingual MMLU under?
- Multilingual MMLU is available under MIT.