Martin Jaggi

Papers: 17

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

17papers

Authored papers

Apertus: Democratizing Open and Compliant LLMs for Global Language Environments

arXiv 2025

2025

Gradient-Normalized Smoothness for Optimization with Approximate Hessians

arXiv 2025

2025

FineWeb2: One Pipeline to Scale Them All -- Adapting Pre-Training Data Processing to Every Language

arXiv 2025

2025

Benchmarking Optimizers for Large Language Model Pretraining

arXiv 2025

2025

QuaRot: Outlier-Free 4-Bit Inference in Rotated LLMs

arXiv 2024

2024

Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations

arXiv 2024

2024

MEDITRON-70B: Scaling Medical Pretraining for Large Language Models

arXiv 2023

2023

Landmark Attention: Random-Access Infinite Context Length for Transformers

arXiv 2023

2023

MultiModN- Multimodal, Multi-Task, Interpretable Modular Networks

arXiv 2023

2023

Layer-wise Linear Mode Connectivity

arXiv 2023

2023

Faster Causal Attention Over Large Sequences Through Sparse Flash Attention

arXiv 2023

2023

Multiplication-Free Transformer Training via Piecewise Affine Operations

multiplication-free-transformer-training-via

2023

Learning from History for Byzantine Robust Optimization

arXiv 2020

2020

Model Fusion via Optimal Transport

NeurIPS 2020 12

2019

PowerSGD: Practical Low-Rank Gradient Compression for Distributed Optimization

powersgd-practical-low-rank-gradient-1

2019

Evaluating the Search Phase of Neural Architecture Search

ICLR 2020 1

2019

Unsupervised Learning of Sentence Embeddings using Compositional n-Gram Features

unsupervised-learning-of-sentence-embeddings-1

2017

Affiliations

No known affiliations.

Frequent co-authors

from 17 papers

Matteo Pagliardini

5 shared papers

Amirkeivan Mohtashami

3 shared papers

Andrei Semenov

3 shared papers

Alejandro Hernández Cano

Alexander Hägele

Angelika Romanou

Antoine Bosselut

Atli Kosson

Bettina Messmer

Kyle Matoba