Xianzhi Yu

Papers: 8

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

8papers

Authored papers

Behavioral Fingerprinting of Large Language Models

arXiv 2025

2025

PreMoe: Lightening MoEs on Constrained Memory by Expert Pruning and Retrieval

arXiv 2025

2025

EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization

arXiv 2025

2025

Quantization Hurts Reasoning? An Empirical Study on Quantized Reasoning Models

arXiv 2025

2025

CMoE: Fast Carving of Mixture-of-Experts for Efficient LLM Inference

arXiv 2025

2025

AttentionPredictor: Temporal Pattern Matters for Efficient LLM Inference

arXiv 2025

2025

FlatQuant: Flatness Matters for LLM Quantization

arXiv 2024

2024

FuseGPT: Learnable Layers Fusion of Generative Pre-trained Transformers

arXiv 2024

2024

Affiliations

No known affiliations.

Frequent co-authors

from 8 papers

Mingxuan Yuan

Bei Yu

Hui-Ling Zhen

Wulong Liu

Zehua Pei

Sinno Jialin Pan

Chun Yuan

Haoli Bai

Lu Hou

Ruikang Liu