Holdings: Retraining-Free Merging of Sparse MoE via Hierarchical Clustering

Loading…

View in EDS

Saved in:

Publication Year:

2024

Subject Terms:

Computer Science - Machine Learning

Description:

Sparse Mixture-of-Experts (SMoE) models represent a significant advancement in large language model (LLM) development through their efficien

Database:

arXiv