MoE-Mamba: Efficient Selective State Space Models with Mixture of Experts [2401.04081]