Es una arquitectura de modelos de IA que, en lugar de utilizar una única red neuronal gigante para todas las tareas, emplea varias redes más pequeñas y especializadas (los ""expertos""). Un mecanismo de ""portería"" (gating) decide qué experto es el más adecuado para procesar cada parte de la entrada. Esto permite crear modelos mucho más grandes y potentes de manera eficiente. Transforma la interacción con el modelo en una herramienta de trabajo más concreta, ya que cada consulta es dirigida al especialista más relevante, mejorando la calidad y la velocidad de la respuesta.