facebook/mms-lid-256

El modelo MMS-LID-256 es un modelo de clasificación de audio basado en arquitectura Wav2Vec2 (familia MMS), especializado en la identificación del idioma hablado entre 256 lenguas. Ha sido entrenado en el marco del proyecto MMS (Massively Multilingual Speech) sobre el dataset FLEURS, en una línea de investigación de cobertura lingüística amplia.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para la identificación de idioma hablado como paso previo de enrutamiento a los modelos de ASR/TTS adecuados, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/facebook/mms-lid-256

Data and Resources

This dataset has no data

Additional Info

Field Value
Last Updated June 16, 2026, 07:12 (UTC)
Created June 16, 2026, 07:12 (UTC)
algorithm Familia MMS sobre Wav2Vec2
authors [{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework pytorch
library_requirements transformers, torch, librosa/soundfile, ffmpeg
marketplace_author_id 7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id df9d95b4-8d40-4c02-9a2e-7c6162f406d0
resource_type model
short_description Identificación de la lengua hablada en MMS en 256 idiomas.
task_type multiclass_classification