facebook/mms-lid-256

El modelo MMS-LID-256 es un modelo de clasificación de audio basado en arquitectura Wav2Vec2 (familia MMS), especializado en la identificación del idioma hablado entre 256 lenguas. Ha sido entrenado en el marco del proyecto MMS (Massively Multilingual Speech) sobre el dataset FLEURS, en una línea de investigación de cobertura lingüística amplia.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para la identificación de idioma hablado como paso previo de enrutamiento a los modelos de ASR/TTS adecuados, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/facebook/mms-lid-256

Data and Resources

This dataset has no data

Additional Info

Field	Value
Last Updated	June 16, 2026, 07:12 (UTC)
Created	June 16, 2026, 07:12 (UTC)
algorithm	Familia MMS sobre Wav2Vec2
authors	[{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework	pytorch
library_requirements	transformers, torch, librosa/soundfile, ffmpeg
marketplace_author_id	7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id	df9d95b4-8d40-4c02-9a2e-7c6162f406d0
resource_type	model
short_description	Identificación de la lengua hablada en MMS en 256 idiomas.
task_type	multiclass_classification