facebook/mms-tts-spa

El modelo MMS-TTS-spa es un modelo de síntesis de voz (text-to-speech) basado en arquitectura VITS, que genera voz en español de extremo a extremo. Ha sido desarrollado en el marco del proyecto MMS (Massively Multilingual Speech), orientado a ampliar la cobertura lingüística de la tecnología del habla.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para la síntesis de voz en español de la plataforma, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/facebook/mms-tts-spa

Data and Resources

This dataset has no data

Additional Info

Field	Value
Last Updated	June 16, 2026, 07:34 (UTC)
Created	June 16, 2026, 07:34 (UTC)
algorithm	VITS
authors	[{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework	pytorch
library_requirements	transformers, torch, soundfile.
marketplace_author_id	7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id	7ac377e1-004c-4331-9f5a-be76d67f8316
resource_type	model
short_description	Sintetizador de voz en español para MMS (VITS).
task_type	other