facebook/mms-tts-eng

El modelo MMS-TTS-eng es un modelo de síntesis de voz (text-to-speech) basado en arquitectura VITS, que genera voz en inglés de extremo a extremo con un único modelo. Ha sido desarrollado en el marco del proyecto MMS (Massively Multilingual Speech), una línea de investigación orientada a ampliar la cobertura lingüística de la tecnología del habla.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para la síntesis de voz ligera en inglés, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/facebook/mms-tts-eng

Data and Resources

This dataset has no data

Additional Info

Field	Value
Last Updated	June 16, 2026, 07:31 (UTC)
Created	June 16, 2026, 07:31 (UTC)
algorithm	VITS
authors	[{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework	pytorch
library_requirements	transformers, torch, soundfile.
marketplace_author_id	7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id	3ee48d83-ab20-4914-b88b-a4129d5911c5
resource_type	model
short_description	MMS English TTS (basado en VITS): síntesis ligera con un único modelo.
task_type	other