openai/whisper-small

El modelo Whisper-small es un modelo de reconocimiento automático del habla basado en arquitectura transformer encoder-decoder (sequence-to-sequence), que ofrece mayor calidad de transcripción y traducción del habla. Ha sido entrenado sobre grandes volúmenes de audio supervisado multilingüe, un enfoque ampliamente utilizado en investigación para tareas de automatic speech recognition.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para el reconocimiento y la traducción del habla de mayor calidad, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/openai/whisper-small

Data and Resources

This dataset has no data

Additional Info

Field	Value
Last Updated	June 16, 2026, 06:53 (UTC)
Created	June 16, 2026, 06:53 (UTC)
algorithm	Whisper
authors	[{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework	pytorch
library_requirements	transformers, torch, librosa/soundfile, ffmpeg. Es recomendable el uso de una GPU para throughput.
marketplace_author_id	7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id	f22a1c35-78e7-4a92-8ecf-ce8da3ce7d5c
resource_type	model
short_description	Whisper Small: reconocimiento de voz y traducción de voz de mayor calidad.
task_type	other