openai/whisper-base

El modelo Whisper-base es un modelo de reconocimiento automático del habla basado en arquitectura transformer encoder-decoder (sequence-to-sequence), que ofrece mejor precisión que la variante tiny manteniéndose ligero. Ha sido entrenado sobre grandes volúmenes de audio supervisado multilingüe, un enfoque ampliamente utilizado en investigación para tareas de automatic speech recognition. Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación.

En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente como opción equilibrada de transcripción de voz a texto multilingüe, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/openai/whisper-base

Data and Resources

This dataset has no data

Additional Info

Field Value
Last Updated June 16, 2026, 06:50 (UTC)
Created June 16, 2026, 06:50 (UTC)
algorithm Whisper
authors [{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework pytorch
library_requirements transformers, torch, librosa/soundfile, ffmpeg.
marketplace_author_id 7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id 864a80ad-07a6-4f76-9e42-36f08b3e9274
resource_type model
short_description Base Whisper: mayor precisión que las más pequeñas, pero igual de ligera.
task_type other