superb/wav2vec2-base-superb-ks

El modelo Wav2Vec2-base-superb-ks es un modelo de clasificación de audio basado en arquitectura Wav2Vec2, ajustado para la detección de palabras clave (keyword spotting). Ha sido entrenado sobre el dataset de referencia SUPERB (Speech Commands), utilizado en investigación para tareas de detección de comandos de voz.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para interfaces de comandos de voz y disparadores tipo palabra de activación, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/superb/wav2vec2-base-superb-ks

Data and Resources

This dataset has no data

Additional Info

Field Value
Last Updated June 16, 2026, 07:15 (UTC)
Created June 16, 2026, 07:15 (UTC)
algorithm Wav2Vec2-base
authors [{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework pytorch
library_requirements tranformers, torch, librosa/soundfile y ffmpeg
marketplace_author_id 7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id 48a0dbc0-520b-47f7-9ff6-042553995027
resource_type model
short_description Modelo Wav2Vec2-base ajustado para la detección de palabras clave en SUPERB (comandos de voz).
task_type multiclass_classification