superb/wav2vec2-base-superb-ks

El modelo Wav2Vec2-base-superb-ks es un modelo de clasificación de audio basado en arquitectura Wav2Vec2, ajustado para la detección de palabras clave (keyword spotting). Ha sido entrenado sobre el dataset de referencia SUPERB (Speech Commands), utilizado en investigación para tareas de detección de comandos de voz.

Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación. En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de audio y voz, específicamente para interfaces de comandos de voz y disparadores tipo palabra de activación, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/superb/wav2vec2-base-superb-ks

Data and Resources

This dataset has no data

Additional Info

Field	Value
Last Updated	June 16, 2026, 07:15 (UTC)
Created	June 16, 2026, 07:15 (UTC)
algorithm	Wav2Vec2-base
authors	[{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework	pytorch
library_requirements	tranformers, torch, librosa/soundfile y ffmpeg
marketplace_author_id	7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id	48a0dbc0-520b-47f7-9ff6-042553995027
resource_type	model
short_description	Modelo Wav2Vec2-base ajustado para la detección de palabras clave en SUPERB (comandos de voz).
task_type	multiclass_classification