Resumen
Este proyecto consiste en el desarrollo de un modelo de baja complejidad para clasificación de escenas acústicas; basado en el reto de la tarea 1 de DCASE 2022. Para conseguir la baja complejidad, se propone la destilación de conocimiento con una aproximación “maestroalumno” y posterior cuantificación de los parámetros de la red al tipo entero de 8 bits. La red maestro se basa en redes convolucionales residuales y, la red alumno, es una red convolucional lineal. Se propone una metodología de aumento de datos de audio basada en la convolución entre la señal original del conjunto de datos propuesto y respuestas impulsiones de dispositivos no presentes en la captura de esos datos. El modelo propuesto supera al de referencia obteniendo un log loss de 1,415, dentro de la limitación de complejidad establecida.
Colecciones
Página completa del ítem
.png)
