Aumento de audio y compresión de modelos para clasificación de escenas acústicas

Gonzalez-Poy, Eduard Marcel

dc.contributor.author	Gonzalez-Poy, Eduard Marcel
dc.date	2022-09-14
dc.date.accessioned	2022-11-18T13:27:45Z
dc.date.available	2022-11-18T13:27:45Z
dc.identifier.uri	https://reunir.unir.net/handle/123456789/13801
dc.description	In this project we have developed a low complexity model for acoustic scene classification; based on the challenge of task 1 of DCASE 2022, where a benchmark model to overcome is proposed. To achieve low complexity, we propose knowledge distillation with a "masterstudent" approach and subsequent quantization of the network parameters to the 8-bit integer type. The master network is based on residual convolutional networks and the student is a linear convolutional network. We present an audio data augmentation methodology, based on convolution between the original signal (of the proposed data set) and impulse responses from devices not present at the recording of the data. Our model outperforms the reference model by obtaining a log loss of 1,415, within the set complexity constraint.	es_ES
dc.description.abstract	Este proyecto consiste en el desarrollo de un modelo de baja complejidad para clasificación de escenas acústicas; basado en el reto de la tarea 1 de DCASE 2022. Para conseguir la baja complejidad, se propone la destilación de conocimiento con una aproximación “maestroalumno” y posterior cuantificación de los parámetros de la red al tipo entero de 8 bits. La red maestro se basa en redes convolucionales residuales y, la red alumno, es una red convolucional lineal. Se propone una metodología de aumento de datos de audio basada en la convolución entre la señal original del conjunto de datos propuesto y respuestas impulsiones de dispositivos no presentes en la captura de esos datos. El modelo propuesto supera al de referencia obteniendo un log loss de 1,415, dentro de la limitación de complejidad establecida.	es_ES
dc.language.iso	spa	es_ES
dc.rights	openAccess	es_ES
dc.subject	aumento de audio	es_ES
dc.subject	clasificación de escenas acústicas	es_ES
dc.subject	cuantificación de redes neuronales	es_ES
dc.subject	destilación de conocimiento	es_ES
dc.subject	redes convolucionales residuales	es_ES
dc.subject	audio augmentation	es_ES
dc.subject	acoustic scene clasification	es_ES
dc.subject	neural network quantization	es_ES
dc.subject	knowledge distillation	es_ES
dc.subject	residual convolutional networks	es_ES
dc.subject	Máster Universitario en Inteligencia Artificial	es_ES
dc.title	Aumento de audio y compresión de modelos para clasificación de escenas acústicas	es_ES
dc.type	masterThesis	es_ES
reunir.tag	~MIA	es_ES

Ficheros en el ítem

Nombre:: Gonzalez Poy, Eduard Marcel.pdf
Tamaño:: 1.403Mb
Formato:: PDF

Ver/Abrir

Este ítem aparece en la(s) siguiente(s) colección(ones)

Área de Ingeniería y Tecnología

Mostrar el registro sencillo del ítem

Aumento de audio y compresión de modelos para clasificación de escenas acústicas

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Ítems relacionados

A multicentre, randomised, controlled trial of a combined clinical treatment for first-episode psychosis ﻿

Propuesta de intervención con niños con Trastorno de Déficit de Atención e Hiperactividad para 1º y 2º de Primaria ﻿

Enseñanza del Álgebra en 4º de ESO usando Moodle ﻿

A multicentre, randomised, controlled trial of a combined clinical treatment for first-episode psychosis

Propuesta de intervención con niños con Trastorno de Déficit de Atención e Hiperactividad para 1º y 2º de Primaria

Enseñanza del Álgebra en 4º de ESO usando Moodle