Interpretación de música de piano usando técnicas de Deep Learning
Interpretation of piano music using Deep Learning techniques
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/26333Registro completo
Mostrar el registro completo DCAutoría
López García, Álvaro
Fecha
2022-09-08Director/es
Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Música
TTS
Aprendizaje Automático
MAESTRO dataset
ARNNs
Aprendizaje Produndo
WaveNet
Redes Neuronales
Redes Neuronales Convolucionales
Music
Machine Learning
MAESTRO dataset
Deep Learning
Neural Networks
Convolutional Neural Networks
Resumen/Abstract
RESUMEN: La correcta interpretación de la música es una tarea extremadamente compleja. Los intérpretes profesionales dedican toda una vida a perfeccionarse en esta labor. La preparación requerida junto con los costes asociados a la infraestructura hace que la producción de una determinada obra sea altamente costosa. Y pese a esto, la ciencia aún no nos ha brindado una solución que no requiera de tantos recursos. El objetivo de este Trabajo Fin de Grado es el desarrollo de un agente inteligente basado en técnicas de Aprendizaje Profundo (en inglés, Deep Learning) que sea capaz de interpretar música de piano de la forma más humana posible. Hasta ahora, las técnicas existentes para la generación de interpretaciones se basaban en grandes bancos de sonido y las interpretaciones que ofrecían como resultado eran evidentemente artificiales. Es por esto por lo que se desea crear un agente que no precise de tales cantidades de memoria y que realice interpretaciones indistinguibles de las realizadas por humanos. Para el desarrollo de dicho agente se emplearán Redes Neuronales Autorregresivas, da dos los buenos resultados que estas han mostrado en tareas de Text-to-Speech, que a su vez presentan una gran similitud con el tema abordado. El entrenamiento de dicho modelo se realizará sobre el “MAESTRO” dataset (MIDI and Audio Edited for Synchronous TRacks and Organization) y su implementación se realizará en Python, usando la librería TensorFlow.
ABSTRACT: The correct interpretation of music is an extremely complex task. Professional interpreters dedicate a lifetime to perfecting themselves in this work. The preparation required, together with the costs associated with the infrastructure, makes the production of a given work highly expensive. And despite this, science has not yet provided us with a solution that does not require so many resources. The objective of this Final Degree Project is the development of an intelligent agent based on Deep Learning techniques that is capable of interpreting piano music in the most human way possible. Until now, existing techniques for generating performances were based on large banks of sounds, and the resulting performances were patently artificial. This is why it would be very useful to create an agent that does not require such amounts of memory and that performs interpretations indistinguishable from those made by humans. For the development of said agent, Autoregressive Neural Networks will be used, given the good results that these have shown in Text-to-Speech tasks, which in turn present a great similarity with the topic addressed. The training of said model will be carried out on the “MAESTRO” dataset (MIDI and Audio Edited for Synchronous TRAcks and Organization) and its implementation will be carried out in Python, using the TensorFlow library.