An End-to-End Framework for Audio-to-Score Music Transcription

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/114478
Información del item - Informació de l'item - Item information
Título: An End-to-End Framework for Audio-to-Score Music Transcription
Autor/es: Román, Miguel A.
Director de la investigación: Pertusa, Antonio | Calvo-Zaragoza, Jorge
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Transcripción | Música | Redes neuronales | CRNN | CTC
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de creación: 2021
Fecha de publicación: 2021
Fecha de lectura: 20-ene-2021
Editor: Universidad de Alicante
Resumen: Esta tesis doctoral presenta un nuevo enfoque en el área de la transcripción musical automática (AMT), definiendo la tarea de Audio-to-Score (A2S), que realiza la transcripción musical de extremo a extremo gracias a la capacidad de modelado de problemas que nos ofrecen las redes neuronales profundas. Este enfoque va un paso más allá de los sistemas de transcripción tradicionales, que están basados en predecir notas musicales en el formato de tiempo-frecuencia llamado pianola o piano-roll en inglés. Las principales ventajas del enfoque propuesto frente a los métodos tradicionales son las siguientes: - La salida es una partitura válida de música que puede ser directamente interpretada por músicos o analizada por musicólogos. - La aproximación extremo a extremo evita que los errores de una etapa se propaguen a la siguiente. - No precisa de anotaciones de alineamiento temporal entre el audio de entrada y la partitura de salida, dado que se aprende por el modelo de forma implícita. - Mediante la aproximación extremo a extremo se aprende también un modelo de lenguaje musical que ayuda a reducir los errores de transcripción de manera global.
URI: http://hdl.handle.net/10045/114478
Idioma: eng
Tipo: info:eu-repo/semantics/doctoralThesis
Derechos: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Aparece en las colecciones:Tesis doctorales

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
Thumbnailtesis_miguel_angel_roman_garcia.pdf11,81 MBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons