Ayuda
Ir al contenido

Dialnet


Clasificación de sonidos ambientales usando la transformada wavelet continua y redes neuronales convolucionales

    1. [1] SEPI, Mexico
  • Localización: Información tecnológica, ISSN-e 0718-0764, ISSN 0716-8756, Vol. 32, Nº. 2 (Abril), 2021, págs. 61-78
  • Idioma: español
  • Títulos paralelos:
    • Environmental sound recognition using continuous wavelet transform and convolutional neural networks
  • Enlaces
  • Resumen
    • español

      Este artículo propone un esquema en el cual inicialmente se obtiene una representación tiempo-frecuencia usando la transformada wavelet continua (CWT), la cual tiene una resolución logarítmica en el plano de la frecuencia similar a la del sistema auditivo humano. El desarrollo de este tipo de sistemas para la clasificación de sonidos ambientales ha sido un tópico de amplia investigación debido a sus aplicaciones en diversos campos de la ciencia e ingeniería. Al igual que otros esquemas de clasificación, estos se basan en la extracción de parámetros característicos, los cuales se insertan en la etapa de clasificación. La CWT se inserta en una red neuronal profunda, para llevar a cabo el proceso de clasificación. Los resultados obtenidos, usando bases de datos de sonidos ambientales tales como, ESC-50, TUT Acoustic Scene y SONAM-50, demuestran que el esquema propuesto proporciona un funcionamiento superior al de otros esquemas previamente propuestos.

    • English

      This paper proposes a scheme in which a time-frequency representation is first obtained using the continuous wavelet transform (CWT), which has a logarithmic resolution in the frequency domain, like that of the human ear. The development of these environmental sound classification systems is a topic of extensive research due to its application in several fields of science and engineering. Like other classification schemes, they are based on the extraction of specific parameters that are inserted in the classification stage. The CWT is then inserted into a deep learning neural network to carry out the classification task. The evaluation results obtained using several databases such as ESC-50, TUT Acoustic Scene, and SONAM-50 show that the proposed scheme provides a classification performance that is better than that provided by other previously proposed schemes.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno