El reconocimiento acústico de múltiples eventos es un problema interesante en audición por computación que generaliza clásico problema de clasificación de habla/no habla o habla/música. Típicamente la clasificación se realiza utilizando modelos ocultos de Markov (HMM) o máquinas de vectores soporte (SVM) considerando conjuntos tradicionales de características basados en coeficientes cepstrales de Mel (MFCCs) y sus derivadas temporales.
Sin embargo, mientras estas características se emplean de forma rutinaria por muchos sistemas, todavía no se entiende cuál es su importancia en la tarea de clasificación. Este trabajo presenta un estudio preliminar de la sensibilidad de estas características bajo un marco común de SVM, con el objetivo de proporcionar una visión a más bajo nivel de la representación de los eventos acústicos para la tarea de clasificación.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados