Ayuda
Ir al contenido

Dialnet


Resumen de Extracción de características Histograma de Gradientes Orientados HOG para la identificación de vehículos en imágenes usando Máquina de Soporte Vectorial SVM

Ricardo Alirio González Bustamante, Carolina Acevedo, Alexander Marroquín Ospina, Sandra Milena García, Paola Andrea Mateus Abaunza

  • Dentro de sus múltiples etapas, la visión por computador requiere el reconocimiento de objetos y su posterior clasificación. En este capítulo se evalúa el rendimiento de un clasificador basado en una Máquina de Soporte Vectorial SVM y características de Histograma de Gradientes Orientados HOG, se comparan los resultados al entrenar el clasificador con imágenes segmentadas y sin segmentar; de igual manera se confrontan los resultados para los Kernels: Lineal, Polinomial, Gaussiano y RBF. Todo el proceso de extracción de características, entrenamiento de la máquina de soporte y evaluación del modelo se realiza en Matlab. Para el entrenamiento y pruebas de la SVM se usa imágenes de uso libre para investigación recolectadas por el grupo de tratamiento de imágenes GTI de la Universidad Politécnica de Madrid, España, que tienen un tamaño de 64x64 pixeles y están divididas en dos clases: vehículos (muestra positiva) y no-vehículos (muestra negativa). De cada clase se extrae el 60% de las imágenes para el entrenamiento y el 40% para pruebas; luego se les extrae las características usando el histograma de gradiente orientado HOG, como parámetro de configuración se utiliza un tamaño de celda de HOG 8x8, suficiente para identificar visualmente el vehículo; las características extraídas son normalizadas en vectores y con ellos se realiza el entrenamiento de la máquina de soporte vectorial SVM. Para realizar las pruebas las imágenes se ingresan al modelo SVM entrenado anteriormente. Los resultados permiten concluir que, por sus características, el conjunto de datos de GTI de tamaño 64x64 no requiere proceso de segmentación. El clasificador entrenado con las imágenes sin segmentar presenta mejores resultados. El kernel polinomial mostró el mejor rendimiento con una precisión de 99.3%, exactitud del 94.6% y especificidad del 99.1% con imágenes no segmentadas.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus