Ayuda
Ir al contenido

Dialnet


Resumen de People detection, tracking and re-identification for smart video surveillance

Jorge García Castaño

  • español

    Esta tesis aborda el problema del seguimiento de múltiples personas en una red de cámaras con campos de vista no solapados por medio de diferentes técnicas de visión computacional. El seguimiento de múltiples personas desempeña un papel muy importante en los sistemas inteligentes de videovigilancia, los cuales son actualmente uno de los campos de investigación más activos en visión computacional. Los datos de vídeo capturados pueden ser muy útiles para múltiples aplicaciones, pudiendo cubrir desde la extracción del comportamiento de una persona en un acto social hasta la activación de una alarma para prevenir situaciones de peligro. Sin embargo, frecuentemente los datos de vídeo son infrautilizados debido a la cantidad de información proporcionada por una red de cámaras, la cual debe ser procesada manualmente. Enfocando nuestro trabajo hacia este problema, se han generado diferentes contribuciones para hacer más factible la supervisión al operario con tareas de videovigilancia analizando el movimiento de personas por el entorno automáticamente. En primer término, se analiza el problema de seguimiento de personas dentro de un único campo de visión de donde se obtiene la estimación de la posición de la persona y su trayectoria en dicha imagen. Para ello, se proponen dos nuevos modelos de descripción de una persona basados en su silueta, tamaño, movimiento y altura. Esto permitirá poder detectar múltiples personas bajo distintas configuraciones de la cámara. Tras ello, el problema de seguimiento de personas se extiende a una red de cámaras con campos de visión no solapados cuyo objetivo principal es proporcionar un identificador único por persona para su reidentificación. Así, se propone el uso de un novedoso método para realizar el proceso de reidentificación de forma gradual e iterativa teniendo en cuenta la diferencia en orientación. Se define un espacio de transformación de características similares y no-similares entre parejas de personas utilizado para entrenar un clasificador basado en máquinas de vector soporte (SVM). A pesar de los esfuerzos realizados en las propuestas de reidentificación, los resultados obtenidos no son adecuados para alcanzar el objetivo de obtener una única identidad para cada persona que aparece en la red de cámaras. Uno de los mayores problemas es debido a personas con apariencia similar. Por ello, se aborda el estudio de ambigüedades visuales por medio de técnicas de post-ranking. Así, se propone un módulo de análisis basado en la información de contexto discriminante para realizar la optimización del ranking inicial proporcionado por cualquier método de base de reidentificación. Se ha definido nueva información de contexto y contenido para ser utilizada en el análisis de características discriminantes, para así eliminar la información común de un conjunto de vectores de características con apariencia similar. Finalmente, resultados experimentales para cada método, sobre diferentes conjuntos de datos capturados es escenarios reales, y comparaciones con métodos del estado del arte son presentados.

  • English

    This thesis addresses the problem of people multi-tracking in a non-overlapping camera network by means of different computer vision techniques. People multi-tracking plays a very important role in smart video surveillance systems, which currently are one of the most active research fields in computer vision. The collected video data can be very useful for multiple applications, covering from the extraction of person behavior in a social environment to the activation of an alarm for preventing dangerous events. However, this video data is frequently underused due to the amount of information provided by the camera network, which must be manually processes. Looking towards this problem, different contributions are introduced to make more feasible monitoring video surveillance tasks for the operator, automatically analyzing the people movement in an environment. First, we focus on the people tracking problem in a single field of view where the estimation of the person position and his/her trajectory in the image are achieved. To do this, two novel description models are proposed based on silhouette, size, motion and height, allowing the person detection over different camera configurations. Afterward, the person tracking problem is extended to the non-overlapping camera network case whose main objective is to provide a single identifier for each person. Regarding to this, a new method is proposed to carry out the re-identification process in a gradual and iterative fashion attending to the orientation distance. A pairwise feature dissimilarity space is introduced to train a support vector machine classifier (SVM). In the post ranking person re-identification field, a discriminant context information analysis module is proposed to optimize the initial ranking computed using any baseline models. Novel content and context information are defined to be used in a discriminant feature analysis in order to remove the common information from a set of feature vectors with similar appearance. Finally, we present experimental results for each method over datasets recorded in real scenarios and comparisons with state-of-the-art methods.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus