Ayuda
Ir al contenido

Dialnet


A probabilistic integrated object recognition and tracking framework for video sequences

  • Autores: Nicolas Amezquita Gomez
  • Directores de la Tesis: René Alquézar Mancho (dir. tes.), Francesc Serratosa Casanelles (dir. tes.)
  • Lectura: En la Universitat Rovira i Virgili ( España ) en 2009
  • Idioma: inglés
  • Tribunal Calificador de la Tesis: Alberto Sanfeliu Cortés (presid.), Francesc Moreno Noguer (secret.), Jordi Vitrià Marca (voc.), Nicolás Pérez de la Blanca Capilla (voc.), José M. Sanchiz Martí (voc.)
  • Materias:
  • Enlaces
    • Tesis en acceso abierto en: TDX
  • Resumen
    • español

      El reconocimiento y seguimiento de múltiples objetos en secuencias de vídeo es uno de los principales desafios en visión por ordenador que actualmente merece mucha atención de los investigadores, Casi todos los enfoques reportados son muy dependientes de la aplicación y hay carencia de una metodología general para el reconocimiento y seguimiento dinámico de objetos, que pueda ser instanciada en casos particulares. En esta tesi, el trabajo esta orientado hacia la definición y desarrollo de tal metodología, la cual entegra reconocimiento y seguimiento de objetos desde una presepectiva general usando un marco probalilístico de trabajo llamado PIORT (Probabilistic Integrated Object Recognition and Tracking). Este incluye algunos módulos para los que se puede aplicar una variedad de técnicas y métodos. Algunos de ellos son bien conocidos, pero otros métodos han sido diseñados, implementados y probados durante el desarrollo de esta tesis.%&/El primer paso en el marco de trabajo propuesto en un módulo estático de reconocimiento que provee probabilidades de clase para cada pixel de la imagen desde un conjunto de características locales. Estas probabilidades son actualizadas dinámicamente y suministradas en un modulo decisión de seguimiento capaz de manejar oclusions parciales o totales. Se presenta dos métodos específicos usando características de color RGB pero diferentes en la implementación del clasificador: uno es un metodo Bayesiano basado en la máxima verosimilitud y el otro método está basado en una red neuronal. Los resultados experimentales obtenidos han mostrado que, por una parte, el enfoque basado en la red neuronal funcional similarmente y algunas veces mejor que el enfoque bayesiano cuando son integrados dentro del marco probabilistico de seguimiento. Por otra parte, nuestro metodo PIORT ha alcanzado mejores resultados comparando con otros métodos de seguimiento publicados. Todos estos métodos han sido probados experimentalmente en varias secuencias de vídeo tomadas con cámaras fijas y moviles incluyendo oclusiones pariales y totales del objeto a seguir, en ambientes interiores y eteriores, en diferentes tareas y niveles de complejidad. Esto he permitido evaluar tanto la metodologia general como los métodos alternativos que componen sus módulos.

    • English

      Recognition and tracking of multiple objects in video sequences is one of the main challenges in computer vision that currently deserves a lot of attention from researchers. Almost all the reported approaches are very application-dependent and there is a lack of a general methodology for dynamic object recognition and tracking that can be instantiated in particular cases. In this thesis, the work is oriented towards the definition and development of such a methodology which integrates object recognition and tracking from a general perspective using a probabilistic framework called PIORT (probabilistic integrated object recognition and tracking framework). It include some modules for which a variety of techniques and methods can be applied. Some of them are well-known but other methods have been designed, implemented and tested during the development of this thesis. The first step in the proposed framework is a static recognition module that provides class probabilities for each pixel of the image from a set of local features. These probabilities are updated dynamically and supplied to a tracking decision module capable of handling full and partial occlusions. The two specific methods presented use RGB colour features and differ in the classifier implemented: one is a Bayesian method based on maximum likelihood and the other one is based on a neural network. The experimental results obtained have shown that, on one hand, the neural net based approach performs similarly and sometimes better than the Bayesian approach when they are integrated within the tracking framework. And on the other hand, our PIORT methods have achieved better results when compared to other published tracking methods. All these methods have been tested experimentally in several test video sequences taken with still and moving cameras and including full and partial occlusions of the tracked object in indoor and outdoor scenarios in a variety of cases with different levels of task complexity. This allowed the evaluation of the general methodology and the alternative methods that compose these modules. A Probabilistic Integrated Object Recognition and Tracking Framework for Video Sequences


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno