Ayuda
Ir al contenido

Dialnet


Resumen de Accurate estimation of object motion in image sequences

Nelson Monzón López

  • El objetivo de esta tesis es contribuir en el cálculo de flujo óptico. Este es un tema importante dentro del campo de la visión por computador que persigue estimar de manera precisa el desplazamiento que experimentan los objetos presentes en una escena de vídeo. Su importancia es muy elevada ya que sirve como base para un amplio número de aplicaciones dentro del campo de la visión artificial, En este contexto, este trabajo de tesis tiene dos objetivos principales: • Estudiar la influencia que tiene la información temporal comparada con los métodos variacionales de tipo espacial • Analizar varias estrategias para la preservación de discontinuidades en el flujo y proponer alternativas para solventar este problema.

    A pesar de más de treinta años de estudios de flujo óptico, estos temas siguen sin estar del todo resueltos y, además, en el mundo actual es cada vez más relevante encontrar métodos numéricos que puedan emular de manera automática la habilidad humana de interpretar escenas en movimiento a partir de secuencias de imágenes. Por este motivo, consideramos relevantes las propuestas expuestas en este trabajo. Tras un exhaustivo análisis del estado del arte y los distintos capítulos hemos obtenido las siguientes conclusiones.

    1. Tratamiento de la información temporal en métodos de flujo óptico.

    En el capítulo3 propusimos un método variacional que hace uso de coherencia temporal para encontrar campos de flujo más continuos. Este método combina una asunción no lineal de constancia en el flujo en el modelo de energía además de un esquema no lineal de regularización del flujo. La primera relaciona convenientemente los campos de flujo en diferentes instantes de tiempo mientras que la segunda produce flujos continuos en el tiempo. Este también incluye un operador robusto de difusión anisotrópica basado en la técnica de Nagel-Enkelmann y una técnica de flujo inverso que permite encontrar correspondencias en el tiempo. Denominamos a este método como TCOF. Hemos realizado pruebas en secuencias sintéticas y reales para poder comparar los resultados con su contrapartida temporal. Observamos que, cuando usamos secuencias reales, TCOF ofrece campos de flujo continuos en el tiempo y que el ruido se reduce respecto a la solución espacial. Esto es un comportamiento interesante y refleja que las propuestas de este capítulo encajan correctamente con los términos no lineales estándar de constancia del brillo y del gradiente. TCOF ofrece importantes mejoras, especialmente cuando el método se enfrenta a desplazamientos largos.

    2. Estrategias eficientes para tratar con el problema de preservación de discontinuidades.

    En el capítulo 4 realizamos un análisis exhaustivo del método de Brox et al. Este produce flujos continuos y robustos frente a outliers. Sin embargo, también crea formas redondeadas en los límites del flujo que no coinciden con los contornos de los objetos. Posteriormente, introdujimos el esquema espacial dentro de un esquema multicanal para evaluar los posibles beneficios. Concluimos que la mejora es evidente y que el coste computacional es razonable y está justificado sin embargo no mejora la preservación de discontinuidades. Esto ocurre porque la regularización depende del flujo y no se utiliza información de la propia imagen. Introducir una función decreciente en el término de suavizado puede ser una posible solución a este problema. Por esta razón, estudiamos varias técnicas orientadas a la preservación de discontinuidades en el capítulo 6. En particular, nos centramos en el uso de funciones decrecientes y tensores de difusión anisotrópicos.

    Observamos que esta estrategia ofrece precisión en los contornos del flujo pero, sino escogemos cuidadosamente los parámetros, aumentan considerablemente los errores en el resultado. Esto es porque un parámetro equivocado introduce inestabilidades en el flujo óptico. Además, detectamos que este problema ocurre en la gran mayoría de las secuencias y no es anecdótico. En este sentido, propusimos dos estrategias para solventar este problema: (i) Combinar la función decreciente con una pequeña constante que asegure siempre un mínimo de suavizado; (ii) Una aproximación automática que adapta la difusión dependiendo del histograma de gradientes de la imagen. Comparando su evolución del error con respecto al parámetro de discontinuidad vemos que reducen sensiblemente el problema de las inestabilidades y que ambas propuestas presentan un buen comportamiento en las discontinuidades del flujo. La primera propuesta es muy estable y ofrece soluciones muy competitivas. Sin embargo, creemos que la aproximación automática es mejor ya que normalmente consigue los mejores resultados sin intervención externa. En nuestra opinión, esta característica hace que la segunda propuesta pueda ser interesante para aplicaciones reales.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus