Ayuda
Ir al contenido

Dialnet


Representación no-lineal de imágenes basada en el sistema visual humano y adaptada a la estadística de imágenes naturales

  • Autores: Roberto Valerio Cascajo
  • Directores de la Tesis: Rafael Navarro Belsué (dir. tes.)
  • Lectura: En la Universidad Politécnica de Madrid ( España ) en 2004
  • Idioma: español
  • Tribunal Calificador de la Tesis: José Ignacio Ronda Prieto (presid.), Luis Salgado Álvarez de Sotomayor (secret.), Bart ter Haar Romeny (voc.), Nestor Omar Parga Carballeda (voc.), Javier de la Portilla Muelas Francisco (voc.)
  • Materias:
  • Enlaces
  • Resumen
    • En esta tesis desarrollamos un esquema de representación de imágenes multipropósito inspirado en el tratamiento no-lineal de información en el sistema visual humano. Para ello partimos de los trabajos de Simoncelli y colaboradores que mostraron que las etapas primarias de este proceso, consistentes en una etapa de filtrado lineal multiescala (Gabor, wavelet, etc.) seguida por una normalización divisiva no-lineal, podrían dar lugar a respuestas neuronales estadísticamente independientes, lo cual es una propiedad muy deseable en una representación de imagen. Eltrabajo realizado ha consistido en un primer lugar en un análisis sistemático del modelo propuesto por estos autores, y una formulación rigurosa utilizando la información mutua (IM) como métrica de la dependencia estadística. Como resultado, hemos demostrado que las respuestas predichas por dicho modelo no son totalmente estadísticamente independientes entre sí, sino que, sorprendentemente, las salidas resultan ser independientes de casi todas las entradas. Aunque hemos visto que no es posible conseguir una independización completa entre respuestas vecinas, hemos encontrado que en la práctica la condición de mínimo de la IM resulta ser muy próxima a cero. Tras este análisis, hemos resuelto de forma aproximada el problema de optimizar los parámetros libres del modelo, esto es, calcular los valores que minimizan la dependencia estadística (IM) entre respuestas vecinas. Para ello se ha particularizado la expresión general para un modelo gaussiano, que hemos verificado previamente de forma empírica con un conjunto de imágenes naturales. El esquema de representación de imágenes resultante es extraordinariamente robusto y flexible, por lo que admite diversas modificaciones subóptimas que mejoran alguna de sus características para aplicaciones que lo requieran. Todo ello ha quedado patente de forma empírica a través de las correspondientes implementaciones y resultados numéricos. Una vez estudiada e implementada la normalización divisiva, una de las aportaciones clave ha sido resolver el problema de la inversión de la transformación no-lineal. Para ello se ha propuesto e implementado un esquema directamente invertible, que puede obtenerse relajando ligeramente la condición de independencia estadística impuesta inicialmente. Al quedar resuelta la invertibilidad, el esquema de representación ya puede considerarse multipropósito, con claras ventajas dadas su mayor relevancia y compatibilidad perceptual y la independencia estadística entre muestras vecinas. Nosotros nos hemos centrado en dos aplicaciones concretas: (1) desarrollo de una métrica perceptual de la calidad de imagen y (2) inclusión de la etapa no-lineal de un codec JPEG 2000 para mejorar la calidad visual de la reconstrucción.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno