Representación no-lineal de imágenes basada en el sistema visual humano y adaptada a la estadística de imágenes naturales

Roberto Valerio Cascajo

Ayuda

Representación no-lineal de imágenes basada en el sistema visual humano y adaptada a la estadística de imágenes naturales

Autores: Roberto Valerio Cascajo
Directores de la Tesis: Rafael Navarro Belsué (dir. tes.)
Lectura: En la Universidad Politécnica de Madrid ( España ) en 2004
Idioma: español
Tribunal Calificador de la Tesis: José Ignacio Ronda Prieto (presid.), Luis Salgado Álvarez de Sotomayor (secret.), Bart ter Haar Romeny (voc.), Nestor Omar Parga Carballeda (voc.), Javier de la Portilla Muelas Francisco (voc.)
Materias:
- Ciencias tecnológicas
  - Tecnología de los ordenadores
  - Tecnología de las telecomunicaciones
    - Televisión
Enlaces
- Tesis en acceso abierto en: Archivo Digital UPM
Resumen
- En esta tesis desarrollamos un esquema de representación de imágenes multipropósito inspirado en el tratamiento no-lineal de información en el sistema visual humano. Para ello partimos de los trabajos de Simoncelli y colaboradores que mostraron que las etapas primarias de este proceso, consistentes en una etapa de filtrado lineal multiescala (Gabor, wavelet, etc.) seguida por una normalización divisiva no-lineal, podrían dar lugar a respuestas neuronales estadísticamente independientes, lo cual es una propiedad muy deseable en una representación de imagen. Eltrabajo realizado ha consistido en un primer lugar en un análisis sistemático del modelo propuesto por estos autores, y una formulación rigurosa utilizando la información mutua (IM) como métrica de la dependencia estadística. Como resultado, hemos demostrado que las respuestas predichas por dicho modelo no son totalmente estadísticamente independientes entre sí, sino que, sorprendentemente, las salidas resultan ser independientes de casi todas las entradas. Aunque hemos visto que no es posible conseguir una independización completa entre respuestas vecinas, hemos encontrado que en la práctica la condición de mínimo de la IM resulta ser muy próxima a cero. Tras este análisis, hemos resuelto de forma aproximada el problema de optimizar los parámetros libres del modelo, esto es, calcular los valores que minimizan la dependencia estadística (IM) entre respuestas vecinas. Para ello se ha particularizado la expresión general para un modelo gaussiano, que hemos verificado previamente de forma empírica con un conjunto de imágenes naturales. El esquema de representación de imágenes resultante es extraordinariamente robusto y flexible, por lo que admite diversas modificaciones subóptimas que mejoran alguna de sus características para aplicaciones que lo requieran. Todo ello ha quedado patente de forma empírica a través de las correspondientes implementaciones y resultados numéricos. Una vez estudiada e implementada la normalización divisiva, una de las aportaciones clave ha sido resolver el problema de la inversión de la transformación no-lineal. Para ello se ha propuesto e implementado un esquema directamente invertible, que puede obtenerse relajando ligeramente la condición de independencia estadística impuesta inicialmente. Al quedar resuelta la invertibilidad, el esquema de representación ya puede considerarse multipropósito, con claras ventajas dadas su mayor relevancia y compatibilidad perceptual y la independencia estadística entre muestras vecinas. Nosotros nos hemos centrado en dos aplicaciones concretas: (1) desarrollo de una métrica perceptual de la calidad de imagen y (2) inclusión de la etapa no-lineal de un codec JPEG 2000 para mejorar la calidad visual de la reconstrucción.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: