Durante los últimos años se han propuesto soluciones que permiten una interacción hombre-máquina más natural e intuitiva gracias a la aparición de nuevos dispositivos que complementan o sustituyen a los teclados y ratones. Tales dispositivos basan la interacción en el uso de distintas partes del cuerpo humano para que ésta sea lo más parecida a una comunicación entre humanos, haciendo uso, por ejemplo, de las manos o de la voz. Dentro de los trabajos que utilizan gestos de las manos, los hay que proponen el uso de información visual adquirida por cámaras para el reconocimiento gestual. Estas soluciones introducen una ventaja frente a sistemas basados en sensores inerciales, al ser sistemas no intrusivos para el usuario. También es de gran importancia contar con nuevos sistemas que autentifiquen el acceso a estas interfaces, sustituyendo las claves de paso introducidas por teclado. Para ello, se puede utilizar el reconocimiento por huella dactilar, reconocimiento por iris, o el reconocimiento facial. El aumento del número de cámaras, tanto en entornos de vigilancia como embebidas en los propios dispositivos (por ejemplo, teléfonos móviles, tabletas, TV, etc.), ha despertado un gran interés en los sistemas de reconocimiento facial, ya que permiten la identificación del usuario sin necesidad de sensores adicionales.
A lo largo de esta tesis se presentan diversas soluciones con el objetivo de resolver tanto el reconocimiento facial como el reconocimiento de gestos de las manos, ambos basados en el uso de diversas fuentes de información visual. En cuanto a los sistemas de reconocimiento facial, se presentan tres sistemas cuya principal aportación consiste en el diseño de descriptores especialmente adaptados a la extracción de características relevantes de la cara de las personas usando imágenes de profundidad de alta resolución. Las soluciones presentadas permiten el reconocimiento facial desde diferentes perspectivas de la cara, a diferencia de la mayoría de sistemas existentes que solo admiten caras frontales. Además, el uso de imágenes de profundidad dificulta la suplantación de la identidad, siendo necesario un modelo tridimensional de la cara de la persona para su hipotética suplantación. Con el objetivo de validar los sistemas implementados, se han elaborado dos bases de datos, disponibles públicamente, que son pioneras en el campo del reconocimiento facial con imágenes de profundidad de alta resolución.
En cuanto al reconocimiento de gestos, se presentan diversas soluciones para gestos estáticos y gestos dinámicos. Similarmente a los sistemas previos de reconocimiento facial, se han propuesto nuevos descriptores altamente discriminativos diseñados para información de profundidad. Además, se han aplicado técnicas de reducción de la dimensionalidad para reducir sus requisitos de memoria y favorecer el funcionamiento en tiempo real. Dichos sistemas se han integrado en un demostrador de la empresa Airbus como parte del proyecto SAVIER. Este demostrador implementa un interfaz hombre-máquina basado en gestos para una estación de control de tierra de vehículos aéreos no tripulados. Para evaluar el rendimiento del sistema se han creado nuevas bases de datos, disponibles públicamente, compuestas por información de profundidad e infrarroja.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados