Algoritmos y técnicas de aprendizaje profundo aplicados a la extracción de información sobre documentos manuscritos

Victoria Ruiz Parrado

Ayuda

Algoritmos y técnicas de aprendizaje profundo aplicados a la extracción de información sobre documentos manuscritos

Autores: Victoria Ruiz Parrado
Directores de la Tesis: Jose Francisco Velez Serrano (dir. tes.)
Lectura: En la Universidad Rey Juan Carlos ( España ) en 2021
Idioma: español
Tribunal Calificador de la Tesis: Luis Baumela Molina (presid.), Enrique Cabello Pardos (secret.), Miguel Ángel Ferrer Ballester (voc.)
Programa de doctorado: Programa de Doctorado en Tecnologías de la Información y las Comunicaciones por la Universidad Rey Juan Carlos
Materias:
- Matemáticas
  - Ciencia de los ordenadores
    - Inteligencia artificial
Enlaces
- Tesis en acceso abierto en: TESEO
Resumen
- El análisis automático de documentos tiene muchas aplicaciones hoy en día. Algunas de las más importantes se basan en el reconocimiento de texto y la verificación de firmas.
  
  Para construir sistemas que realicen dichas tareas, unas de las metodologías más actuales y con mejores resultados son las que se enmarcan en el campo del deep learning o aprendizaje profundo. En concreto, las redes neuronales con capas convolucionales han tenido mucho éxito en la extracción de características en imágenes. Del mismo modo, las redes neuronales recurrentes han obtenido buenos resultados en el procesamiento de secuencias de patrones relacionados.
  
  En esta Tesis, se ha estudiado la verificación de firmas y el reconocimiento de texto manuscrito a partir de técnicas de aprendizaje profundo. Como resultado, se han creado tres sistemas: uno de reconocimiento de números de longitud variable, otro de reconocimiento de caracteres y otro de verificación de firmas independiente del escritor para falsificaciones aleatorias. En concreto, el primer sistema se compone de una red neuronal convolucional que extrae características, una red neuronal recurrente que procesa la secuencia de subimágenes obtenidas mediante una ventana deslizante, y un algoritmo metaheurístico que procesa la secuencia de salida para obtener el número contenido en la imagen. El segundo sistema forma parte de la primera fase de un sistema de reconocimiento de palabras sin secuenciación de datos. Dicho sistema trata de encontrar todos los caracteres de una imagen sin importar el orden. En este caso, la arquitectura utilizada es una red neuronal convolucional. Por último, el sistema de verificación de firmas se basa en una red neuronal siamesa cuya estructura se compone de capas convolucionales y capas inception. Para entrenar la red siamesa se se creó un algoritmo que generaba distintos tipos de firmas sintéticas, entre las que se encuentran unas de tipo pseudo-sintético desarrolladas en esta Tesis.
  
  Los experimentos se han centrado en imágenes off-line de números y palabras del alfabeto latino y de firmas occidentales. Para ello se han utilizado bases de datos públicas (MNIST, IAM, GDPSSynthetic, CEDAR, MCYT75) y una privada (GAVAB). Los resultados obtenidos en los sistemas de reconocimiento de números y en la verificación de firmas son comparables con los del estado del arte. Los resultados obtenidos en el reconocimiento de caracteres deberían mejorarse para pasar a la siguiente fase en el reconocimiento de palabras.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: