Resumen de Aprendizaje evolutivo multiobjetivo de sistemas difusos jerárquicos y su aplicación en astrofísica

Alicia D. Benítez

  • Introducción:

    Un espacio multidimensional constituye el resultado de un complejo proceso de abstracción e idealización para generalizar el concepto espacio. Su dificultad está íntimamente relacionada con el número de variables del mismo. Un tipo de problema que se adecúa a estas características es la multidimensionalidad en espacios continuos, denominado problema de regresión.

    Un problema de regresión cuenta con un conjunto de variables de tipo real que podría ser resuelto mediante modelos matemáticos. Este tipo de modelizado puede proporcionar precisión en su solución, pero no existe cabida para la interpretación de los datos. Si lo que pretendemos es generar un conocimiento de esa información, debemos plantearnos usar metodologías basadas en la Inteligencia Artificial.

    Una forma de modelizado de problemas de regresión que tiene en cuenta tanto la precisión de la solución como su interpretación es el sistema basado en reglas difusas.

    La resolución de estos problemas suele ser satisfactoria cuando el número de variables del problema es pequeño. Si el problema es complejo, y con esto nos referimos específicamente a que esté formado por un número de variables considerable, se produce:

    1) Un incremento exponencial del número de reglas. Cuanto mayor sea el número de reglas del sistema, más difícil será su interpretación.

    2) Un aumento del tiempo de computación, de forma que a mayor número de reglas, mayor tiempo de computación del modelo.

    En este caso, debemos hacer uso de otros métodos como los sistemas difusos jerárquicos. Son sistemas estructurados en capas, donde cada capa está formada por uno o varios sistemas difusos (o módulos) que se encuentran enlazados entre sí, donde cada módulo puede recibir como entrada tanto variables del problema como la salida del módulo de la capa anterior.

    Como ya sabemos, la precisión y la interpretabilidad son conceptos inversamente proporcionales. Los algoritmos evolutivos pueden ayudarnos a solventar este problema ya que se puede enfocar como una tarea de optimización.

    Por tanto, parece interesante el aprendizaje de la estructura jerárquica de sistemas basados en reglas difusas mediante un algoritmo multi-objetivo que garantice una buena interpretabilidad, mejorando o manteniendo la precisión del sistema.

    Desarrollo teórico:

    El objetivo de este trabajo es el diseño e implementación de un conjunto de métodos de aprendizaje que permitan obtener modelizados jerárquicos difusos que aseguren una buena interpretabilidad del sistema, mejorando o igualando la precisión con respecto a un modelizado difuso convencional. Este objetivo general se descompone en los siguientes objetivos parciales:

    1) Análisis del estado del arte en el campo del Aprendizaje Automático. Realizaremos un análisis profundo de las propuestas existentes en la actualidad. Debido a que este campo es amplio, nos ceñiremos a las técnicas que usamos en nuestro trabajo: modelizado mediante sistemas basados en reglas difusas, sistemas difusos jerárquicos y aprendizaje evolutivo.

    2) Mejora en la interpretabilidad mediante Sistemas Difusos Jerárquicos. Propondremos una serie de métodos basados en el aprendizaje de estructuras jerárquicas de distintos tipos (serie, paralelo e híbrido). La principal virtud de cada uno de los métodos que presentamos en este trabajo es la reducción de la complejidad del sistema cuando se resuelven problemas con un número elevado de variables intentando que la precisión de cada uno de los modelos se mantenga o, incluso, mejore. Además, realizaremos un análisis exhaustivo de cada una de las tres propuestas para comprobar su capacidad frente a distintos conjuntos de datos.

    3) Realizar una aplicación a problemas reales. Nos resulta interesante ver la aplicabilidad en problemas reales. Para ello, realizamos una experimentación con datos fotométricos astrofísicos referentes a conjuntos de datos reales de espectros de galaxias para determinar algunas de sus propiedades físicas.


    En este trabajo presentamos tres métodos de aprendizaje de sistemas jerárquicos, serie, paralelo e híbrido, para problemas de regresión de alta dimensionalidad con el objetivo de obtener soluciones equilibradas en precisión e interpretabilidad. Con una experimentación y un análisis exhaustivo de estas técnicas de modelizado utilizando distintos conjuntos de datos con diferente dimensionalidad, podemos deducir que el comportamiento de cada una de las tres propuestas algorítmicas de este trabajo reducen el número de reglas del sistema en términos de interpretabilidad. Además, el número de variables por regla es menor, lo que hace que este tipo de sistemas se caracterice por su simplicidad. Con respecto a la precisión, está claro que depende principalmente de la topología.

    La topología en paralelo se caracteriza por no hacer uso de variables exógenas en las capas intermedias del sistema, sin importar el número de módulos existentes en cada capa. Como venimos comentando, la inferencia de cada módulo genera un error que se incrementa a medida que transcurre la información por la jerarquía hasta llegar al módulo de salida. El error acarreado depende directamente del número módulos, esto es, cuanto mayor sea número de módulos, el sistema genera un mayor error en la predicción. Esto repercute negativamente en la precisión del sistema. Este comportamiento se atenúa en la topología híbrida.

    La topología híbrida, como se puede apreciar en su propia morfología, hace uso de variables exógenas que aportan información sin ruido al sistema a nivel de capa. De esta forma, el propio sistema mitiga la propagación del error a lo largo de las capas, aunque el número de módulos de la jerarquía sea elevado. Un problema importante que presenta este tipo de jerarquía es el incremento del espacio de búsqueda de soluciones. Un modelizado híbrido contempla topología serie, paralela y ambos simultáneamente en una misma estructura, lo que incrementa en tres veces el espacio de búsqueda y hace que encontrar una solución buena sea una tarea ardua.

    Por otro lado, la topología en serie es una estructura más simple, ya que por cada capa solo genera un módulo. Por ello, la generación de errores por módulo es menor y por supuesto, la propagación del mismo es menor. A ésto se une la cualidad de que en cada capa puede existir una variable exógena, es decir, puede contar con la presencia de datos sin ruido que ayudan a mitigar la generación y propagación del error a través de las capas, lo que repercute positivamente en la precisión final del sistema. Dado el buen comportamiento que presenta esta topología frente a las otras dos, hemos podido comprobar que un ajuste en las funciones de pertenencia hace que las jerarquías en serie obtenidas afinen aún más en la precisión y pueda ser comparable a otros modelos de la literatura que utilizan mecanismos de ajuste en el modelado difuso.

    Resumiendo, un sistema difuso jerárquico puede ser una buena apuesta en problemas de multidimensionalidad ya que nos proporciona simplicidad e interpretabilidad, pero si no queremos perder precisión, hemos de ser cautos en su diseño atendiendo tanto en el número de módulos como en la distribución del tipo de variables.


