Modelos de variable latente en el contexto del análisis e inferencia geoestadística

Álvaro Francisco Egaña Viedma

Ayuda

Modelos de variable latente en el contexto del análisis e inferencia geoestadística

Autores: Álvaro Francisco Egaña Viedma
Directores de la Tesis: Juan Francisco Sánchez Pérez (dir. tes.), Mohammad Ali Maleki Tehrani (codir. tes.)
Lectura: En la Universidad Politécnica de Cartagena ( España ) en 2026
Idioma: español
Número de páginas: 137
Títulos paralelos:
- Latent variable models in the context of geostatistical analysis and inference
Tribunal Calificador de la Tesis: Francisco del Cerro Velázquez (presid.), Gonzalo García Ros (secret.), María Isabel Egea González (voc.)
Programa de doctorado: Programa de Doctorado en Tecnología y Modelización en Ingeniería Civil, Minera y Ambiental por la Universidad Politécnica de Cartagena
Materias:
- Matemáticas
  - Probabilidad
    - Procesos estocásticos
  - Estadística
    - Métodos de distribución libre y no paramétrica
    - Fundamentos de la inferencia estadística
Enlaces
- Tesis en acceso abierto en: Repositorio Digital de la UPCT
Resumen
- español
  Este trabajo de tesis aborda el problema fundamental de la inferencia con variables latentes en dominios de alta complejidad en cuanto a la interdependencia espacial, como la geoestadística y el análisis de imágenes hiperespectrales. A pesar de los avances actuales, los métodos tradicionales se enfrentan a desafíos significativos, incluyendo la dependencia de supuestos rígidos, la falta de escalabilidad y la incapacidad de capturar la heterogeneidad y las discontinuidades inherentes a los datos del mundo real.
  
  La tesis postula que estas limitaciones pueden superarse al reformular la inferencia espacial, trasladando los supuestos fuertes (tanto estadísticos como topológicos, tales como la adopción de distribuciones específicas, ergodicidad, estacionaridad o continuidad en el espacio) desde el dominio observado, donde rara vez se cumplen en la práctica, hacia una variable latente de organización espacial. En este nuevo marco, tales supuestos dejan de ser exigencias restrictivas sobre los datos y pasan a constituir propiedades asumidas por construcción en el dominio latente. La variable latente puede entenderse entonces como la estructura subyacente que explica las dependencias espaciales, ya sea mediante la imposición de regularidades espaciales explícitas, o bien a través de la agrupación en subpoblaciones que, aun sin una geometría espacial directa, inducen patrones heterogéneos en el campo observado. De este modo, la variable latente opera como un estadístico suficiente que concentra las regularidades del espacio, permitiendo desplazar la inferencia desde los datos hacia la estructura oculta que los organiza, y abriendo la puerta a modelos más flexibles y robustos que trascienden las limitaciones de los enfoques clásicos.
  
  En el ámbito de la geoestadística, la tesis introduce el Adaptive Ensemble Spatial Interpolation (ESI), concebido como un recorrido empírico que evidencia cómo la incorporación de una variable latente, formulada dentro de un modelo generativo bayesiano que concentra la estructura espacial en una partición estocástica del espacio, posibilita obtener estimaciones con un desempeño comparable o incluso superior al de la geoestadística tradicional, particularmente en escenarios de datos escasos.
  
  En este planteamiento, la coherencia espacial no se impone mediante supuestos rígidos ni a través del modelado explícito de variogramas, sino que surge de manera natural de la propia construcción del modelo. A partir de esta perspectiva práctica, la tesis avanza hacia un marco teórico más riguroso, que es la Spatial Distributional Estimation (SDE), donde se demuestra que la variable latente no solo organiza la información espacial, sino que también induce la emergencia de una estructura de dependencias oculta, formalizada como una cópula latente. Esta cópula, en tanto estimador consistente de la dependencia real del campo aleatorio, garantiza que el método mantenga solidez probabilística a la vez que flexibilidad inferencial.
  
  Para la clasificación de imágenes hiperespectrales, se propone la Stochastic Image Sprectroscopy (SIS). Mientras los métodos tradicionales dependen de la extracción de firmas espectrales, a menudo difíciles de obtener debido al ruido y a las condiciones de campo, el modelo SIS se basa en una capa oculta (variable latente), sin estructura, que agrupa píxeles espacialmente en identidades poblacionales significativas. Esta estrategia generativa permite la discriminación de fenómenos complejos a un nivel de abstracción superior, siendo particularmente robusta en ausencia de etiquetas o con anotaciones ruidosas.
  
  Las contribuciones de esta tesis son la formulación de un marco robusto que dota de garantías teóricas a los algoritmos basados en variables latentes de organización espacial, la creación de métodos reproducibles y escalables, y la demostración de su efectividad en diversos escenarios de aplicación, ofreciendo una nueva filosofía para la inferencia probabilística en ciencia de datos.
- English
  This thesis addresses the fundamental problem of inference with latent variables in domains of high complexity in terms of spatial interdependence, such as geostatistics and hyperspectral image analysis. Despite current advances, traditional methods face significant challenges, including reliance on rigid assumptions, lack of scalability, and inability to capture the heterogeneity and discontinuities inherent in real-world data. The thesis posits that these limitations can be overcome by reformulating spatial inference, shifting the strongest assumptions (both statistical and topological, such as the adoption of specific distributions, ergodicity, stationarity, or continuity in space) from the observed domain, where they are rarely satisfied in practice, to a latent spatial organisation variable. In this new framework, such assumptions cease to be restrictive requirements on the data and become properties assumed by construction in the latent domain. The latent variable can then be understood as the underlying structure that explains spatial dependencies, either by imposing explicit spatial regularities or by grouping into subpopulations that, even without direct spatial geometry, induce heterogeneous patterns in the observed field. In this way, the latent variable operates as a sufficient statistic that concentrates the regularities of space, allowing the inference to be shifted from the data to the hidden structure that organises them, and opening the door to more flexible and robust models that transcend the limitations of classical approaches. In the field of geostatistics, the thesis introduces Adaptive Ensemble Spatial Interpolation (ESI), conceived as an empirical journey that demonstrates how the incorporation of a latent variable, formulated within a Bayesian generative model that concentrates the spatial structure in a stochastic partition of space, makes it possible to obtain estimates with performance comparable to or even superior to that of traditional geostatistics, particularly in scenarios with scarce data. In this approach, spatial coherence is not imposed by rigid assumptions or through explicit variogram modelling, but arises naturally from the construction of the model itself. From this practical perspective, the thesis moves towards a more rigorous theoretical framework, namely Spatial Distributional Estimation (SDE), where it is shown that the latent variable not only organises spatial information, but also induces the emergence of a hidden dependency structure, formalised as a latent copula. This copula, as a consistent estimator of the actual dependence of the random field, ensures that the method maintains probabilistic robustness while offering inferential flexibility. For the classification of hyperspectral images, Stochastic Image Spectroscopy (SIS) is proposed. While traditional methods rely on the extraction of spectral signatures, which are often difficult to obtain due to noise and field conditions, the SIS model is based on a hidden layer (latent variable), without structure, which spatially groups pixels into significant population identities. This generative strategy allows the discrimination of complex phenomena at a higher level of abstraction, being particularly robust in the absence of labels or with noisy annotations. The contributions of this thesis are the formulation of a robust framework that provides theoretical guarantees for algorithms based on latent variables of spatial organisation, the creation of reproducible and scalable methods, and the demonstration of their effectiveness in various application scenarios, offering a new philosophy for probabilistic inference in data science.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: