Ayuda
Ir al contenido

Dialnet


Resumen de Diagnóstico automático de tuberculosis: una decisión ante incertidumbre

Ricardo Santiago Mozos

  • En un contraste de hipótesis no siempre es posible definir las hipótesis con precisión, o bien, no es posible relacionarlas directamente con los datos disponibles. Esta tesis considera el desarrollo de herramientas estadísticas para el contraste de hipótesis definidas con incertidumbre y su aplicación al diagnóstico automático de tuberculosis. Se proponen métodos para medir las prestaciones alcanzables a partir de los datos de entrenamiento y también se presentan test que consideran la incertidumbre y moderan las probabilidades con las que se decide. Por otro lado, se considera el equivalente en aprendizaje estadístico de los cocientes de verosimilitud en aquellas situaciones en las que no se conoce la distribución de los datos y una sola muestra de test no es suficiente para tomar una decisión con las prestaciones requeridas. La tesis arranca con una introducción a la tuberculosis, por qué es un problema de salud y cuáles son las técnicas para su diagnóstico, centrándose en las propuestas automáticas basadas en el análisis de imágenes del esputo y sus principales inconvenientes. A continuación realiza una breve revisión de la teoría estadística de la decisión, que incluye las metodologías paramétrica y no paramétrica del contraste de hipótesis y los contrastes secuenciales; la determinación de regiones de confianza y la máquina de vectores soporte. Luego, introduce el contraste de hipótesis inciertas y propone métodos para dicho contraste desde el punto de vista frecuentista y bayesiano. Asimismo, formula cotas superiores de las probabilidades de error desde el punto de vista frecuentista y cotas superiores de la probabilidad a posteriori de cada hipótesis desde el punto de vista bayesiano. A continuación, considera el problema de clasificar un conjunto de muestras de la misma clase desde el punto de vista del aprendizaje estadístico. Propone un nuevo método que �extiende� los datos de entrenamiento de forma que el clasificador entrenado mediante dichos datos �extendidos� proporciona una salida única al conjunto de muestras. La bondad del método se comprueba desde un punto de vista empírico mediante varias bases de datos públicas y su complejidad es examinada cuando se emplea la máquina de vectores soporte como clasificador. Finalmente, propone un sistema automático para el diagnóstico de pacientes de tuberculosis capaz de procesar imágenes al ritmo que se capturan del microscopio. Este sistema examina imágenes de esputo vistas al microscopio en busca del bacilo de Koch. Sin embargo, no es sencillo definir qué es un paciente sano porque es muy difícil construir un clasificador cuya probabilidad de declarar un bacilo erróneamente sea cero. Es aquí dónde los métodos descritos arriba proporcionan una decisión acerca del estado del paciente que considera la incertidumbre en la definición de paciente sano y obtienen cotas de las prestaciones alcanzables a partir de los ejemplos de ambos tipos de pacientes. _____________________________________ In hypothesis testing, it is not always possible to define the hypotheses precisely, sometimes they are not directly related with the available data. This thesis considers new statistical tools for testing uncertain hypotheses and their application to automatic tuberculosis diagnosis. Methods to measure the achievable performance using the training data are developed and test which consider the uncertainty in the hypotheses and modify the decision probabilities accordingly are proposed. Another addressed problem is the machine learning equivalent to the likelihood ratio for those situations where the data distributions are unknown and one test sample does not provide the desired performance. The thesis starts with an introduction to tuberculosis, why is a health problem and which are the diagnosis techniques. We focus on automatic diagnosis based on sputum images analysis and their principal issues. Later, it shortly reviews decision theory, which includes parametric and non-parametric hypothesis testing methodologies and sequential testing; confidence region estimation and support vector machines. Uncertain hypotheses testing follows and methods from frequentist and Bayesian points of view are proposed. Upper bounds of the error probabilities for frequentist view and upper bounds for the a posteriori hypotheses probability are presented. The problem of classifying a set of samples of the same class is considered from a machine learning point of view. A new method to extend the training samples in such a way than a classifier trained with these �extended� training samples gives a single output for the test set of samples. This algorithm is evaluated and proved worthy in some public datasets and its complexity is analysed for the support vector machine classifier. Finally, an automatic diagnosis system for tuberculosis patients is proposed. This system is capable to process images at the same rate as the microscope captures them. The system looks for Koch bacilli in the sputum. However, it is not clear how to define a healthy patient as it is difficult to build a classifier with zero false bacillus detection probability. The methods described above give a decision for the patient that correctly considers the uncertainty in the healthy patient definition. In addition, those methods bound the achievable performance from the available training data.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus