Resumen de Agrupamiento y descubrimiento de subgrupos para fenotipado de pacientes

español
Según las principales organizaciones sanitarias, la resistencia antimicrobiana (antimicrobial resistance o AMR, por sus siglas en inglés) es una de las mayores amenazas mundiales para la salud humana y constituye un problema crítico en el ámbito médico. La AMR se produce cuando los microorganismos se vuelven resistentes a los tratamientos antimicrobianos, haciendo que estos últimos no puedan combatir eficazmente las infecciones. Algunas de las principales causas de la AMR son el uso inadecuado de antimicrobianos y la transferencia de microorganismos resistentes entre humanos, animales o el medio ambiente. Esto significa que, a pesar del uso de fármacos antimicrobianos para tratar a pacientes infectados con microorganismos resistentes, su uso excesivo y una regulación inadecuada favorecen la propagación de estos microorganismos resistentes. Por un lado, desde el punto de vista sanitario y hospitalario, es imprescindible disponer de recursos, herramientas y procedimientos con los que monitorizar, detectar y controlar los posibles casos de AMR, además de erradicar todas las amenazas potenciales tanto para los pacientes como para el resto de la sociedad. Por otro lado, en el ámbito de la investigación clínica se han realizado muchos esfuerzos para abordar el problema de la AMR y mitigar los efectos y problemas que causa. En este contexto, la búsqueda de conjuntos de pacientes con características interesantes se ha convertido en una cuestión fundamental. Esta tarea se denomina fenotipado de pacientes y estas características de los pacientes se denominan fenotipos. El aprendizaje computacional (machine learning o ML, por sus siglas en inglés) es un área prometedora en el campo de la informática, ya que proporciona un mecanismo con el que investigar y desarrollar nuevas soluciones a la hora de enfrentarse a determinados problemas como el descrito en este trabajo. Más concretamente, el ML puede utilizarse para la generación automática de fenotipos de pacientes. La hipótesis de esta tesis doctoral es que las técnicas de agrupamiento (clustering) y descubrimiento de subgrupos (subgroup discovery o SD, por sus siglas en inglés), que son dos técnicas de ML, son eficaces para apoyar al proceso de fenotipado de pacientes en el contexto clínico de la resistencia a los antibióticos. Nuestra hipótesis es que las versiones refinadas y adaptadas de dichas técnicas pueden generar fenotipos útiles y legibles para los clínicos. Para probar esta hipótesis, establecemos los siguientes objetivos: (1) utilización de las técnicas de clustering o SD como base para proponer técnicas de ML para el fenotipado cuyos resultados sean útiles y fácilmente legibles por los expertos clínicos, (2) generación de fenotipos de pacientes mediante el diseño de una nueva técnica de ML no supervisada basada en clustering, (3) identificación de fenotipos de pacientes mediante la propuesta de una nueva metodología que permita involucrar a los expertos clínicos en el proceso, (4) extracción de fenotipos mediante la creación de un nuevo y eficiente algoritmo de SD, (5) definición de fenotipos de pacientes con la propuesta del nuevo problema de minado de las top-k listas de subgrupos diversas, (6) facilitación del uso de todos los algoritmos de SD desarrollados en esta investigación, junto con otros ya existentes en la literatura, mediante el desarrollo de una librería Python pública, accesible y de código abierto y (7) garantía de la reproducibilidad de la investigación mediante la extracción y el uso de datos clínicos relacionados con el problema de la resistencia a los antibióticos a partir de un repositorio público. Finalmente, las principales conclusiones de esta tesis doctoral en relación con los objetivos propuestos son que: (1) las nuevas técnicas de ML creadas en este trabajo pueden aplicarse con éxito al problema de la resistencia a los antibióticos y sus resultados son fáciles de interpretar para los clínicos, (2) la técnica de clustering basado en trazas genera fenotipos de pacientes, (3) la nueva metodología de 5 pasos proporciona una guía sencilla con la que identificar y hacer un ranking de los fenotipos de pacientes y permite involucrar a los expertos clínicos en el proceso de descubrimiento, (4) el algoritmo VLSD puede utilizarse tanto para extraer directamente fenotipos de pacientes como formando parte de otras técnicas de fenotipado, (5) el nuevo problema de minado de las top-k listas de subgrupos diversas proporciona un nuevo enfoque para el fenotipado de pacientes, (6) la librería ‘subgroups’ es de fácil acceso, ya que está disponible en GitHub y PyPI y puede ser utilizada por científicos de datos, investigadores de ML y usuarios finales para tareas como el fenotipado y (7) la base de datos MIMIC-III es una excelente fuente de datos que proporciona abundante información relativa al problema de la resistencia a los antibióticos, ayuda a los investigadores en este campo y garantiza la reproducibilidad de la investigación
English
According to principal healthcare organisations, antimicrobial resistance (AMR) is a significant danger to human health worldwide, and is a critical issue in the medical field. AMR occurs when microorganisms become resistant to antimicrobial treatments, making the latter unable to combat infections effectively. Some of the principal causes of AMR are the inappropriate use of antimicrobials and the transfer of resistant microorganisms between humans, animals or the environment. This means that, despite the use of antimicrobial drugs to treat patients infected with resistant microorganisms, their excessive use and inadequate regulation promote the spread of these resistant microorganisms. On the one hand, from the health and hospital point of view, it is essential to have resources, tools and procedures with which to monitor, detect and control possible cases of AMR, in addition to eradicating all potential threats to both patients and the rest of society. On the other hand, many efforts have been made in the clinical research field to address the AMR problem and to mitigate the effects and problems that it causes. In this context, finding sets of patients with interesting characteristics has become a core issue. This task is denominated as the patient phenotyping process, and these patient characteristics are denominated as phenotypes. Machine Learning (ML) is a promising area in the field of computer science, since it provides a mechanism with which to research and develop new solutions when confronting certain problems such as that described in this work. More precisely, ML can be used for the automatic generation of patient phenotypes. The hypothesis of this PhD thesis is that clustering and subgroup discovery (SD), which are two ML techniques, are effective as regards supporting the patient phenotyping process in the clinical context of antibiotic resistance. We hypothesize that refined and adapted versions of such techniques can generate phenotypes that are helpful and understandable for clinicians. In order to prove this hypothesis, we therefore establish the following objectives: (1) the use of clustering or SD as the basis on which to propose ML techniques for phenotyping whose results would be useful for clinical experts and easy for them to understand; (2) the generation of patient phenotypes by designing a new unsupervised ML technique based on clustering; (3) the identification of patient phenotypes by proposing a new methodology that would allow clinical experts to become involved in the process; (4) the extraction of phenotypes by creating a new and efficient SD algorithm; (5) the definition of patient phenotypes by proposing the new problem of mining diverse top-k subgroup lists; (6) the facilitation of the use of all the SD algorithms developed in this research, along with others already existing in literature, by developing a public, accessible and open-source Python library, and (7) a guarantee of the reproducibility of the research by extracting and using clinical data related to the antibiotic resistance problem from a public repository. Finally, the main conclusions of this PhD thesis in relation to the objectives proposed are that: (1) the new ML techniques created in this work can be successfully applied to the antibiotic resistance problem and their results are easy for clinicians to interpret; (2) the Trace-based clustering technique generates patient phenotypes; (3) the new 5-step methodology provides a straightforward guide with which to identify and rank patient phenotypes, and allows clinical experts to be involved in the discovery process; (4) the VLSD algorithm can be used either to directly extract patient phenotypes or as part of other phenotyping techniques; (5) the new problem of mining diverse top-k subgroup lists provides a new approach for patient phenotyping; (6) the `subgroups' library can be easily accessed, since it is available on GitHub and PyPI and can be used by data scientists, ML researchers and end-users for tasks such as phenotyping, and (7) the MIMIC-III database is an excellent data source that provides rich data concerning the antibiotic resistance problem, helps researchers in this field, and ensures the reproducibility of research.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Coordinado por: