Ayuda
Ir al contenido

Dialnet


Applications of information extraction techniques to molecular biology

  • Autores: Christian Blaschke
  • Directores de la Tesis: Alfonso Valencia Herrera (dir. tes.), Esteban Montejo de Garcini Guedas (dir. tes.)
  • Lectura: En la Universidad Autónoma de Madrid ( España ) en 2002
  • Idioma: inglés
  • Tribunal Calificador de la Tesis: Ricardo Amils Pibernat (presid.), Joaquín Dopazo Blázquez (secret.), Rolf Apweiler (voc.), Anna Tramontano (voc.), José M. Valpuesta (voc.)
  • Materias:
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • A pesar del extendido uso de ordenadores en la investigación biológica, el resultado de todos los experimentos científicos es una publicación, en formato de texto e imagen, Y nada indica que estos vaya a cambiar en los próximos años. Incluso si se genera en el futuro un sistema para la deposición de esta información dentro un formato que pueda ser leído a través de un ordenador, el problema de recobrar todo conocimiento pasado en la biología molecular, seguiría existiendo. Por eso existe un interés considerable en desarrollar métodos que pueden extraer al menos parte de esa información que permanece enterrada en la literatura de modo que pueda ser estructurada.

      El trabajo presentado aquí tiene un enfoque biológico y los problemas tratados eran los siguientes:

      * El más inespecífico y general es: "¿qué hay publicado sobre X?". Esto indica a un sistema de IE que extraiga todos los artículos publicados sobre el objeto X. Esta pregunda podría ser: extraer todas aquellas frases significativas que aprecen en los resúmenes sobre algún gen o alguna proteína determinada.

      Esto puede hacerse comparando el texto donde aparece "X" con otros textos usando métodos estadísticos.

      * Lo que entendemos por función biológica de una proteína ha cambiado sustancialmente en la última década. Una proteína es parte de una red, y de unas rutas y esta conectada con muchas otras proteínas. Desafortunadamente esta información esta enterrada mayormente en la literatura porque no existen bases de datos especializadas para mantener esta información (en los últimos años algunos proyectos se han desarrollado sobre este problema). Por eso son necesarios métodos que puedan descubrir esta información en la literatura y crear de datos automáticamente o para ayudar al prolongar las bases de datos actuales. Para este objetivo se ha desarrollado el sistema SUISEKI que usa herramientas lingüísticas (part-of-speech taggers) y heuríst


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno