Ayuda
Ir al contenido

Dialnet


A data-driven approach to alternations based on protein-protein interactions

    1. [1] University of Zurich

      University of Zurich

      Zürich, Suiza

  • Localización: Las tecnologías de la información y las comunicaciones: presente y futuro en el análisis de corpus: Actas del III Congreso Internacional de Lingüistica de Corpus / María Luisa Carrió Pastor (ed. lit.), Miguel Ángel Candel Mora (ed. lit.), 2011, ISBN 978-84-694-6225-6, págs. 597-607
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      Alternaciones sintácticas como la alternancia de dativo se han investigado extensivamente. Sin embargo la mayoría de las decisiones que toman los hablantes van más alla de simples opciones binarias. Métodos multifactorial léxicogramaticales y un amplio inventario de patrones sintácticos son necesarios para complementar los métodos actuales. Utilizamos el término alternancia semántica para indicar las distintas maneras de expresar una relación entre entidades con el mismo significado. Para nuestro estudio utilizamos como corpus artículos científicos del campo biomédico. Las entidades que consideramos son proteínas, genes, enfermedades y medicinas, y estudiamos las relaciones entres ellas. En nuestro artículo presentamos tres métodos: en primer lugar, patrones sintácticos desarollados manualmente, en segundo lugar un enfoque semi-automático basado en corpus y tercero un enfoque que utiliza técnicas de Aprendizaje Automático. El sistema de Aprendizaje Automático extrae de un corpus anotado la probabilidad que una configuración sintáctica específica exprese una interacción relevante. El inventario de las configuraciones permite definir las variaciones sintácticas en todas sus formas.

    • English

      Syntactic alternations like the dative shift are well researched. But most decisions which speakers take are more complex than binary choices. Multifactorial lexicogrammatical approaches and a large inventory of syntactic patterns are needed to supplement current approaches. We use the term semantic alternation for the many ways in which a relation between entities, conveying broadly the same meaning, can be expressed. We use a well-resourced domain, biomedical research texts, for a corpus-driven approach. As entities we use proteins, and as relations we use interactions between them, using Text Mining training data. We discuss three approaches: first, manually designed syntactic patterns, second a corpus-based semi-automatic approach and third a machine-learning language model. The machine-learning approach learns the probability that a syntactic configuration expresses a relevant interaction from an annotated corpus. The inventory of configurations define the envelope of variation and its multitude of forms.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno