Ayuda
Ir al contenido

Dialnet


Enhancing the understanding of clinical trials with a sentence-level simplification dataset

  • Autores: Leonardo Campillos Llanos, Rocío Bartolomé, Ana Rosa Terroba Reinares
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 72, 2024 (Ejemplar dedicado a: Procesamiento del Lenguaje Natural, Revista nº 72, marzo de 2024), págs. 31-43
  • Idioma: inglés
  • Títulos paralelos:
    • Mejora de la comprensión de ensayos clínicos con un conjunto de datos simplificados a nivel de frase
  • Enlaces
  • Resumen
    • español

      Se presenta un conjunto de 1200 frases de ensayos clínicos en español simplificadas manualmente (144 019 tokens). Se analizaron 1040 anuncios del Registro Europeo de Ensayos Clínicos (EudraCT), seleccionando frases con ambigüedades o con más de 25 palabras. Se elaboraron criterios de simplificación recogidos en una guía distribuida públicamente con el conjunto de datos. Se obtuvieron dos versiones: oraciones simplificadas sintácticamente, y oraciones con simplificación léxica y sintáctica. Se presenta una evaluación cuantitativa, cualitativa y por tres evaluadores independientes sobre la gramaticalidad/fluidez, adecuación semántica y simplificación. Los resultados muestran que el recurso es adecuado para avanzar en la investigación en simplificación automática de textos médicos.

    • English

      We introduce a dataset with 1200 manually simplified sentences (144 019 tokens) from clinical trials in Spanish. A total of 1040 announcements from the European Clinical Trials Register (EudraCT) were analyzed to select sentences with ambiguities or exceeding 25 words. Simplification criteria were devised in an annotation guideline, which is released publicly along with the dataset. We obtained two versions: syntactically simplified sentences, and sentences with syntactic and lexical simplification. We report a quantitative, a qualitative and a human evaluation, in which three independent evaluators assessed the grammaticality/fluency, semantic adequacy and overall simplification. Results show that the resource is suitable for advancing research on automatic simplification of medical texts.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno