Ayuda
Ir al contenido

Dialnet


Extracción automática de unidades terminológicas guiada por Framenet: una aplicación al corpus electrónico CORD-19

    1. [1] Universidad de Cádiz

      Universidad de Cádiz

      Cádiz, España

  • Localización: ELUA: Estudios de Lingüística. Universidad de Alicante, ISSN-e 2171-6692, ISSN 0212-7636, Nº 38, 2022 (Ejemplar dedicado a: Los géneros digitales en la interfaz del trabajo de corpus y el análisis del discurso especializado / coord. por Chelo Vargas Sierra, José Antonio Sánchez Fajardo), págs. 281-300
  • Idioma: español
  • Títulos paralelos:
    • Automatic framenet-guided extraction of terminology: an application to the cord-19 electronic corpus
  • Enlaces
  • Resumen
    • español

      La evolución de la terminología va unida a las nuevas tecnologías y al desarrollo de plataformas de trabajo o interfaces, que permitan crear un glosario técnico de forma semiautomática o incluso automática. Las unidades terminológicas y sus propiedades están conectadas a la expresión del conocimiento de los campos especializados en los que aparecen, por lo que estos enfoques automáticos no solo se enfrentan a la tarea de determinar cuáles son las unidades terminológicas de un campo determinado, sino a expresar cómo se estructura dicha información en esa disciplina. Muchas de las unidades terminológicas que se pueden encontrar en un ámbito científico determinado aparecen en otros campos e, incluso, en el uso general. Los términos suelen estar presentes en el acervo léxico de las lenguas y comparten con las unidades léxicas un complejo conjunto de relaciones. La semántica de marcos es un modelo particularmente atractivo para el trabajo terminológico, interesado en dar cuenta de la conexión entre la estructura conceptual de un campo de conocimiento especializado y los elementos utilizados para transmitir este conocimiento. Esto ha llevado a muchos investigadores a utilizar FrameNet como forma de representar la terminología. FrameNet es un recurso en línea para el inglés basado en la semántica de marcos y respaldado por pruebas de corpus. Un marco se fundamenta en el hecho de que ciertas palabras evocan determinadas situaciones en las que tienen lugar determinados participantes. Estas situaciones o marcos son estructuras estereotipadas que representan áreas de experiencia y conocimiento sociocultural. Presentamos un enfoque estadístico basado en corpus que es capaz de seleccionar los marcos de FrameNet que mejor representan un conjunto de textos electrónicos sobre COVID-19 e indicar cuáles de sus unidades léxicas funcionan como unidades terminológicas de ese corpus. Los resultados muestran cómo esta metodología puede ser un buen apoyo al trabajo terminográfico, ya que no solo permite la extracción de unidades terminológicas, sino el uso del esqueleto formal de FrameNet como medio para estructurar este conocimiento.

    • English

      The evolution of Terminology is joined to new technologies and the development of work platforms or interfaces that allow creating a technical glossary semi-automatically or even automatically. Terms and their properties are connected formally to the expression of knowledge of specialized fields in which they occur, so automatic approaches are not only faced with the task of determining which are the terminological units of a given field, but to express how such information is structured in their technical field. Most of the terms occurring in a scientific domain are also found in other disciplines and even in everyday language. Terms are often present on the lexical stock of languages and share with lexical units a complex set of relationships. Frame Semantics is a particularly attractive model for the terminological work, interested in accounting for the connection between the conceptual structure of a specialized field and the elements used to transmit this knowledge. This has led to many researchers to use FrameNet as a way of representing terminology. FrameNet is an online resource for English based on Frame Semantics and supported by corpus evidence. A frame is founded on the basis that certain words evoke certain situations in which particular participants take place. These situations or frames are stereotyped structures representing areas of sociocultural experience and knowledge. We present a statistical approach based on corpus able to select most representative FrameNet frames that best represent a set of electronic texts on COVID-19 and show which of their lexical units work as terminological units. Results confirm that this methodology can be a good support for terminographic work, since it not only allows the extraction of terminological units, but also the use of the FrameNet framework to structure this knowledge.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno