Ayuda
Ir al contenido

Dialnet


THAI-NEST: A framework for Thai named entity tagging specification and tools

    1. [1] Thammasat University

      Thammasat University

      Tailandia

  • Localización: Language Windowing through Corpora / coord. por Isabel Moskowich, Begoña Crespo, Inés Lareo Martín, Paula Lojo Sandino, Vol. 2, 2010 (Part II, L-Z), ISBN 978-84-9749-401-4, págs. 895-908
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      Se presenta el marco THAI-NEST para construir un corpus de noticias tailandesas mediante un procesode etiquetaje de entidades nombradas (NE). Los tres componentes principales del marco son laespecificación del etiquetaje del corpus, el proceso de etiquetaje y las herramientas de etiquetaje. Paraseguir la línea de la estandarización de la Text Encoding Initiative (TEI), se desarrolla unaespecificación de etiquetaje teniendo en cuenta algunas características de entidades nombradastailandesas, incluyendo nombres propios, expresiones de fecha, hora y cantidad, así como otrasentidades nombradas. La especificación desarrollada incluye un conjunto de etiquetas y su esquema deetiquetaje. Se diseña un conjunto de herramientas de etiquetaje que se implementa con un GUI efectivo.El conjunto de herramientas admite dos niveles de tipo y estructura de entidades nombradas. Seinformará de los resultados y estadísticas de nuestro corpus en construcción.

    • English

      A THAI-NEST framework is presented for a construction of Thai news corpus with named entity (NE)tagging process. Three main components of the framework are corpus tagging specification, taggingprocess, and tagging tools. To be in line with the Text Encoding Initiative (TEI) standardization, atagging specification is developed by taking into account some characteristics of Thai NEs, includingproper nouns, expressions of date, time, and quantity, and other extended named entities. The developedspecification includes a tag set and its tagging schema. A set of tagging tools is designed andimplemented with an effective GUI. The tool set supports two tagging levels of NE type and NE structure.Results and statistics of our ongoing corpus construction are reported


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno