Ayuda
Ir al contenido

Dialnet


Resumen de THAI-NEST: A framework for Thai named entity tagging specification and tools

Thanaruk Theeramunkong, Monthika Boriboon, Choochart Haruechaiyasak, Nichnan Kittiphattanabawon, Krit Kosawat, Chutamanee Onsuwan, Issariyapol Siriwat, Thawatchai Suwanapong, Nattapong Tongtep

  • español

    Se presenta el marco THAI-NEST para construir un corpus de noticias tailandesas mediante un procesode etiquetaje de entidades nombradas (NE). Los tres componentes principales del marco son laespecificación del etiquetaje del corpus, el proceso de etiquetaje y las herramientas de etiquetaje. Paraseguir la línea de la estandarización de la Text Encoding Initiative (TEI), se desarrolla unaespecificación de etiquetaje teniendo en cuenta algunas características de entidades nombradastailandesas, incluyendo nombres propios, expresiones de fecha, hora y cantidad, así como otrasentidades nombradas. La especificación desarrollada incluye un conjunto de etiquetas y su esquema deetiquetaje. Se diseña un conjunto de herramientas de etiquetaje que se implementa con un GUI efectivo.El conjunto de herramientas admite dos niveles de tipo y estructura de entidades nombradas. Seinformará de los resultados y estadísticas de nuestro corpus en construcción.

  • English

    A THAI-NEST framework is presented for a construction of Thai news corpus with named entity (NE)tagging process. Three main components of the framework are corpus tagging specification, taggingprocess, and tagging tools. To be in line with the Text Encoding Initiative (TEI) standardization, atagging specification is developed by taking into account some characteristics of Thai NEs, includingproper nouns, expressions of date, time, and quantity, and other extended named entities. The developedspecification includes a tag set and its tagging schema. A set of tagging tools is designed andimplemented with an effective GUI. The tool set supports two tagging levels of NE type and NE structure.Results and statistics of our ongoing corpus construction are reported


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus