Ir al contenido

Dialnet


Domain-specific word sense disambiguation

  • Autores: Oier López de Lacalle Lecuona
  • Directores de la Tesis: Eneko Agirre Bengoa (dir. tes.)
  • Lectura: En la Universidad del País Vasco - Euskal Herriko Unibertsitatea ( España ) en 2009
  • Idioma: inglés
  • Tribunal Calificador de la Tesis: Manuel Palomar Sanz (presid.), Olatz Arregi Uriarte (secret.), Lluís Márquez i Villodre (voc.), Walter Dealemans (voc.), Basilio Sierra Araujo (voc.)
  • Materias:
  • Resumen
    • Hitzaren adiera-desanbiguazioa, ataza bezala, hitz polisemikoak testuinguru baten hartzen duen adiera automatikoki zehaztea da, Adimen artifizial osorako bidean giltzarri den eginbeharra dugu.

      Hitzen adiera desanbiguazioa Hizkuntza Naturalaren Ulermenarako beharrezkoa den ataza bat da. Hizkuntza naturala lanabes duten hainbat aplikazioetan erabilgarria eta beharrezkoa dela defendatzen dute Hizkuntzaren Azterketa eta Prozesamendu barruan dauden ikertzaile askok.

      Erraz nabari daiteke Itzulpen Automatikoari, adibidez, ekar dakioken onurak zein izan daitezkeen (lexiko hautapena) ala Informazio Erauzketan eragin ditzakeen aurrerapenak (hitz baten erabilera esanguratsua den ala ez). Hala ere, hitzaren adiera automatikoki zehazteak zailtasun ugari dakar. Esanguratsuenen artean ikasketa automatiko gainbegiraturako datuen falta eta sakabanaketa eta domeinu aldaketak sortzen dituzten eranginkortasun galera aipa ditzakegu. Datuen sakabanaketa eta domeinu aldaketaren arazoak ardatz hartuta ikerketan murgildu gara.

      Tesi-lan honen helburua ikasketa automatiko hainbat metodo esku artean izanik datu-sakabaneta eta, batipat, domeinuaren arazoei aurre egiteko proposamen bat plazaratzea izan da. Horretarako ikasketarako ezaugarriak maneiatzen duten informazioa irudiketzeko modu berriak proposatu ditugu.

      Algebraren ikuspegitik Balio Singularretan Deskonposatzen duen teknikan oinarritu gara informazioa modu trinko baten maneiatzeko eta hitz-adierien eredu hobeak lortzeko.

      Lortutako ezaugarri berriak hainbat domeinutan erabili ditugu (domeinu orokorra, kiroletako domeinua eta finantzei buruzkoa), eta domeinura egokitzeko bi aukera nagusi definitu ditugu: Modu gainbegiratua (ikasketa prozesuan domeinu orokorreko eta konkretuko adibideak ditugu) eta erdi-gainbegiratua (ikasketarako domeinu orokorrekoak izanik, domeinu konkretuko adibide ez-etiketatuak ditugunean). Esperimentuak aurrera eramateko ezagunak diren ikasketa automatikoko algoritmoak erabili ditugu. Adibidez, k-NN edota SVM metodoak.

      Burututako esperimentuek ezaugarri hauen eraginkortasuna erakutsi digute domeinu berri baten aurrean gaudenean. Beste modu batera esanda sistema trinkoak eta egokigarriak sortzeko gai izan gara.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno