Objetivo: En este trabajo se analiza la posibilidad de crear un clasificador de textos sintéticos de cirugía ortopédica escritos en euskera adaptado al Modelo de Lenguaje Grande Latxa7b, creado por el Grupo Hitz (Universidad del País Vasco).Métodos: Se crea una base de datos sintética con 20.000 notas clínicas de pacientes en las que aparecen menciones a patologías musculoesqueléticas. Se desarrolla un clasificador basado en Latxa-7b; se entrena con notas clínicas y finalmente se analiza su rendimiento a la hora de detectar tumores óseos malignos.Resultados: Se crea un clasificador cuyo rendimiento en los grupos de datos de entrenamiento y test es de 97,7% de precisión, 98,6% exactitud, 94,2% de sensibilidad, 0,99 de área bajo curva y 0,96 de F1.Conclusiones: El excelente rendimiento del clasificador descrito en este trabajo debería servir de acicate para comenzar a aplicar el Procesamiento de Lenguaje Natural en las historias clínicas digitalizadas que utilizamos en nuestros sistemas sanitarios.
Objective: In this work we analyze the possibility of creating a classifier of synthetic orthopedic surgery texts written in Basque adapted to the Latxa-7b Large Language Model, created by the Hitz Group (University of the Basque Country).Methods: A synthetic database is created with 20,000 clinical notes of patients where there are mentions to musculoskeletal pathologies. A classifier based on Latxa-7b is developed. This classifier is later trained with clinical notes and finally its performance in detecting malignant bone tumors is analyzed.Results: A classifier is created whose performance in the training and test data sets is 97.7% precision, 98.6% accuracy, 94.2% sensitivity, 0.99 area under curve and 0.96 F1.Conclusions: The excellent performance of the classifier described in this work should serve as a spur to start applying Natural Language Processing to the digitized medical records we use in our healthcare systems.
Helburua: Lan honetan Hitz Taldeko (Euskal Herriko Unibertsitatea) Latxa-7b Hizkuntza Eredu Handian egokitutako euskaraz idatzitako kirurgia ortopedikoko testu sintetikoen sailkatzaile baten gaitasuna aztertzen da.Metodoak: Datu-base sintetiko bat sortzen da, pazienteen 20.000 ohar klinikorekin, non patologia muskulueskeletikoen aipamenak agertzen diren. Latxa-7b-an oinarritutako sailkatzaile bat garatzen da, nota klinikoekin entrenatzen da eta hezurretako tumore gaiztoak detektatzeko duen errendimendua aztertzen da.Emaitzak: Sailkatzaile bat sortzen da, zeinaren errendimendua entrenamendu eta test datutaldetan % 97,7ko dointasunarekin, % 98,6ko zehaztasunarekin, % 94,2ko estaldurarekin, 0,99ko kurbaren azpiko eremuarekin eta 0,96ko F puntuazioarekin.Ondorioak: Lan honetan deskribatutako sailkatzailearen errendimendu bikainak akuilu izan beharko luke gure osasun-sistemetan erabiltzen ditugun historia kliniko digitalizatuetan hizkuntzaren prozesamendua aplikatzen hasteko.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados