EN ESTA TESIS SE PROPONE UN SISTEMA INFORMATICO QUE GENERA ALTERNATIVAS DE CORRECCION ORTOGRAFICA A UNA CADENA TEXTUAL, EN PRIMER LUGAR SE REPASAN LAS TECNICAS DE CORRESPONDENCIA APROXIMADA DE CADENAS TEXTUALES QUE SE HAN USADO HASTA EL MOMENTO ACTUAL, APLICANDOSE UN CONTRASTE ESTADISTICO PARA DECIDIR LAS QUE SON MAS EFICACES. EN LA SIGUIENTE FASE SE RESUMEN LAS BASES TEORICAS DE DICHAS TECNICAS. A CONTINUACION SE ESTUDIA UN CORPUS TEXTUAL DEL QUE SE EXTRAEN DATOS NUMERICOS QUE CUANTIFICAN LAS PAUTAS DE GENERACION DE ERRORES. A PARTIR DE ELLO SE PROPONE UN CONJUNTO DE PRESTACIONES QUE HA DE SATISFACER UN CORRECTOR AUTOMATICO DE ERRORES. EN BASE AL CORPUS Y DE LAS CONVENCIONES ORTOGRAFICAS CATALANAS SE PROPONE UN ALFABETO REDUCIDO QUE PERMITE CODIFICAR INEQUIVOCAMENTE LAS PALABRAS CATALANAS. PARTIENDO DE LA TEORIA DE LA INFORMACION Y DE LOS SUBCONJUNTOS BORROSOS SE COMPLETA UN SISTEMA DE CODIFICACION BORROSA QUE OFRECE MAYOR FLEXIBILIDAD QUE LOS CLASICOS. FINALMENTE, LAS ALTERNATIVAS DE CORRECCION SE CONFRONTAN CON UNA PARTICION ADECUADA DE LA BASE DE DATOS LEXICA CON QUE SE QUIERA TRABAJAR, A FIN DE OFRECER UN CONJUNTO DE CORRECCIONES ORDENADAS SEGUN UNA PROBABILIDAD DECRECIENTE.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados