José Luis Alonso Berrocal, Emilio Rodríguez Vázquez de Aldana, Luis Carlos García de Figuerola Paniagua, Ángel Francisco Zazo Rodríguez
La mayor parte de los Sistemas de Recuperacion de Informacion utilizan, de una forma u otra, recuentos de frecuencias de las palabras que aparecen en los documentos.Tales recuentos conllevan la necesidad de normalizar dichos terminos. Una simple normalizacion de caracteres (mayusculas/minusculas, acentos y otros diacriticos) parece insuficiente, ya que muchas palabras, por exion morfologica o derivacion, podrian ser agrupadas bajo una unica forma, al tener contenidos semanticos muy cercanos. Se analizan diversos algoritmos de normalizacion y se muestran los experimentos llevados a cabo para evaluar su eficacia.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados