Ayuda
Ir al contenido

Dialnet


Segmentador de oraciones para textos en español basado en red neuronal

  • Autores: Jacinto Espinosa García, Amalio F. Nieto Serrano, José Carlos González, José Miguel Goñi Menoyo
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 19, 1996, págs. 1-6
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      En este trabajo se muestra la utilización de una red neuronal para segmentar textos en español en sus oraciones constitutivas. Esta operación debe efectuarse habitualmente como un paso previo en multitud de aplicaciones de procesamiento de lenguaje natural. A pesar de tratarse de una tarea conceptualmente sencilla, y de obtenerse resultados aceptables por diversos procedimientos, la división de un texto en oraciones tiene el inconveniente de ser fuertemente dependiente de la fuente (estructura, tipo de lenguaje, género literario, etc.). Esto obliga prácticamente a rehacer el trabajo no sólo para cada tipo de aplicación, sino para cada tipo de texto que vaya a ser tratado. Frente a otros tipos de técnicas, la utilización de redes neuronales tiene la ventaja de liberar el desarrollador de la tarea de programación, empleándose colecciones de ejemplos correctamente clasificados para el entrenamiento del segmentador.

    • English

      This work shows a connectionist system used for the segmentation of texts in Spanish into separate sentences. This task has to be carried out in many Natural Language Processing applications. This kind of pre-processing is not conceptually complex, and several techniques producing acceptable results may be applied. However, the task of text segmentation depends heavily on the sources (structure, layout, genre, style). Most of times, this fact imposes some reworking for every new application and type of text. By using neural nets, low level programming is replaced by learning from sets of sentences correctly classified by a specialist.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno