This article presents the linguistic aspects used by computer scientists to create systems to automatically recognize proper names. Those systems must locate correctly proper names but, moreover, they must give a categorization (places, persons, organisations...). We will show the different clues and difficulties linked to this task.
Plan de l'article
Introduction
1. Les noms propres en français
1.1. La productivité des noms propres
1.2. Typologies de noms propres
Typologies morpho-syntaxiques des noms propres
Typologies sémantiques des noms propres
2. Reconnaissance automatique des noms propres
2.1. Les recherches dans le domaine de l'extraction automatique d'entités nommées
2.2. Comment reconnaître des noms propres avec un système à base de règles ?
Preuve interne et externe
Structure syntaxique des noms propres accompagnés d'une preuve externe
Variation des noms propres
2.3. Le traitement des ambiguïtés
Résolution des ambiguïtés structurelles : la délimitation des noms propres
Résolution des ambiguïtés sémantiques
Une heuristique de désambiguïsation : Les mots ont un seul sens par discours
3. Étude en corpus
Noms de personnes
Noms d'organisations
Noms de lieux
Tous les noms propres confondus
4. Conclusion
© 2001-2026 Fundación Dialnet · Todos los derechos reservados