The automatic genre classification represents a difficult task for NLP systems, due to the absence of a unique definition of genre, useful for automatic classification. The discursive genre is determinant for text production and interpretation (Rastier, 1989, Bouquet, 2004). The genre influences the choice of lexical words, syntactic structures or styles (Biber et Conrad, 2009) or the process of neologism creation. We exploit the linguistic properties induced by the genre to automatically classify newspapers discourse genre or more generic categories (information vs opinion). The properties are established on the basis of a linguistic analysis of the newspapers genres and categories.
La classification automatique par genre est une tâche difficile, pour les systèmes de Traitement automatique des langues, due à la diversité des définitions du genre et à l’absence d’une définition adaptée pour une approche automatique. Le genre discursif détermine les procédés d’écriture et de réception du texte (Rastier, 1989, Bouquet, 2004). En effet, par son caractère normatif, le genre influence les choix de vocabulaire, de syntaxe, de style (Biber et Conrad, 2009), y compris les procédés de création lexicale. Nous exploitons ces propriétés linguistiques pour la classification automatique des genres discursifs, appartenant aux champs génériques de l’opinion et de l’information dans le domaine du journalisme. Les propriétés choisies pour la classification automatique sont établies après une analyse de corpus de genres discursifs et champs génériques journalistiques.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados