La catégorisation grammaticale automatique : adaptation du catégoriseur de Brill au français et modification de l'approche

Authors: Thibeault, Mélanie
Advisor: Ladouceur, Jacques
Abstract: La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l'anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour ensuite en améliorer les résultats. Par ailleurs, quelle que soit la technique utilisée, certains problèmes restent irrésolus. Les mots inconnus sont toujours difficiles à catégoriser correctement. Nous avons tenté de trouver des solutions à ce problème. En somme, nous avons apporté une série de modifications à l'approche de Brill et évalué l'impact de celles-ci sur les performances. Les modifications apportées ont permis de faire passer les performances du traitement des mots inconnus français de 70,7% à 78,6%. Nous avons donc amélioré sensiblement les performances bien qu'il reste encore beaucoup de travail à faire avant que le traitement des mots inconnus français soit satisfaisant.
Document Type: Mémoire de maîtrise
Issue Date: 2004
Open Access Date: 11 April 2018
Permalink: http://hdl.handle.net/20.500.11794/17984
Grantor: Université Laval
Collection:Thèses et mémoires

Files in this item:
SizeFormat 
22225.pdf402.62 kBAdobe PDFView/Open
All documents in CorpusUL are protected by Copyright Act of Canada.