1 |
Forces et faiblesses de l'utilisation de trigrams dans l'étiquetage automatique du français : exploration à partir des homographes de type verbe-substantifBrault, Frédérick 11 April 2018 (has links)
Ce mémoire porte sur l'étiquetage automatique de texte français, c'est-à-dire l'attribution, par un programme informatique appelé étiqueteur, de la nature grammaticale des mots d'un texte français. En particulier, ce mémoire explore les forces et les faiblesses de l'utilisation du modèle mathématique des trigrams pour cette tâche. L'efficacité du modèle des trigrams est évaluée à l'aide d'observations sur la désambiguïsation des homographes de type verbe/substantif en français, c'est-à-dire, des mots dont la graphie est la même selon qu'ils soient verbe ou substantif (ex. : ferme). Ce mémoire tente de répondre à trois questions : 1. Pourquoi les étiqueteurs à modèle mathématique comme les trigrams réussissent-ils à 95%? 2. Qu'est-ce qui empêche d'améliorer ces performances? 3. Comment des connaissances linguistiques peuvent-elles permettre d'améliorer ces performances? / En rapport à ces questions, les résultats obtenus lors de ces travaux montrent que : 1. les structures syntaxiques sont suffisamment récurrentes pour permettre aux trigrams de saisir en grande partie les règles syntaxiques nécessaires à la désambiguïsation; 2. le calcul d'un taux de succès général dissimule, d'un point de vue linguistique, des décisions incohérentes du modèle des trigrams qu'ils seraient difficile de rectifier simplement en modifiant les trigrams; 3. la connaissance de contraintes syntaxiques permet d'analyser plus en détail le comportement du modèle des trigrams et de suggérer, en conséquence, des solutions pour améliorer le taux de succès d'un étiqueteur.
|
2 |
La catégorisation grammaticale automatique : adaptation du catégoriseur de Brill au français et modification de l'approcheThibeault, Mélanie 11 April 2018 (has links)
Tableau d’honneur de la Faculté des études supérieures et postdoctorales, 2004-2005 / La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l'anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour ensuite en améliorer les résultats. Par ailleurs, quelle que soit la technique utilisée, certains problèmes restent irrésolus. Les mots inconnus sont toujours difficiles à catégoriser correctement. Nous avons tenté de trouver des solutions à ce problème. En somme, nous avons apporté une série de modifications à l'approche de Brill et évalué l'impact de celles-ci sur les performances. Les modifications apportées ont permis de faire passer les performances du traitement des mots inconnus français de 70,7% à 78,6%. Nous avons donc amélioré sensiblement les performances bien qu'il reste encore beaucoup de travail à faire avant que le traitement des mots inconnus français soit satisfaisant.
|
3 |
Les usages langagiers, les attitudes langagières et l'expression identitaire de Marocains vivant en milieu minoritaire ou en milieu majoritaireZouali, Ouafaa 11 April 2018 (has links)
Le but de la présente étude était de vérifier si les facteurs socio-psychologiques liés aux comportements langagiers et les expressions identitaires varient en fonction du statut ethnolinguistique, minoritaire et/ou majoritaire, chez des adolescents faisant partie d'une même communauté ethnolinguistique (les Marocains) vivant dans différents pays (Canada, Belgique, Maroc) et ayant des expériences scolaires différentes. Il s'agissait aussi d'examiner la correspondance entre le profil identitaire et les facteurs socio-psychologiques des groupes étudiés. 294 sujets ont répondu à des questionnaires concernant les usages langagiers, les habitudes linguistiques, les attitudes langagières, la compétence linguistique et l'identité culturelle. Les résultats des analyses ont confirmé que l'expression identitaire des groupes varie en fonction du leur statut ethnolinguistique et qu'il existe une interaction entre les différentes variables socio-psychologiques associées à leurs comportements langagiers. Aussi, l'expression identitaire de chacun des groupes correspondrait aux variables socio-psychologiques, et ce, aussi bien en contexte minoritaire qu'en contexte majoritaire.
|
Page generated in 0.0171 seconds