131 |
Délimitation et étiquetage des morphèmes en coréen par ressources linguistiquesHuh, Hyun Gue 28 June 2005 (has links) (PDF)
Nous présentons un système de délimitation morphologique des textes coréens par automates à états finis. Le Coréen est une langue agglutinante et notre système peut probablement être adapté aux autres langues agglutinantes à suffixes (hongrois, finnois, turc). Les textes coréens s'écrivent principalement avec l'alphabet Hangul qui est un ensemble de caractères syllabiques. Il est possible de les mélanger avec des idéogrammes et des caractères de l'alphabet latin. Nous utilisons le système de codage de caractères UNICODE dans lequel les syllabes coréennes sont rangées par ordre alphabétique. Pour certains traitements sur les syllable coréennes, nous décomposons chaque syllable en plusieurs caractères alphabétiques coréens. Les mots coréens reçoivent des affixes. Pour le nom, un mot peut avoir plusieurs suffixes sans compter les suffixes dérivés, le nombre maximal de combinaisons étant d'environ 1600. Notre première étape pour l'analyse des textes coréens est la description des morphèmes d'un mot pour le segmenter à l'aide des séparateurs : blanc et symboles. Et on segmente encore les segments en morphèmes. Pour pouvoir analyser les segments, nous construisons des dictionnaires de racines et de séquences de suffixes. Nous utilisons les transducteurs pour représenter les compatibilités entre des morphèmes : racines et suffixes avec l'interface graphique de UNITEX. Ils sont conçus de manière à être construits et maintenus manuellement. Notre méthode est fondée sur des ressources linguistiques alors que la plupart des systèmes d'analyse morphologique sont fondés sur des données statistiques. Nous intégrons automatiquement les dictionnaires de racines et les transducteurs des suffixes en un transducteur unique, qui remplit la fonction d'un dictionnaire. Le résultat de l'analyse d'un texte se présente sous la forme d'un automate pour rendre compte de l'ambiguité du découpage en morphèmes. Les transitions sont étiquetés par des morphèmes annotés d'informations linguistiques (forme canonique, forme fléchie et informations linguistiques).
|
132 |
Reconnaissance Structurelle de Formules Mathématiques Typographiées et ManuscritesLavirotte, Stéphane 14 June 2000 (has links) (PDF)
Le sujet de ce mémoire est l'étude et la réalisation d'un composant pour la reconnaissance structurelle des formules mathématiques typographiées et manuscrites. Ces travaux s'inscrivent dans une thématique plus large : l'analyse et la reconnaissance de documents. La problématique générale que nous avons considérée peut se résumer de la manière suivante ; il s'agit d'identifier la structure, ou arbre de syntaxe abstraite, d'une formule à partir des données graphiques et géométriques (les symboles composant la notation et leur position). L'architecture logicielle retenue permet d'adapter très facilement le composant, baptisé OFR (Reconnaissance Optique de Formules), aux logiciels fournissant les symboles, ainsi qu'aux diverses notations mathématiques identifiées. Pour effectuer cette reconnaissance structurelle, nous avons eu recours à une modélisation à base de graphes. Elle permet une abstraction des données receuillies et une transformation de ces informations par la définition d'une grammaire de graphes contextuelle attribuée, spécialement adaptée aux opérateurs mathématiques. En nous appuyant sur des protocoles de communication d'objets mathématiques, comme OpenMath, nous pouvons envisager l'utilisation de l'interface développée autour d'OFR comme une alternative à la saisie des formules mathématiques.
|
133 |
Analyse syntaxique à l'aide des tables du Lexique-Grammaire du françaisTolone, Elsa 31 March 2011 (has links) (PDF)
Les tables du Lexique-Grammaire, dont le développement a été initié par Gross (1975), constituent un lexique syntaxique très riche pour le français. Elles couvrent diverses catégories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de données linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplète et manque de cohérence. Chaque table regroupe un certain nombre d'entrées jugées similaires car elles acceptent des propriétés communes. Ces propriétés ont pour particularité de ne pas être codées dans les tables mêmes mais uniquement décrites dans la littérature. Pour rendre ces tables exploitables, il faut expliciter les propriétés intervenant dans chacune d'entre elles. De plus, un grand nombre de ces propriétés doivent être renommées dans un souci de cohérence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problèmes rencontrés et les méthodes adoptées pour permettre leur intégration dans un analyseur syntaxique. Nous proposons LGExtract, un outil générique pour générer un lexique syntaxique pour le TAL à partir des tables du Lexique-Grammaire. Il est relié à une table globale dans laquelle nous avons ajouté les propriétés manquantes et un unique script d'extraction incluant toutes les opérations liées à chaque propriété devant être effectuées pour toutes les tables. Nous présentons également LGLex, le nouveau lexique syntaxique généré des verbes, des noms prédicatifs, des expressions figées et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms prédicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff (Lexique des Formes Fléchies du Français) (Sagot, 2010), un lexique morphologique et syntaxique à large couverture et librement disponible pour le français. Ceci permet son intégration dans l'analyseur syntaxique FRMG (French MetaGrammar) (Thomasset et de La Clergerie, 2005), un analyseur profond à large couverture pour le français, basé sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette étape de conversion consiste à extraire l'information syntaxique codée dans les tables du Lexique-Grammaire. Nous présentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous évaluons l'analyseur syntaxique FRMG sur le corpus de référence de la campagne d'évaluation d'analyseur du français Passage (Produire des Annotations Syntaxiques à Grande Échelle) (Hamon et al., 2008), en comparant sa version basée sur le Lefff avec notre version reposant sur les tables du Lexique-Grammaire converties.
|
134 |
Lexique-grammaire et Unitex : quels apports pour une description terminologique bilingue de qualité ? Analyse sur deux corpus comparables de médecine thermale.Cetro, Rosa 05 April 2013 (has links) (PDF)
La terminologie est une science qui étudie les termes, ces unités lexicales véhiculant un sens spécialisé dans un discours scientifique ou technique. Constituée en science dans la première moitié du XXe siècle, la terminologie est un terrain interdisciplinaire qui se nourrit des apports de la linguistique, de la logique et de l'informatique. C'est surtout grâce à cette dernière qu'elle a pu se développer considérablement. Le lexique-grammaire est une méthode de description linguistique strictement empirique d'inspiration harrissienne qui a vu le jour en France à la fin des années 1960. La description linguistique a été menée en parallèle avec la réalisation d'outils informatiques nécessaires à la formalisation et à l'exploitation de ces données, parmi lesquels il y a aussi le logiciel Unitex (Paumier, 2002). Tant le lexique-grammaire que le logiciel Unitex présentent un potentiel intéressant, largement inexploité, pour la terminologie. Dans ce travail, nous nous proposons d'évaluer les apports des méthodes liées au lexique-grammaire et au logiciel Unitex à une description terminologique bilingue de qualité. Après avoir défini des critères de qualité d'une description terminologique, nous menons cette évaluation sur deux corpus comparables ayant trait à la médecine thermale, en français et en italien.
|
135 |
L'assignation du genre grammatical en français langue seconde : transfert ou terminaisons des noms?Gareau, Frédéric January 2008 (has links) (PDF)
Ce mémoire traite de l'assignation du genre grammatical, élément particulièrement difficile à maîtriser par les apprenants du français langue seconde. II vise à déterminer si le transfert de la langue première (LI) est un facteur majeur (transfert positif ou négatif) pour cette question et à comparer cette stratégie potentielle à celle du recours aux terminaisons des noms. Plus spécifiquement, une comparaison a été faite entre les résultats d'assignation du genre pour une variété de substantifs français par des hispanophones et des sinophones (mandarin) apprenant le français. Une telle étude est d'un grand intérêt puisque l'espagnol possède deux genres, comme en français, mais distribués différemment, alors que le mandarin n'a pas de genre. Les participants étaient tous des adultes. Leur niveau de connaissance du vocabulaire de nos tests a été mesuré et il a déterminé, entre autres, le classement des participants. Il a ensuite été pris en considération lors de l'analyse des résultats. D'autres variables ont été observées (par ex. : l'influence du sexe des participants sur l'assignation du genre grammatical). Pour répondre à nos questions de recherche, les participants (60) ont été conviés à passer deux tests individuels, présentés sur support informatique: un de reconnaissance des noms et un d'assignation du genre grammatical. Les principales questions de recherche étaient de savoir quel serait le groupe qui obtiendrait les meilleurs résultats au test d'assignation du genre grammatical et concernaient le transfert et les terminaisons des noms. Les deux groupes linguistiques ont obtenu des scores globaux d'assignation du genre similaires, mais avec des résultats distribués très différemment. Nous avons confirmé nos hypothèses principales: les hispanophones ont obtenu des résultats reflétant systématiquement un transfert de leur LI, et ce, surtout lorsque les noms observés étaient congénères avec leurs homologues en espagnol. Si les congénères étaient du même genre, l'assignation correcte était de 96,0 %, donc un effet de transfert positif très évident. Par contre, si les congénères étaient d'un genre différent, l'assignation correcte du genre français était de 33,7 %, donc un effet évident de transfert négatif (un haut taux d'erreurs). Pour les sinophones, les résultats ont coïncidé avec une attribution du genre masculin lorsque les noms français ne possédaient pas de -e muet final et du genre féminin lorsque les noms français possédaient un -e muet final. Nous en avons conclu des retombées pédagogiques qui favorisent un enseignement différent du genre grammatical selon le groupe linguistique. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Acquisition, Chinois, Congénères, Didactique, Espagnol, Français, Genre grammatical, Langue seconde, Lexique, Linguistique, Terminaisons, Transfert.
|
136 |
Étude sémantique de la distribution du pretérito perfecto simple et du pretérito perfecto compuesto de l'espagnol des villes de Mexico et de MadridLopez Morales, Yareth Sara January 2008 (has links) (PDF)
Ce mémoire traite de la distribution sémantique des formes verbales dites « perfectives » du passé en espagnol: le Pretérito Perfecto Simple (PPS) et le Pretérito Perfecto Compuesto (PPC). En utilisant le cadre théorique pour l'analyse de la temporalité verbale de Laurent Gosselin (1996) et un corpus provenant des deux dialectes les plus contrastants quant aux valeurs et usage du PPS et du PPC, nous avons redéfini leurs effets de sens et repéré les domaines de variation qui permettent à la forme périphrastique (le PPC) de prendre la place de la forme simple (PPS). Ainsi, pour étudier la façon dont le processus de neutralisation sémantique du PPS et du PPC a lieu, ce mémoire a été divisé en quatre sections. La première partie rassemble la littérature traitant des significations respectives du PPS et du PPC au sein de l'espagnol mexicain et madrilène. La deuxième partie présente le cadre théorique de Gosselin et nos objectifs de recherche. Le troisième chapitre concerne le corpus et la base de données utilisés dans notre analyse. La dernière partie est consacrée à l'étude détaillée de la distribution du passé aoristique et du présent accompli (valeurs aspectuo-temporelles véhiculées par le PPS et le PPC) suivant certains éléments linguistiques provenant du modèle de Gosselin, mais aussi selon des paramètres d'ordre social tels l'âge et le sexe des locuteurs à l'origine des élocutions au PPS et au PPC. Il y est montré, à partir de l'analyse que nous avons faite, que le phénomène de neutralisation sémantique entre le PPS et le PPC est engagé tant en espagnol madrilène qu'en espagnol mexicain, même si cette manifestation est achevée seulement dans certains contextes de l'espagnol péninsulaire. Les indices recueillis suggèrent: qu'au niveau linguistique, ce changement touche d'abord les catégories de procès les moins complexes (états); que le PPC de la ville de Madrid utilise davantage de marques d'aspect et de temps que le PPC mexicain (comme s'il fallait compenser l'accroissement du champ sémantique de cette forme verbale par la cooccurrence d'instructions complémentaires) puisque la neutralisation commence avec des énoncés dont le repère temporel est établi à l'aide d'autres références dans le discours (repérage non autonome). Enfin, en ce qui concerne les facteurs sociaux, notre analyse a démontré que ce sont les femmes et surtout les jeunes locuteurs ceux qui s'engagent les premiers dans les changements sémantiques. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Neutralisation sémantique, Temporalité verbale, Aspect lexical, Pretérito Perfecto Simple, Pretérito Perfecto Compuesto, Espagnol.
|
137 |
La grammaire et son enseignement : connaissances grammaticales et représentations de futurs enseignants de français langue secondeMartineau, Yves January 2007 (has links) (PDF)
La présente étude vise, d'une part, à mesurer l'état des connaissances grammaticales de 56 futurs enseignants de français langue seconde (FL2). D'autre part, elle vise à évaluer l'opinion (les représentations) des participants à l'égard de l'enseignement grammatical. Les participants sont tous inscrits à un baccalauréat en enseignement du FL2 d'une université québécoise: 37 sont à leur première année du programme, et 19 sont finissants de quatrième année. Les domaines étudiés pour cette étude sont la place de l'enseignement de la grammaire en classe de langue seconde et les pratiques qui y sont reliées, les cognitions (connaissances et représentations) des enseignants de langue seconde, et la spécificité de la grammaire du français lorsque enseignée dans un cours de langue seconde. Il s'agit d'une recherche exploratoire de type quantitatif, mais qui inclut une certaine analyse qualitative des données. Un questionnaire a été utilisé auprès des participants afin de vérifier certaines connaissances grammaticales jugées importantes pour un enseignant de langue, soit l'identification des catégories et des fonctions des mots dans une phrase (description métalinguistique), le repérage d'erreurs, la correction d'erreurs et l'explication d'erreurs. Le questionnaire a aussi servi à recueillir des données sociodémographiques sur les participants et à explorer leurs représentations (opinions) face à l'enseignement grammatical. Les résultats brossent un tableau peut-être un peu moins pessimiste que celui présenté dans les études faites jusqu'à maintenant et qui portent principalement sur l'anglais, mais montrent néanmoins des lacunes importantes, surtout sur le plan de la description métalinguistique (taux de réussite de 51 %) et de l'explication d'erreurs (taux de réussite de 20 %). Ces résultats ne varient pas significativement de la première à la quatrième année du baccalauréat, ce qui pourrait indiquer que la formation tant dans les cours que dans les stages n'ont aucun effet sur l'appropriation de ce type de connaissances. Par ailleurs, les participants ont montré une opinion plutôt équilibrée face à l'enseignement de la grammaire, selon laquelle ils croiraient qu'un tel enseignement est nécessaire, mais qu'il doit être intégré à une démarche communicative. Nos recommandations s'appuient sur les conclusions rapportées dans des études antérieures : le développement des connaissances grammaticales métalinguistiques doit faire l'objet d'un enseignement systématique dans un programme de formation des enseignants de L2 et les cours visant à développer de telles connaissances sont plus efficaces lorsqu'ils suivent une démarche de nature procédurale qui permet au futur enseignant d'être actif dans son propre apprentissage. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Connaissances grammaticales, Connaissances des enseignants, Représentations des enseignants, Spécificité du français langue seconde, Formation des enseignants.
|
138 |
Les effets de l'enseignement stratégique sur la performance en orthographe grammaticale lors d'activités de production écriteValiquette, Michelle January 2008 (has links) (PDF)
L'étude porte sur les effets de l'enseignement stratégique sur la performance d'élèves de première secondaire relativement à l'orthographe grammaticale, plus spécifiquement sur les participes passés, lors d'activités de production écrite. L'objectif de recherche était d'évaluer les progrès des élèves ayant appris de façon stratégique la reconnaissance et l'accord des participes passés, comparativement aux progrès d'élèves ayant suivi un enseignement dit traditionnel. Le cadre théorique se divise en quatre parties reliées entre elles. Nous parlons tout d'abord de la production écrite et de ses différentes composantes. Nous exposons ensuite différentes approches d'enseignement. La troisième partie nous permet d'entrer au coeur de notre sujet de recherche avec les différents aspects de l'enseignement stratégique. Nous abordons en dernier lieu la motivation scolaire, un aspect essentiel de l'enseignement, mais surtout de l'apprentissage. La méthodologie de recherche comprend la description de l'approche retenue, la description des sujets et de l'intervention pédagogique privilégiée. Nous y décrivons aussi le matériel choisi pour les différentes activités et les instruments de collecte de données. Enfin, tout le déroulement de l'expérimentation y est explicité dans les moindres détails. La description et l'analyse des données portent sur les résultats des deux groupes de la recherche aux différentes tâches du prétest et du post-test, mais aussi sur des prises de données en cours d'expérimentation. Nous avons aussi tenu compte des émotions des sujets et avons analysé cet aspect. De plus, les tâches ont aussi été analysées individuellement pour chaque élève et ont été comparées entre elles, selon le niveau des élèves. Les résultats de recherche montrent que l'enseignement stratégique est une méthode plus efficace que l'enseignement traditionnel dans l'apprentissage d'une notion grammaticale (les participes passés, en l'occurrence). En effet, les sujets de l'étude ont démontré une meilleure compréhension et une meilleure rétention des notions lorsqu'ils étaient du groupe expérimental. Tous les élèves de ce groupe, une fois l'application de l'enseignement stratégique terminée, étaient capables de nommer des stratégies de reconnaissance des participes passés. De plus, 95% des élèves du groupe expérimental se sont améliorés entre le prétest et le post-test contre 76,9% pour le groupe contrôle. Le groupe ayant participé à l'enseignement stratégique a obtenu un meilleur taux d'amélioration, soit 21 %, entre le prétest et le post-test, que le groupe contrôle qui a obtenu un taux d'amélioration d'à peine 7,4%. L'enseignement stratégique semble donc une voie à adopter en enseignement de notions grammaticales. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Enseignement explicite et stratégique, Motivation, Participe passé.
|
139 |
Étude du lien entre la compétence pragmatique et la compétence grammaticale auprès d'apprenants allophones de français L2Dalmasso, Nicolas January 2009 (has links) (PDF)
Dans le cadre de ce mémoire, nous avons mesuré la compétence pragmatique, plus précisément la compréhension de l'acte demande, et nous l'avons mise en rapport avec la compétence grammaticale. Il s'agissait de mesurer plus précisément la compréhension de l'acte de parole demande. Nous avons voulu observer un éventuel lien entre les deux compétences citées, tel que des chercheurs l'ont évoqué. La mesure de la compréhension de l'acte demande a été réalisée au moyen d'un test de compréhension écrite et celle de la compétence grammaticale, au moyen d'un test de grammaire standardisé. Nous avons également recueilli des informations au moyen d'un questionnaire d'informations personnelles et ce, afin de mieux caractériser notre population participante. Celle-ci était constituée d'apprenants allophones adultes en français langue seconde. Les tests que nous avons mis en pratique lors de notre expérimentation ont été mis à l'essai préalablement auprès de participants dont la langue première était le français. Les résultats obtenus montrent une corrélation positive entre la compétence grammaticale et la compétence pragmatique. Nous avons ainsi pu mieux caractériser les liens entre ces deux composantes de la compétence de communication. Nous avons également pu déterminer le niveau de compréhension des demandes selon une classification établie en démontrant que les demandes directes ont mieux été comprises que les demandes indirectes. À partir de ces résultats et des explications relevées dans la littérature du domaine abordé, nous avons confirmé le point de vue d'auteurs qui affirment que la compétence grammaticale précède la compétence pragmatique pour des apprenants de niveau avancé.
|
140 |
Effet de l'illustration sur la compréhension des relatives explicatives et déterminatives et de leur ponctuationRizk Bastien, Sanaa January 2009 (has links) (PDF)
L'objectif de notre recherche était de déterminer l'effet de l'illustration sur la compréhension d'un texte de grammaire distinguant les relatives explicatives des relatives déterminatives. L'influence du mode de présentation de l'information a été évaluée au moyen d'une comparaison de la compréhension des versions illustrée et non illustrée du même texte, réalisée à l'aide de deux groupes expérimentaux. Afin de mesurer les acquis, nous avons adopté un plan prétest -post-test et conçu un questionnaire d'évaluation des connaissances comportant des questions d'application de la règle présentée et d'autres exigeant le transfert des connaissances à des situations nouvelles. Notre hypothèse générale supposait que les diagrammes que nous avions élaborés, et qui explicitent les relations entre les propositions relatives et les groupes nominaux dont elles constituent l'expansion, permettraient une représentation plus juste et cognitivement moins coûteuse de la réalité extralinguistique à laquelle le texte renvoie. Plus précisément, nous nous attendions à ce que l'impact positif des illustrations s'exerce sur les processus cognitifs d'ordre supérieur, et se manifeste dans des situations impliquant un raisonnement inférentiel. Nous prévoyions également un effet différentiel des illustrations en lien avec la langue maternelle des sujets et leur style d'apprentissage préférentiel. Nos résultats indiquent un impact positif des illustrations sur la rapidité de traitement de l'information et sur la capacité d'utiliser les connaissances acquises dans des contextes linguistiques nouveaux. Ces données vont dans le sens de multiples recherches qui se sont intéressées à la question, et renforcent l'idée que les illustrations représentant des relations participent à la construction d'un modèle mental du texte, d'où un impact positif sur le raisonnement inférentiel.
Relativement à la langue maternelle des participants, la comparaison des résultats des sujets L1 et L2 ne nous a pas permis d'observer une interaction entre cette variable et la présence des illustrations. Quant au style d'apprentissage, nos résultats suggèrent que si les apprenants à forte capacité d'imagerie traitent plus rapidement les données en présence des illustrations, ces dernières peuvent jouer, chez les sujets à faible capacité d'imagerie, un rôle similaire à celui des images mentales et faciliter l'instanciation d'un modèle mental du sens exprimé par le texte. Cependant, vu le nombre limité de participants à faible aptitude picturale dans nos groupes, ces derniers résultats devront être interprétés avec prudence. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Compréhension de texte, Illustrations, Enseignement de la grammaire.
|
Page generated in 0.0394 seconds