Spelling suggestions: "subject:"phrases"" "subject:"fhrases""
191 |
Enseignement des expressions figées métaphoriques françaises à des apprenants vietnamiensLe, Thi Hoa January 2009 (has links)
Thèse numérisée par la Division de la gestion de documents et des archives de l'Université de Montréal.
|
192 |
L’extraction de phrases en relation de traduction dans WikipédiaRebout, Lise 06 1900 (has links)
Afin d'enrichir les données de corpus bilingues parallèles, il peut être judicieux de travailler avec des corpus dits comparables. En effet dans ce type de corpus, même si les documents dans la langue cible ne sont pas l'exacte traduction de ceux dans la langue source, on peut y retrouver des mots ou des phrases en relation de traduction.
L'encyclopédie libre Wikipédia constitue un corpus comparable multilingue de plusieurs millions de documents. Notre travail consiste à trouver une méthode générale et endogène permettant d'extraire un maximum de phrases parallèles. Nous travaillons avec le couple de langues français-anglais mais notre méthode, qui n'utilise aucune ressource bilingue extérieure, peut s'appliquer à tout autre couple de langues.
Elle se décompose en deux étapes. La première consiste à détecter les paires d’articles qui ont le plus de chance de contenir des traductions. Nous utilisons pour cela un réseau de neurones entraîné sur un petit ensemble de données constitué d'articles alignés au niveau des phrases. La deuxième étape effectue la sélection des paires de phrases grâce à un autre réseau de neurones dont les sorties sont alors réinterprétées par un algorithme d'optimisation combinatoire et une heuristique d'extension.
L'ajout des quelques 560~000 paires de phrases extraites de Wikipédia au corpus d'entraînement d'un système de traduction automatique statistique de référence permet d'améliorer la qualité des traductions produites.
Nous mettons les données alignées et le corpus extrait à la disposition de la communauté scientifique. / Working with comparable corpora can be useful to enhance bilingual parallel corpora. In fact, in such corpora, even if the documents in the target language are not the exact translation of those in the source language, one can still find translated words or sentences.
The free encyclopedia Wikipedia is a multilingual comparable corpus of several millions of documents. Our task is to find a general endogenous method for extracting a maximum of parallel sentences from this source. We are working with the English-French language pair but our method -- which uses no external bilingual resources -- can be applied to any other language pair.
It can best be described in two steps. The first one consists of detecting article pairs that are most likely to contain translations. This is achieved through a neural network trained on a small data set composed of sentence aligned articles. The second step is to perform the selection of sentence pairs through another neural network whose outputs are then re-interpreted by a combinatorial optimization algorithm and an extension heuristic.
The addition of the 560~000 pairs of sentences extracted from Wikipedia to the training set of a baseline statistical machine translation system improves the quality of the resulting translations.
We make both the aligned data and the extracted corpus available to the scientific community.
|
193 |
Vers l'acquisition de la morphosyntaxe du français chez les lycéens nairobiens : perspectives sociolinguistiques et didactiques / The acquisition of French morphosyntax amongst Kenya high school students : sociolinguistic and didactic perspectivesNdungu, Francis Gitonga 03 September 2018 (has links)
Cette recherche pseudo-longitudinale privilégiant une approche sociolinguistique et didactique s’inscrit dans le domaine du développement de l’interlangue à travers l’analyse des erreurs morphosyntaxiques du français. Notre public s’est compose des lycéens kenyans anglophones. Cela a été effectué au sein de la capitale du Kenya, Nairobi et de sa banlieue. Les entretiens sur le terrain comprenant des exercices descriptifs et conversationnels à l’oral et à l’écrit, ont mené à la description, l’analyse et l’étiologie des erreurs morphosyntaxiques en français langue étrangère (désormais FLE) dans les productions des apprenants dans un contexte lycéen. L’analyse de ce corpus écrit et oral a révélé les erreurs morphosyntaxiques écrites et orales en français les plus récurrentes ainsi que leurs causes chez les lycéens kenyans. Ce travail s’achève par l’élaboration de propositions didactiques à l’écrit et à l’oral présentant des pistes de réflexion sur la remédiation des erreurs morphosyntaxiques des lycéens kenyans. / This research favoring a sociolinguistic and didactic approach is based on the development of interlanguage through the analysis of morphosyntactical errors in French by English speaking Kenyan high school students in Nairobi and its suburbs. Field research composed of descriptive and conversational oral and written exercises in French as a foreign language was carried out on selected high school students. This paved way to the description and analysis of morphosyntactical errors in French. The analysis of the written and oral corpus helped to identify the most recurrent morphosyntactical and written errors in French, as well as their etiology. This pseudo-longitudinal research culminated in suggested written and oral didactical activities aimed at the correction of these morphosyntactical errors.
|
194 |
Bebopfraser i nutid : Ett möte mellan tradition och innovationMoen, Johannes January 2019 (has links)
Sammanfattning Att vara jazzmusiker kan betyda så oerhört många olika saker, och själva ordet jazzväcker på många sätt fler frågor än svar. Jazz som framförs idag är en såpass bred musikform att den är nästan omöjlig att definiera. Diskussioner uppstår kring nästan alla antaganden när någon försöker beskriva jazz och dess utveckling, och inte minst när man gör det i textform. Viljan att definiera musik och kultur är naturlig för många människor. Det är ett sätt att definiera sig själv och varandra som musiker, konstnär och människa, och ett sätt att bygga sin identitet och sitt sammanhang. Sedan jazzen institutionaliserades har äldre jazz på många sätt satts på en piedestal som jag ibland är orolig för ska hämma dess utveckling. Jag har under lång tid strävat efter att utvecklas inom jazzens mer traditionella område, och jag har ibland ställt mig frågan om jag verkligen är jazzmusiker, jag som till exempel inte kan improvisera till Charlie Parkers Donna Leepå ett övertygande sätt. Detta arbete kretsar kring fraser. Precis som vårat talspråk så består musik och inte minst bebop av små komponenter, fraser, som tillslut bygger upp ett språk vare sig det heter svenska eller bebop. Genom att få en djupare förståelse för hur fraserna kan omformas vill jag pröva en hypotes om att bebop är en central musikform inom jazzgenren.Jag har valt ut femton fraser från bebopen som jag bearbetat för att spelas i ett modernare sammanhang, Christian Scotts musik från 2015. Av den processen för jag sedan en diskussion kring hur mina fraser relaterar till Scotts musik, och om varför vi kallar både ny musik och bebop för jazz. Med de material jag arbetat med har jag inte kunnat se att vi kallar båda stilarna för jazz på grund av musiken i sig, utan att detta snarare har sociala anledningar. Av arbetet har jag även funnit tydliga verktyg till att omforma fraser, och i arbetet delar jag med mig av de lärdomar jag dragit längs vägen.
|
195 |
Study of interactions between processing capacities and language development in children with specific language impairment/ Etude des interactions entre les capacités de traitement et le développement du langage chez des enfants dysphasiquesLeclercq, Anne-Lise 18 February 2011 (has links)
Ce travail est consacré à lévaluation de lhypothèse selon laquelle une limitation des capacités de traitement est à lorigine des troubles langagiers et non langagiers des enfants dysphasiques (ou enfants avec troubles spécifiques du langage, TSL). Les enfants présentant ces troubles montrent des limitations importantes de leurs compétences langagières sans raison apparente (absence de troubles auditifs, intellectuels et affectifs ou de lésions neurologiques). Ces dernières années, la spécificité des troubles langagiers a été remise en cause par de nombreuses études révélant lexistence de difficultés non spécifiquement linguistiques chez les enfants avec TSL, tels que des troubles attentionnels, exécutifs et moteurs. Certains auteurs ont formulé l'hypothèse quune limitation des capacités de traitement est à lorigine des troubles langagiers et non langagiers des enfants avec TSL. Selon cette hypothèse, les troubles langagiers observés chez ces enfants ne sont pas dus à un déficit des représentations linguistiques, mais reflètent une performance limitée par des difficultés à mobiliser lensemble des ressources, linguistiques et/ou non linguistiques, nécessaires à la réalisation de la tâche.
Les recherches réalisées ont permis dévaluer si une telle hypothèse permet dexpliquer les performances observées dans deux épreuves linguistiques considérées par plusieurs auteurs comme des marqueurs comportementaux des TSL, les traitements morphosyntaxiques et la répétition de non-mots, en manipulant les processus recrutés ou la quantité de ressources nécessaires lors de la réalisation de la tâche. Nous avons également manipulé la complexité dans une épreuve non linguistique afin détudier si les limitations des capacités de traitement peuvent être considérées comme générales ou si elles savèrent limitées aux traitements linguistiques. Globalement, nos résultats ne sont pas compatibles avec lhypothèse dune limitation des capacités de traitement à lorigine des troubles linguistiques des enfants avec TSL. Ces enfants ne présentent pas de limitation importante de leurs capacités de traitements qui permette dexpliquer leurs troubles langagiers.
|
196 |
"葡漢辭典"的漢語詞彙研究 / Study of Chinese vocabulary in the Portuguese-Chinese Dictionary;"葡漢辭典的漢語詞彙研究"施雅旋 January 2007 (has links)
University of Macau / Faculty of Social Sciences and Humanities / Department of Chinese
|
197 |
L’extraction de phrases en relation de traduction dans WikipédiaRebout, Lise 06 1900 (has links)
Afin d'enrichir les données de corpus bilingues parallèles, il peut être judicieux de travailler avec des corpus dits comparables. En effet dans ce type de corpus, même si les documents dans la langue cible ne sont pas l'exacte traduction de ceux dans la langue source, on peut y retrouver des mots ou des phrases en relation de traduction.
L'encyclopédie libre Wikipédia constitue un corpus comparable multilingue de plusieurs millions de documents. Notre travail consiste à trouver une méthode générale et endogène permettant d'extraire un maximum de phrases parallèles. Nous travaillons avec le couple de langues français-anglais mais notre méthode, qui n'utilise aucune ressource bilingue extérieure, peut s'appliquer à tout autre couple de langues.
Elle se décompose en deux étapes. La première consiste à détecter les paires d’articles qui ont le plus de chance de contenir des traductions. Nous utilisons pour cela un réseau de neurones entraîné sur un petit ensemble de données constitué d'articles alignés au niveau des phrases. La deuxième étape effectue la sélection des paires de phrases grâce à un autre réseau de neurones dont les sorties sont alors réinterprétées par un algorithme d'optimisation combinatoire et une heuristique d'extension.
L'ajout des quelques 560~000 paires de phrases extraites de Wikipédia au corpus d'entraînement d'un système de traduction automatique statistique de référence permet d'améliorer la qualité des traductions produites.
Nous mettons les données alignées et le corpus extrait à la disposition de la communauté scientifique. / Working with comparable corpora can be useful to enhance bilingual parallel corpora. In fact, in such corpora, even if the documents in the target language are not the exact translation of those in the source language, one can still find translated words or sentences.
The free encyclopedia Wikipedia is a multilingual comparable corpus of several millions of documents. Our task is to find a general endogenous method for extracting a maximum of parallel sentences from this source. We are working with the English-French language pair but our method -- which uses no external bilingual resources -- can be applied to any other language pair.
It can best be described in two steps. The first one consists of detecting article pairs that are most likely to contain translations. This is achieved through a neural network trained on a small data set composed of sentence aligned articles. The second step is to perform the selection of sentence pairs through another neural network whose outputs are then re-interpreted by a combinatorial optimization algorithm and an extension heuristic.
The addition of the 560~000 pairs of sentences extracted from Wikipedia to the training set of a baseline statistical machine translation system improves the quality of the resulting translations.
We make both the aligned data and the extracted corpus available to the scientific community.
|
198 |
Enseignement des expressions figées métaphoriques françaises à des apprenants vietnamiensLe, Thi Hoa January 2009 (has links)
Thèse numérisée par la Division de la gestion de documents et des archives de l'Université de Montréal
|
199 |
La lexicographie bilingue islandais-français : proposition d’articles pour un dictionnaire islandais-français avec une attention particulière au traitement des locutions figées et semi-figées / Bilingual lexicography between Icelandic and French : Suggestions for dictionary entries for an Icelandic-French dictionary with focus on set phrasesDavidsdóttir, Rosa Elin 09 April 2016 (has links)
Cette thèse porte sur la lexicographie bilingue, plus précisément entre l’islandais et le français, avec comme objectif de jeter les bases d’un nouveau dictionnaire islandais-français qui serait accessible en ligne. Pour cela, nous avons rédigé des articles de dictionnaire en nous appuyant sur une nouvelle base de données lexicographiques développée pour des dictionnaires bilingues en ligne avec l’islandais comme langue source (ISLEX). Nous nous concentrons sur les besoins des utilisateurs islandais voulant s’exprimer en français mais nous partons du principe que le dictionnaire devrait également servir aux francophones. À travers notre traitement lexicographique, nous portons une attention spéciale à la syntagmatique et au traitement des locutions plus ou moins figées dans un dictionnaire bilingue. En effet, nous estimons qu’un bon dictionnaire bilingue devrait accorder une importance particulière aux unités phraséologiques telles que les collocations et les locutions figées de sens figuré. Après avoir étudié le rôle et la structuration idéale des dictionnaires bilingues selon les différentes fonctions qu’ils peuvent avoir, celle de l’encodage et celle du décodage, nous passons ensuite à une discussion sur la phraséologie et l’importance des locutions figées et semi-figées dans les dictionnaires bilingues. Nous présentons, par la suite, la microstructure de nos articles ainsi que les outils et les ressources informatiques sur lesquels nous nous appuyons. Les résultats de notre réflexion sur l’élaboration d’un nouveau dictionnaire islandais-français sont présentés sous la forme d’articles, suivis de remarques et d’explications sur nos choix lexicographiques. / This doctoral thesis on bilingual lexicography, and more precisely on lexicography between Icelandic and French, aims to lay the foundations for a new Icelandic-French dictionary that will be available on-line. To that purpose, we write entries for an Icelandic-French dictionary based on a new lexicographical database for Icelandic (ISLEX). The focus is on the needs of Icelandic users who wish to express themselves in French. However, it is clear that an Icelandic-French dictionary will also be useful for French speakers. Through our lexicographical treatment, we pay special attention to the syntagmatic analysis and to the presentation of more or less fixed phraseological units in a bilingual dictionary such as collocations and set phrases, since we consider that a good bilingual dictionary should take phraseological units into account. Having studied the role and the ideal structure of bilingual dictionaries according to the various functions that they can have, the encoding one and the decoding one, we then discuss phraseology and the importance of set phrases in bilingual dictionaries. The microstructure of our articles is then presented as well as the tools and resources on which we base our work. The outcome of our reflection on the writing of a new Icelandic-French dictionary is shown in the form of dictionary entries followed by remarks where an account is given of the way in which some lexicographical problems are tackled and our lexicographical choices are explained.
|
200 |
Les emprunts sémitiques en grec ancien: étude méthodologique et exemples mycéniens / Semitic loanwords in Ancient Greek: methodological study and Mycenaean examplesBourguignon, Alexandra 27 April 2012 (has links)
Les emprunts sémitiques en grec, au-delà des questions idéologiques qui leur sont liées, posent une série de problèmes méthodologiques. En effet, la plupart des études sur le sujet qui ont été menées jusqu’à aujourd’hui ont omis la mise en contexte historique et n’ont pas suffisamment développé l’analyse du processus d’adaptation menant de l’étymon à l’emprunt, aboutissant ainsi à des incohérences chronologiques et linguistiques.<p>Le présent ouvrage fournit donc, après un chapitre de définitions relatives à l’emprunt et à l’étymologie et un autre consacré aux différentes études existantes sur les emprunts sémitiques en grec, une présentation générale du contexte historique et économique de la Méditerranée orientale au IIe millénaire a.C. ainsi que des langues en présence, suivie d’un chapitre reprenant les modifications phonétiques, morphologiques, sémantiques et accentuelles qu’un mot peut subir lorsqu’il est emprunté par une autre langue.<p>Viennent ensuite un chapitre expliquant la méthodologie utilisée pour l’analyse de cas concrets, puis les analyses elles-mêmes. Elles sont au nombre de neuf :trois noms de plantes (κ&973;μ&953;ν&959;ν, « cumin », κ&973;π&949;&953;&961;&959;ν, « souchet », σ&941;λ&953;ν&959;ν ,« céleri »), deux noms de récipients (&7936;σ&940;μ&953;ν&952;&959;&962; « baignoire », φ&953;&940;λ&951; un récipient) et quatre noms de métiers ou institution (βασ&953;λ&949;&973;&962; « chef local, roi », damokoro, un fonctionnaire (?), ζ&940;κ&959;&961;&959;&962; un fonctionnaire du temple, &964;&941;μ&949;ν&959;&962; « portion de territoire réservée à un chef ou à une divinité »). Ces mots offrent un large panorama des difficultés liées à l’étude des emprunts sémitiques en grec et des solutions proposées par l’auteur à la lumière des précédents chapitres. <p> / Doctorat en Langues et lettres / info:eu-repo/semantics/nonPublished
|
Page generated in 0.0411 seconds