Global ETD Search

Return to search

La traduction automatique statistique factorisée : une application à la paire de langues français - roumain / Factored phrase based statistical machine translation : a French - Romanian application

Un premier objectif de cette thèse est la constitution de ressources linguistiques pour un système de traduction automatique statistique factorisée français - roumain. Un deuxième objectif est l’étude de l’impact des informations linguistiques exploitées dans le processus d’alignement lexical et de traduction. Cette étude est motivée, d’une part, par le manque de systèmes de traduction automatique pour la paire de langues étudiées et, d’autre part, par le nombre important d’erreurs générées par les systèmes de traduction automatique actuels. Les ressources linguistiques requises par ce système sont des corpus parallèles alignés au niveau propositionnel et lexical. Ces corpus sont également segmentés lexicalement, lemmatisés et étiquetés au niveau morphosyntaxique. / Our first aim is to build linguistic resources for a French - Romanian factored phrase - based statistical machine translation system. Our second aim is to study the impact of exploited linguistic information in the lexical alignment and translation process. On the one hand, this study is motivated by the lack of such systems for the studied languages. On the other hand, it is motivated by the high number of errors provided by the current machine translation systems. The linguistic resources required by the system are tokenized, lemmatized, tagged, word, and sentence - aligned parallel corpora.

http://www.theses.fr/2014STRAC022/document

Traduction automatique statistique

Modèles factorisées

Modèles de traduction

Modèles de langue

Corpus parallèles alignés

Alignement lexical

Systèmes à base de séquences

Langues romanes

Statistical machine translation

Factored models

Translation models

Language models

Aligned parallel corpora

Identifer	oai:union.ndltd.org:theses.fr/2014STRAC022
Date	13 June 2014
Creators	Laporte, Elena-Mirabela
Contributors	Strasbourg, Grass, Thierry, Todiraşcu-Courtier, Amalia
Source Sets	Dépôt national des thèses électroniques françaises
Language	French
Detected Language	French
Type	Electronic Thesis or Dissertation, Text

Page generated in 0.0018 seconds

La traduction automatique statistique factorisée : une application à la paire de langues français - roumain / Factored phrase based statistical machine translation : a French - Romanian application

Description

Links & Downloads

Tags

Additional Fields