Global ETD Search

Return to search

Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia

Cette thèse porte sur trois grands défis posés par la conception et la réalisation d'un « système d'exploitation de corpus de traductions », abrégé en « sectra ». Un sectra vise à fournir un support informatique unifié à l'exploitation de corpus de traductions effectuée à la fois par l'humain et par la machine. Le premier défi vise l'aspect de support informatique unifié pour l'évaluation de systèmes de TA. Le deuxième défi concerne l'aspect de support contributif et collaboratif au travail humain sur des corpus variés en contexte multilingue. Enfin, le troisième défi vise au support informatique à l'exploitation de corpus de traductions dans des applications novatrices (comme les iMAG, Notepad++, etc.). Plusieurs notions émergentes (un segment multilingualisé et contextualité, un corpus de documents « multifichier », etc.), principes généraux (la proactivité, la délégation, etc.), et problématiques à dominante conceptuelle (par exemple, définition étendue d'un « contexte » de segment), algorithmique (par exemple, programmabilité du traitement des corpus), et programmatoire (par exemple, traitement de masses de données) ont été abordés et traités pour la conception et la réalisation d'un tel système. Un système appelé SECTra_w a été construit et expérimenté avec succès dans le cadre de plusieurs projets réels pour l'évaluation de TA, la post-édition, et la multilinguïsation de sites Web et des applications. Mots-clés : Corpus de traductions, exploitation de corpus de traductions, support informatique et collaboratif, évaluation de TA, post-édition.

[INFO:INFO_OH] Computer Science/Other

Corpus de traductions

exploitation de corpus de traductions

support informatique et collaboratif

évaluation de TA

post-édition

Identifer	oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00548196
Date	17 June 2010
Creators	Huynh, Cong-Phap
Source Sets	CCSD theses-EN-ligne, France
Language	French
Detected Language	French
Type	PhD thesis

Page generated in 0.0017 seconds

Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia

Description

Links & Downloads

Tags

Additional Fields