Spelling suggestions: "subject:"broyage""
51 |
Open source quality control tool for translation memory using artificial intelligenceBhardwaj, Shivendra 08 1900 (has links)
La mémoire de traduction (MT) joue un rôle décisif lors de la traduction et constitue une base
de données idéale pour la plupart des professionnels de la langue. Cependant, une MT est très
sujète au bruit et, en outre, il n’y a pas de source spécifique. Des efforts importants ont été
déployés pour nettoyer des MT, en particulier pour former un meilleur système de traduction
automatique. Dans cette thèse, nous essayons également de nettoyer la MT mais avec un objectif
plus large : maintenir sa qualité globale et la rendre suffisament robuste pour un usage interne
dans les institutions. Nous proposons un processus en deux étapes : d’abord nettoyer une MT
institutionnelle (presque propre), c’est-à-dire éliminer le bruit, puis détecter les textes traduits à
partir de systèmes neuronaux de traduction.
Pour la tâche d’élimination du bruit, nous proposons une architecture impliquant cinq approches
basées sur l’heuristique, l’ingénierie fonctionnelle et l’apprentissage profond. Nous évaluons cette
tâche à la fois par annotation manuelle et traduction automatique (TA). Nous signalons un gain
notable de +1,08 score BLEU par rapport à un système de nettoyage état de l’art. Nous proposons
également un outil Web qui annote automatiquement les traductions incorrectes, y compris mal
alignées, pour les institutions afin de maintenir une MT sans erreur.
Les modèles neuronaux profonds ont considérablement amélioré les systèmes MT, et ces systèmes
traduisent une immense quantité de texte chaque jour. Le matériel traduit par de tels systèmes
finissent par peuplet les MT, et le stockage de ces unités de traduction dans TM n’est pas
idéal. Nous proposons un module de détection sous deux conditions: une tâche bilingue et une
monolingue (pour ce dernier cas, le classificateur ne regarde que la traduction, pas la phrase
originale). Nous rapportons une précision moyenne d’environ 85 % en domaine et 75 % hors
domaine dans le cas bilingue et 81 % en domaine et 63 % hors domaine pour le cas monolingue
en utilisant des classificateurs d’apprentissage profond. / Translation Memory (TM) plays a decisive role during translation and is the go-to database for
most language professionals. However, they are highly prone to noise, and additionally, there is no
one specific source. There have been many significant efforts in cleaning the TM, especially for
training a better Machine Translation system. In this thesis, we also try to clean the TM but with a
broader goal of maintaining its overall quality and making it robust for internal use in institutions.
We propose a two-step process, first clean an almost clean TM, i.e. noise removal and then detect
texts translated from neural machine translation systems.
For the noise removal task, we propose an architecture involving five approaches based on heuristics, feature engineering, and deep-learning and evaluate this task by both manual annotation and
Machine Translation (MT). We report a notable gain of +1.08 BLEU score over a state-of-the-art,
off-the-shelf TM cleaning system. We also propose a web-based tool “OSTI: An Open-Source
Translation-memory Instrument” that automatically annotates the incorrect translations (including
misaligned) for the institutions to maintain an error-free TM.
Deep neural models tremendously improved MT systems, and these systems are translating an
immense amount of text every day. The automatically translated text finds a way to TM, and
storing these translation units in TM is not ideal. We propose a detection module under two
settings: a monolingual task, in which the classifier only looks at the translation; and a bilingual
task, in which the source text is also taken into consideration. We report a mean accuracy of around
85% in-domain and 75% out-of-domain for bilingual and 81% in-domain and 63% out-of-domain
from monolingual tasks using deep-learning classifiers.
|
52 |
Invariants analytiques des difféomorphismes et multizêtas / Analytic invariants of diffeomorphisms and multizetas valuesBouillot, Olivier 19 October 2011 (has links)
Ce travail comprends deux parties indépendantes, mais intimement liées. La première partie concerne le calcul et l'évaluation numérique des invariants holomorphes des difféomorphismes tangents à l'identité, dans le cas-type. On y expose notamment trois méthodes de calculs numériques, dont l'une est basée sur une formule explicite des invariants. Celle-ci résulte de l'évaluation de l'application de cornes 7[+, dont les ingrédients de base sont des rationnels, des coefficients de Taylor du difféomorphisme étudié et des multitangentes. La seconde partie concerne l'étude des multitangentes et des relations les liant entre elles. Il s'agit de fonctions I-périodiques, généralisant les séries d'Eisenstein, et définissant un moule symétr~l. D'autres relations existent, tels la réduction en monotangentes qui indique un lien profond entre les multitangentes et les multizêtas. Des propriétés et conjectures de nature purement algébrique, arithmétique ou analytique sont ensuite exposées. / This work contains two independant parts, witch are deeply very closed. The first part deals with the calculation and the numerical evaluation of the holomor¬phic invariants of tangent to identity diffeomorphisms, in the type-case. ln particular, we display here three methods of numerical computation whose the last is based on an ex¬plicit formula of invariants. These result of calculation of the horn map 7[+, whose basics components are sorne rationnaIs, sorne Taylor coefficients of the diffeomorphism which is studied and multitangents. The second part deals with a général study of multitangents and relations between them. They are I-periodic functions, generalizing Eisenstein series and defining a symetr~l mould. There are others relations, like the reduction into monotangents which point out to us a profound link between multitangents and multiz~tas values. Properties and conjec¬tures of purely algebraic, arithmetical or analytical kirig are then explain
|
53 |
La représentation de la violence faite aux femmes dans 'Un dimanche à la piscine à Kigali' de Gil Courtemanche et 'Je m’appelle Bosnia' de Madeleine GagnonThach, Thida January 2014 (has links)
La violence faite aux femmes est une réalité encore très présente, surtout dans les sociétés patriarcales, même après des décennies de lutte féministe. C’est aussi un thème privilégié en littérature. La présente thèse propose justement une analyse de ce thème à travers deux romans assez récents qui mettent tous deux de l’avant des aspects particuliers de la question : Un dimanche à la piscine à Kigali de Gil Courtemanche et Je m’appelle Bosnia de Madeleine Gagnon. Nous tenterons de cerner les différentes formes de violences à l’œuvre dans les deux narrations : la violence faite aux filles, celle faite aux femmes, et enfin la violence spécifique qu’engendrent les conflits armés avec le viol comme arme de guerre. Nous proposerons une analyse intersectionnelle de ces formes de violences afin de mesurer les représentations et les répercussions des notions de classe et de race eu égard aux toiles de fond différentes des deux romans : le génocide chez Courtemanche, le nettoyage ethnique chez Gagnon. Nous aborderons aussi les narrations sous l’angle de l’agentivité. Dans des sociétés fondamentalement patriarcales, quel pouvoir peuvent espérer avoir les personnages féminins sur leur destin personnel et collectif? Y a-t-il pour ces femmes fictives des stratégies possibles pour atteindre une liberté d’action, si mince soit-elle?
|
Page generated in 0.0417 seconds