Global ETD Search

1	Analyse comparative de la couverture et de l’acceptabilité des solutions d’un dictionnaire bilingue spécialisé, d’une banque de données terminologiques et d’un concordancier en ligne : application au domaine de la traduction médicale Simard, Tanya 21 August 2013 (has links) La présente étude rend compte de l’utilité de trois ressources pour le traducteur médical, soit le Dictionnaire anglais-français des sciences médicales et paramédicales de Gladstone, la banque de données terminologiques et linguistiques du gouvernement du Canada TERMIUM Plus® et le concordancier en ligne WeBiText, sur la base d’une analyse comparative de leur taux de couverture et du niveau d’acceptabilité des solutions qu’elles proposent. Contrairement à d’autres études, cette recherche mise sur une approche double qui combine un volet quantitatif et qualitatif. À partir d’un ensemble de problèmes de traduction tiré d’un corpus d’étude constitué de huit résumés d’articles scientifiques de revues médicales canadiennes, nous démontrons que le taux de couverture du corpus « Santé » de WeBiText est de 62 %, alors que celui de TERMIUM Plus® est de 37 % et celui du Gladstone de 30 %. Nous montrons par ailleurs que le concordancier fournit environ deux fois plus de solutions que les deux autres ressources. En outre, des données rassemblées dans le cadre d’un questionnaire en ligne auprès de 88 langagiers révèlent que les solutions proposées par WeBiText sont tout aussi acceptables que celles offertes par TERMIUM Plus®, tandis que celles qui figurent dans le Gladstone sont souvent considérées comme inacceptables. Nous en concluons que les corpus parallèles tirés du Web ont une meilleure couverture que les ressources traditionnelles et qu’ils présentent une gamme plus variée de solutions uniques et convenables, notamment pour la traduction de textes médicaux hautement spécialisés. ENGLISH This study reports on the usefulness of three resources for the medical translator, namely Gladstone's English-French dictionary of medical and paramedical sciences, TERMIUM Plus®, the Government of Canada's terminology and linguistic data bank, and WeBiText, an online concordancer, on the basis of a comparative analysis of their coverage and the level of acceptability of the solutions they offer. Unlike other studies, this research adopts a two-fold approach combining quantitative and qualitative perspectives. From a set of translation problems drawn from a corpus of eight scientific paper abstracts from Canadian medical journals, we demonstrate that WeBiText's "Health" corpus has a 62% coverage rate, while that of TERMIUM Plus® is 37% and Gladstone's is 30%. We also show that the concordancer provides roughly twice as many solutions as the other two resources. In addition, data collected through an online survey of 88 language professionals indicates that the solutions found in WeBiText are equally acceptable as those provided by TERMIUM Plus®, while Gladstone's are often considered unacceptable. We conclude that Web parallel corpora have a better coverage than traditional resources and that they offer a broader range of unique and suitable solutions, particularly for the translation of highly specialized medical texts. traduction médicale dictionnaire bilingue banque de données terminologiques concordancier corpus parallèle
2	Analyse comparative de la couverture et de l’acceptabilité des solutions d’un dictionnaire bilingue spécialisé, d’une banque de données terminologiques et d’un concordancier en ligne : application au domaine de la traduction médicale Simard, Tanya January 2013 (has links) La présente étude rend compte de l’utilité de trois ressources pour le traducteur médical, soit le Dictionnaire anglais-français des sciences médicales et paramédicales de Gladstone, la banque de données terminologiques et linguistiques du gouvernement du Canada TERMIUM Plus® et le concordancier en ligne WeBiText, sur la base d’une analyse comparative de leur taux de couverture et du niveau d’acceptabilité des solutions qu’elles proposent. Contrairement à d’autres études, cette recherche mise sur une approche double qui combine un volet quantitatif et qualitatif. À partir d’un ensemble de problèmes de traduction tiré d’un corpus d’étude constitué de huit résumés d’articles scientifiques de revues médicales canadiennes, nous démontrons que le taux de couverture du corpus « Santé » de WeBiText est de 62 %, alors que celui de TERMIUM Plus® est de 37 % et celui du Gladstone de 30 %. Nous montrons par ailleurs que le concordancier fournit environ deux fois plus de solutions que les deux autres ressources. En outre, des données rassemblées dans le cadre d’un questionnaire en ligne auprès de 88 langagiers révèlent que les solutions proposées par WeBiText sont tout aussi acceptables que celles offertes par TERMIUM Plus®, tandis que celles qui figurent dans le Gladstone sont souvent considérées comme inacceptables. Nous en concluons que les corpus parallèles tirés du Web ont une meilleure couverture que les ressources traditionnelles et qu’ils présentent une gamme plus variée de solutions uniques et convenables, notamment pour la traduction de textes médicaux hautement spécialisés. ENGLISH This study reports on the usefulness of three resources for the medical translator, namely Gladstone's English-French dictionary of medical and paramedical sciences, TERMIUM Plus®, the Government of Canada's terminology and linguistic data bank, and WeBiText, an online concordancer, on the basis of a comparative analysis of their coverage and the level of acceptability of the solutions they offer. Unlike other studies, this research adopts a two-fold approach combining quantitative and qualitative perspectives. From a set of translation problems drawn from a corpus of eight scientific paper abstracts from Canadian medical journals, we demonstrate that WeBiText's "Health" corpus has a 62% coverage rate, while that of TERMIUM Plus® is 37% and Gladstone's is 30%. We also show that the concordancer provides roughly twice as many solutions as the other two resources. In addition, data collected through an online survey of 88 language professionals indicates that the solutions found in WeBiText are equally acceptable as those provided by TERMIUM Plus®, while Gladstone's are often considered unacceptable. We conclude that Web parallel corpora have a better coverage than traditional resources and that they offer a broader range of unique and suitable solutions, particularly for the translation of highly specialized medical texts. traduction médicale dictionnaire bilingue banque de données terminologiques concordancier corpus parallèle
3	Constitution d'une ressource sémantique arabe à partir d'un corpus multilingue aligné / Constitution of a semantic resource for the Arabic language from multilingual aligned corpora Abdulhay, Authoul 23 November 2012 (has links) Cette thèse vise à la mise en œuvre et à l'évaluation de techniques d'extraction de relations sémantiques à partir d'un corpus multilingue aligné. Ces relations seront extraites par transitivité de l'équivalence traductionnelle, deux lexèmes possédant les mêmes équivalents dans une langue cible étant susceptibles de partager un même sens. D'abord, nos observations porteront sur la comparaison sémantique d'équivalents traductionnels dans des corpus multilingues alignés. A partir des équivalences, nous tâcherons d'extraire des "cliques", ou sous-graphes maximaux complets connexes, dont toutes les unités sont en interrelation, du fait d'une probable intersection sémantique. Ces cliques présentent l'intérêt de renseigner à la fois sur la synonymie et la polysémie des unités, et d'apporter une forme de désambiguïsation sémantique. Elles seront créées à partir de l'extraction automatique de correspondances lexicales, basée sur l'observation des occurrences et cooccurrences en corpus. Le recours à des techniques de lemmatisation sera envisagé. Ensuite nous tâcherons de relier ces cliques avec un lexique sémantique (de type Wordnet) afin d'évaluer la possibilité de récupérer pour les unités arabes des relations sémantiques définies pour des unités en anglais ou en français. Ces relations permettraient de construire automatiquement un réseau utile pour certaines applications de traitement de la langue arabe, comme les moteurs de question-réponse, la traduction automatique, les systèmes d'alignement, la recherche d'information, etc. / This study aims at the implementation and evaluation of techniques for extracting semantic relations from a multilingual aligned corpus. Firstly, our observations will focus on the semantic comparison of translational equivalents in multilingual aligned corpus. From these equivalences, we will try to extract "cliques", which ara maximum complete related sub-graphs, where all units are interrelated because of a probable semantic intersection. These cliques have the advantage of giving information on both the synonymy and polysemy of units, and providing a form of semantic disambiguation. Secondly, we attempt to link these cliques with a semantic lexicon (like WordNet) in order to assess the possibility of recovering, for the Arabic units, a semantic relationships already defined for English, French or Spanish units. These relations would automatically build a semantic resource which would be useful for different applications of NLP, such as Question Answering systems, machine translation, alignment systems, Information Retrieval…etc. Réseaux sémantiques Cliques Alignement Corpus parallèle Wordnet Semantic network Cliques Alignment Parallel corpora Wordnet
4	Analyse textométrique des corpus parallèles francais-coréens / Textometric analysis of French-Korean parallel corpora Cho, Joon-Hyung 25 February 2010 (has links) Les équivalences traductionnelles extraites à partir d’un corpus parallèle deviendraient une ressource précieuse permettant d’étudier différents contextes traductionnels envisagés entre les deux langues distinctes. L’utilisation des textes traductionnels constitue aujourd’hui un thème essentiel en traductologie et en études contrastives des langues. Les méthodes textométriques opèrent une série de calculs statistiques portant sur les unités textuelles dans un corpus parallèle segmenté en occurrences. Elles fournissent les indices quantitatifs permettant de mettre en évidence le lien traductionnel de ces unités. En examinant des formes bilingues issues des corpus parallèles français-coréens, nous avons vérifié l’utilité de cette méthodologie appliquée aux textes traductionnels en français-coréen. Elles ont effectivement donné un résultat positif, d’une part, et un résultat négatif, d’autre part, tout au long de nos travaux. Pourtant, grâce à ces méthodes, nous avons pu étudier divers liens traductionnels entre unités textuelles du français et du coréen. La plupart de méthodes automatisées consacrées au corpus parallèle en langues hétérogènes n’ont pas produit de résultat acceptable. À ce titre, la textométrie, qui vise à l’observation quantitative des éléments lexicaux d’un corpus, serait très intéressante lorsqu’il s’agit notamment d’un corpus parallèle en langues sans parenté. / The translational equivalences extracted from a parallel corpus become a valuable resource enable to study the various translational contexts between the two distinct languages. The use of translational texts is now a principal subject in the translation studies and the contrastive studies of languages. The textometry operate a set of statistical calculations on the textual units in a parallel corpus divided into the tokens. They provide the quantitative evidence that verify the translational relation of the linguistic units. In exploring bilingual words in the French-Korean parallel corpora, we verified the usefulness of this methodology applied to the French-Korean translational texts. They produced actually a positive result, on the one hand, and a negative result, on the other hand, throughout our work. Yet, these methods made also observe the various translational relations of textual units between French and Korean. The most automated methods devoted to the parallel corpora of heterogeneous language pairs have not produced the approvable result. For the reason, the textometry, which aims to observe the lexical elements of a corpus from a statistical point of view, would be very practical method when we deal with a parallel corpus that consists of different language pairs. Corpus parallèle Textométrie Traductologie Français Coréen Parallel corpus Textometry Translation study French Korean
5	Constitution de ressources linguistiques multilingues à partir de corpus de textes parallèles et comparables Bouamor, Dhouha 21 February 2014 (has links) (PDF) Les lexiques bilingues sont des ressources particulièrement utiles pour la Traduction Automatique et la Recherche d'Information Translingue. Leur construction manuelle nécessite une expertise forte dans les deux langues concernées et est un processus coûteux. Plusieurs méthodes automatiques ont été proposées comme une alternative, mais elles qui ne sont disponibles que dans un nombre limité de langues et leurs performances sont encore loin derrière la qualité des traductions manuelles.Notre travail porte sur l'extraction de ces lexiques bilingues à partir de corpus de textes parallèles et comparables, c'est à dire la reconnaissance et l'alignement d'un vocabulaire commun multilingue présent dans ces corpus. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Extraction de lexique bilingue Corpus parallèle Corpus comparable Alignement Traduction automatique statistique
6	Approches textométriques de la notion de style du traducteur : Analyses d'un corpus parallèle Français-Chinois : Jean-Christophe de Romain Rolland et ses trois traductions chinoises Miao, Jun 20 April 2012 (has links) (PDF) Nous avons tenté d'explorer la notion de style du traducteur en articulant les analysestraductologiques et les méthodes de la textométrie multilingue (méthodes d'analysequantitatives textuelles appliquées à des corpus de textes alignés). Notre corpus d'étude est constitué par trois traductions chinoises d'une oeuvre littéraire française, Jean-Christophe de Romain Rolland (1904-1917), réalisées respectivement par Fu Lei (1952-1953), Han Hulin(2000) et Xu Yuanchong (2000). Après une description des difficultés inhérentes à la construction d'un corpus parallèle français-chinois, nous effectuons successivement diverses mesures textométriques sur ce corpus, dans le but de mettre en évidence des usages lexicaux et syntaxiques propres à chacun des traducteurs. La remise en contexte dans le corpus parallèle des différences statistiques des phénomènes linguistiques entre traductions et l'examen des facteurs socioculturels relatifs à chacune des époques font ressortir des indicateurs du style de chaque traducteur. La recherche détaillée de type traductologique, portant sur les particules chinoises, appuyée sur des comparaisons textométriques, fournit une série d'indices révélant des approches spécifiques à chacun des traducteurs dans son travail. Les résultats de cette enquête, menée à travers la comparaison des trois versions chinoisesentre elles, puis avec le texte original français jettent les bases d'une proposition de modèle d'analyse centré sur le style du traducteur. Nous pensons que notre travail ouvre une voie à une exploration scientifique et systématique de la notion de style du traducteur dans le cadre traductologique. Textométrie Traductologie Corpus parallèle français-chinois Style du traducteur Jean-Christophe
7	Constitution d'une ressource sémantique arabe à partir d'un corpus multilingue aligné Abdulhay, Authoul 23 November 2012 (has links) (PDF) Cette thèse vise à la mise en œuvre et à l'évaluation de techniques d'extraction de relations sémantiques à partir d'un corpus multilingue aligné. Ces relations seront extraites par transitivité de l'équivalence traductionnelle, deux lexèmes possédant les mêmes équivalents dans une langue cible étant susceptibles de partager un même sens. D'abord, nos observations porteront sur la comparaison sémantique d'équivalents traductionnels dans des corpus multilingues alignés. A partir des équivalences, nous tâcherons d'extraire des "cliques", ou sous-graphes maximaux complets connexes, dont toutes les unités sont en interrelation, du fait d'une probable intersection sémantique. Ces cliques présentent l'intérêt de renseigner à la fois sur la synonymie et la polysémie des unités, et d'apporter une forme de désambiguïsation sémantique. Elles seront créées à partir de l'extraction automatique de correspondances lexicales, basée sur l'observation des occurrences et cooccurrences en corpus. Le recours à des techniques de lemmatisation sera envisagé. Ensuite nous tâcherons de relier ces cliques avec un lexique sémantique (de type Wordnet) afin d'évaluer la possibilité de récupérer pour les unités arabes des relations sémantiques définies pour des unités en anglais ou en français. Ces relations permettraient de construire automatiquement un réseau utile pour certaines applications de traitement de la langue arabe, comme les moteurs de question-réponse, la traduction automatique, les systèmes d'alignement, la recherche d'information, etc. Réseaux sémantiques Cliques Alignement Corpus parallèle Wordnet
8	Méthodes d'acquisition terminologique en arabe : Application au domaine médical / Terminology acquisition methods in Arabic : Application in the medical domain Neifar, Wafa 18 March 2019 (has links) L'objectif de cette thèse est de lever les verrous que constituent le manque de disponibilité de ressources ou d'outils TAL pour la langue arabe dans les domaines de spécialité en proposant des méthodes permettant l'extraction de termes à partir de textes en arabe standard moderne. Dans ce contexte, nous avons d'abord construit un corpus parallèle anglais-arabe dans un domaine de spécialité. Il s'agit d'un ensemble de textes médicaux produits par la bibliothèque nationale de médecine américaine (NLM). Par la suite, nous avons proposé des méthodes d'acquisition terminologique, permettant d'extraire des termes ou d'acquérir des relations entre ces termes, pour la langue arabe en se basant sur: i)adaptation d'un extracteur terminologique existant pour la languefrançaise ou anglaise, ii) l'exploitation de la translittération des termes anglais en caractères arabes et iii) l'application de la la notion de transfert translingue. Appliqué au niveau terminologique, le transfert consiste à mettre en œuvre un processus d'extraction de termes ou d'acquisition de relations entre termes sur des textes d'une langue source (ici, le français ou l'anglais) puis à transférer les informations extraites sur des textes d'une langue cible (ici, l’arabe standard moderne) pour ainsi identifier le même type d'informations terminologiques. Nous avons évalué les listes de termes monolingues et bilingues obtenues lors des différentes expériences que nous avons réalisées, suivant une méthode transparente, directe et semi-automatique: les termes candidats extraits sont confrontés à une terminologie de référence avant d'être vérifiés manuellement. Cette évaluation suit un protocole que nous avons proposé. / The goal of this thesis is to reduce the lack of available resources and NLP tools for Arabic language in specialised domains by proposing methods allowing the extraction of terms from texts in Modern Standard Arabic. In this context, we first constructed an English-Arabic parallel corous in a specific domain.It is a set of medical texts produced by the US National Library of Medicine (NLM). Thereafter, we have proposed terminological acquisition methods, toextract terms or acquire relations between these terms, for Arabic based on: i) the adaptation of an existing terminology extractor for French or English, ii) the transliteration of English terms in Arabic characters and iii) cross-lingual transfer. Applied at the terminological level, transfer aims to implement a process of term extraction or relationship acquisition between terms in the texts of a source language (here, French or English) and then to transfer the extracted information to target language texts (in this case, Modern Standard Arabic), thereby identifying the same type of terminologicalinformation. We have evaluated the monolingual and bilingual term lists that we have obtained by the experiments we carried out, according to a transparent, direct and semi-automatic method: the extracted term candidates are confronted with a reference terminology before being validated manually. This evaluation follows a protocol that we proposed. Acquisition terminologique Transfert multilangue Langue arabe Corpus parallèle Translittération Terminology Acquisition Multilingual transfer Arabic language Parallel Corpus Transliteration
9	Analyse de la variation terminologique en corpus parallèle anglais-espagnol et de son incidence sur l'extraction des termes bilingue Carreño Cruz, Sahara Iveth January 2004 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Variation terminologique Variante terminologique Terme de base Terme simple Terme complexe Extraction automatique de termes Extraction de termes bilingue Corpus parallèle Corpus aligné Terminologie de l'environnement
10	Étude sur l'équivalence de termes extraits automatiquement d'un corpus parallèle : contribution à l'extraction terminologique bilingue Le Serrec, Annaïch January 2008 (has links) Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal. Terminologie bilingue Corpus spécialisé Corpus parallèle Extraction semi-automatique de termes Équivalence Changement climatique Bilingual terminology Specialized corpora Aligned corpora Semi automatic extraction Equivalence Climate change

Search results