Global ETD Search

1	Analyse comparative de la couverture et de l’acceptabilité des solutions d’un dictionnaire bilingue spécialisé, d’une banque de données terminologiques et d’un concordancier en ligne : application au domaine de la traduction médicale Simard, Tanya 21 August 2013 (has links) La présente étude rend compte de l’utilité de trois ressources pour le traducteur médical, soit le Dictionnaire anglais-français des sciences médicales et paramédicales de Gladstone, la banque de données terminologiques et linguistiques du gouvernement du Canada TERMIUM Plus® et le concordancier en ligne WeBiText, sur la base d’une analyse comparative de leur taux de couverture et du niveau d’acceptabilité des solutions qu’elles proposent. Contrairement à d’autres études, cette recherche mise sur une approche double qui combine un volet quantitatif et qualitatif. À partir d’un ensemble de problèmes de traduction tiré d’un corpus d’étude constitué de huit résumés d’articles scientifiques de revues médicales canadiennes, nous démontrons que le taux de couverture du corpus « Santé » de WeBiText est de 62 %, alors que celui de TERMIUM Plus® est de 37 % et celui du Gladstone de 30 %. Nous montrons par ailleurs que le concordancier fournit environ deux fois plus de solutions que les deux autres ressources. En outre, des données rassemblées dans le cadre d’un questionnaire en ligne auprès de 88 langagiers révèlent que les solutions proposées par WeBiText sont tout aussi acceptables que celles offertes par TERMIUM Plus®, tandis que celles qui figurent dans le Gladstone sont souvent considérées comme inacceptables. Nous en concluons que les corpus parallèles tirés du Web ont une meilleure couverture que les ressources traditionnelles et qu’ils présentent une gamme plus variée de solutions uniques et convenables, notamment pour la traduction de textes médicaux hautement spécialisés. ENGLISH This study reports on the usefulness of three resources for the medical translator, namely Gladstone's English-French dictionary of medical and paramedical sciences, TERMIUM Plus®, the Government of Canada's terminology and linguistic data bank, and WeBiText, an online concordancer, on the basis of a comparative analysis of their coverage and the level of acceptability of the solutions they offer. Unlike other studies, this research adopts a two-fold approach combining quantitative and qualitative perspectives. From a set of translation problems drawn from a corpus of eight scientific paper abstracts from Canadian medical journals, we demonstrate that WeBiText's "Health" corpus has a 62% coverage rate, while that of TERMIUM Plus® is 37% and Gladstone's is 30%. We also show that the concordancer provides roughly twice as many solutions as the other two resources. In addition, data collected through an online survey of 88 language professionals indicates that the solutions found in WeBiText are equally acceptable as those provided by TERMIUM Plus®, while Gladstone's are often considered unacceptable. We conclude that Web parallel corpora have a better coverage than traditional resources and that they offer a broader range of unique and suitable solutions, particularly for the translation of highly specialized medical texts. traduction médicale dictionnaire bilingue banque de données terminologiques concordancier corpus parallèle
2	Analyse comparative de la couverture et de l’acceptabilité des solutions d’un dictionnaire bilingue spécialisé, d’une banque de données terminologiques et d’un concordancier en ligne : application au domaine de la traduction médicale Simard, Tanya January 2013 (has links) La présente étude rend compte de l’utilité de trois ressources pour le traducteur médical, soit le Dictionnaire anglais-français des sciences médicales et paramédicales de Gladstone, la banque de données terminologiques et linguistiques du gouvernement du Canada TERMIUM Plus® et le concordancier en ligne WeBiText, sur la base d’une analyse comparative de leur taux de couverture et du niveau d’acceptabilité des solutions qu’elles proposent. Contrairement à d’autres études, cette recherche mise sur une approche double qui combine un volet quantitatif et qualitatif. À partir d’un ensemble de problèmes de traduction tiré d’un corpus d’étude constitué de huit résumés d’articles scientifiques de revues médicales canadiennes, nous démontrons que le taux de couverture du corpus « Santé » de WeBiText est de 62 %, alors que celui de TERMIUM Plus® est de 37 % et celui du Gladstone de 30 %. Nous montrons par ailleurs que le concordancier fournit environ deux fois plus de solutions que les deux autres ressources. En outre, des données rassemblées dans le cadre d’un questionnaire en ligne auprès de 88 langagiers révèlent que les solutions proposées par WeBiText sont tout aussi acceptables que celles offertes par TERMIUM Plus®, tandis que celles qui figurent dans le Gladstone sont souvent considérées comme inacceptables. Nous en concluons que les corpus parallèles tirés du Web ont une meilleure couverture que les ressources traditionnelles et qu’ils présentent une gamme plus variée de solutions uniques et convenables, notamment pour la traduction de textes médicaux hautement spécialisés. ENGLISH This study reports on the usefulness of three resources for the medical translator, namely Gladstone's English-French dictionary of medical and paramedical sciences, TERMIUM Plus®, the Government of Canada's terminology and linguistic data bank, and WeBiText, an online concordancer, on the basis of a comparative analysis of their coverage and the level of acceptability of the solutions they offer. Unlike other studies, this research adopts a two-fold approach combining quantitative and qualitative perspectives. From a set of translation problems drawn from a corpus of eight scientific paper abstracts from Canadian medical journals, we demonstrate that WeBiText's "Health" corpus has a 62% coverage rate, while that of TERMIUM Plus® is 37% and Gladstone's is 30%. We also show that the concordancer provides roughly twice as many solutions as the other two resources. In addition, data collected through an online survey of 88 language professionals indicates that the solutions found in WeBiText are equally acceptable as those provided by TERMIUM Plus®, while Gladstone's are often considered unacceptable. We conclude that Web parallel corpora have a better coverage than traditional resources and that they offer a broader range of unique and suitable solutions, particularly for the translation of highly specialized medical texts. traduction médicale dictionnaire bilingue banque de données terminologiques concordancier corpus parallèle
3	Outils d'exploration de corpus et désambiguïsation lexicale automatique AUDIBERT, Laurent 15 December 2003 (has links) (PDF) Ce travail de thèse adresse le problème de la désambiguïsation lexicale automatique à l'aide de méthodes d'apprentissage supervisé. Dans une première partie, nous proposons un ensemble de puissants outils de manipulation de corpus linguistiques étiquetés. Pour réaliser ces outils, nous avons développé une bibliothèque C++ qui implémente un langage élaboré et expressif d'interrogation de corpus, basé sur des méta-expressions régulières. Dans une seconde partie, nous comparons divers algorithmes d'apprentissage supervisé, que nous utilisons ensuite pour mener à bien une étude systématique et approfondie de différents critères de désambiguïsation, basés sur la cooccurrence de mots et plus généralement de n-grammes. Nos résultats vont parfois à l'encontre de certaines pratiques dans le domaine. Par exemple, nous montrons que la suppression des mots grammaticaux dégrade les performances et que les bigrammes permettent d'obtenir de meilleurs résultats que les unigrammes. [INFO:INFO_OH] Computer Science/Other Désambiguïsation lexicale automatique traitement automatique des langues concordancier analyseur expression régulière corpus lexicalement étiqueté apprentissage supervisé cooccurrences n-grammes
4	Conception et développement d'un outil d'aide à la traduction anglais/arabe basé sur des corpus parallèles / Conception and development of an English/Arabic translation aid tool based on parallel corpora Yahiaoui, Abdelghani 29 May 2017 (has links) Dans cette thèse, nous abordons la réalisation d’un outil innovant d’aide à la traduction anglais/arabe pour répondre au besoin croissant en termes d’outils en ligne d’aide à la traduction centrés sur la langue arabe. Cet outil combine des dictionnaires adaptés aux spécificités de la langue arabe et un concordancier bilingue issu des corpus parallèles. Compte tenu de sa nature agglutinante et non voyellée, le mot arabe nécessite un traitement spécifique. C’est pourquoi, et pour construire nos ressources lexicales, nous nous sommes basés sur l’analyseur morphologique de Buckwalter qui, d’une part, permet une analyse morphologique en tenant compte de la composition complexe du mot arabe (proclitique, préfixe, radical, suffixe, enclitique), et qui, d’autre part, fournit des ressources traductionnelles permettant une réadaptation au sein d’un système de traduction. Par ailleurs, cet analyseur morphologique est compatible avec l’approche définie autour de la base de données DIINAR (DIctionnaire Informatisé de l’Arabe), qui a été construite, entre autres, par des membres de notre équipe de recherche. Pour répondre à la problématique du contexte dans la traduction, un concordancier bilingue a été développé à partir des corpus parallèles Ces derniers représentent une ressource linguistique très intéressante et ayant des usages multiples, en l’occurrence l’aide à la traduction. Nous avons donc étudié de près ces corpus, leurs méthodes d’alignement, et nous avons proposé une approche mixte qui améliore significativement la qualité d’alignement sous-phrastique des corpus parallèles anglais-arabes. Plusieurs technologies informatiques ont été utilisées pour la mise en œuvre de cet outil d’aide à la traduction qui est disponible en ligne (tarjamaan.com), et qui permet à l’utilisateur de chercher la traduction de millions de mots et d’expressions tout en visualisant leurs contextes originaux. Une évaluation de cet outil a été faite en vue de son optimisation et de son élargissement pour prendre en charge d’autres paires de langues. / We create an innovative English/Arabic translation aid tool to meet the growing need for online translation tools centered on the Arabic language. This tool combines dictionaries appropriate to the specificities of the Arabic language and a bilingual concordancer derived from parallel corpora. Given its agglutinative and unvoweled nature, Arabic words require specific treatment. For this reason, and to construct our dictionary resources, we base on Buckwalter's morphological analyzer which, on the one hand, allows a morphological analysis taking into account the complex composition of the Arabic word (proclitic, prefix, stem, suffix, enclitic), and on the other hand, provides translational resources enabling rehabilitation in a translation system. Furthermore, this morphological analyzer is compatible with the approach defined around the DIINAR database (DIctionnaire Informatisé de l’Arabe - Computerized Dictionary for Arabic), which was constructed, among others, by members of our research team. In response to the contextual issue in translation, a bilingual concordancer was developed from parallel corpora. The latter represent a novel linguistic resource with multiple uses, in this case aid for translation. We therefore closely analyse these corpora, their alignment methods, and we proposed a mixed approach that significantly improves the quality of sub-sentential alignment of English-Arabic corpora. Several technologies have been used for the implementation of this translation aid tool which have been made available online (tarjamaan.com) and which allow the user to search the translation of millions of words and expressions while visualizing their original contexts. An evaluation of this tool has been made with a view to its optimization and its enlargement to support other language pairs. Linguistique informatique Traduction assistée par ordinateur Corpus parallèles Concordancier bilingue Dictionnaires Arabe Anglais Computational linguistics Computer-assisted translation Parallel corpora Bilingual concordancer Dictionaries Arabic English 418

1

Page generated in 0.039 seconds