• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 5
  • Tagged with
  • 5
  • 5
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modèles et outils pour des bases lexicales "métier" multilingues et contributives de grande taille, utilisables tant en traduction automatique et automatisée que pour des services dictionnairiques variés / Methods and tools for large multilingual and contributive lexical databases, usable as well in machine (aided) translation as for various dictonary services

Zhang, Ying 28 June 2016 (has links)
Notre recherche se situe en lexicographie computationnelle, et concerne non seulement le support informatique aux ressources lexicales utiles pour la TA (traduction automatique) et la THAM (traduction humaine aidée par la machine), mais aussi l'architecture linguistique des bases lexicales supportant ces ressources, dans un contexte opérationnel (thèse CIFRE avec L&M).Nous commençons par une étude de l'évolution des idées, depuis l'informatisation des dictionnaires classiques jusqu'aux plates-formes de construction de vraies "bases lexicales" comme JIBIKI-1 [Mangeot, M. et al., 2003 ; Sérasset, G., 2004] et JIBIKI-2 [Zhang, Y. et al., 2014]. Le point de départ a été le système PIVAX-1 [Nguyen, H.-T. et al., 2007 ; Nguyen, H. T. & Boitet, C., 2009] de bases lexicales pour systèmes de TA hétérogènes à pivot lexical supportant plusieurs volumes par "espace lexical" naturel ou artificiel (UNL). En prenant en compte le contexte industriel, nous avons centré notre recherche sur certains problèmes, informatiques et lexicographiques.Pour passer à l'échelle, et pour profiter des nouvelles fonctionnalités permises par JIBIKI-2, dont les "liens riches", nous avons transformé PIVAX-1 en PIVAX-2, et réactivé le projet GBDLEX-UW++ commencé lors du projet ANR TRAOUIERO, en réimportant toutes les données (multilingues) supportées par PIVAX-1, et en les rendant disponibles sur un serveur ouvert.Partant d'un besoin de L&M concernant les acronymes, nous avons étendu la "macrostructure" de PIVAX en y intégrant des volumes de "prolexèmes", comme dans PROLEXBASE [Tran, M. & Maurel, D., 2006]. Nous montrons aussi comment l'étendre pour répondre à de nouveaux besoins, comme ceux du projet INNOVALANGUES. Enfin, nous avons créé un "intergiciel de lemmatisation", LEXTOH, qui permet d'appeler plusieurs analyseurs morphologiques ou lemmatiseurs, puis de fusionner et filtrer leurs résultats. Combiné à un nouvel outil de création de dictionnaires, CREATDICO, LEXTOH permet de construire à la volée un "mini-dictionnaire" correspondant à une phrase ou à un paragraphe d'un texte en cours de "post-édition" en ligne sous IMAG/SECTRA, ce qui réalise la fonctionnalité d'aide lexicale proactive prévue dans [Huynh, C.-P., 2010]. On pourra aussi l'utiliser pour créer des corpus parallèles "factorisés" pour construire des systèmes de TA en MOSES. / Our research is in computational lexicography, and concerns not only the computer support to lexical resources useful for MT (machine translation) and MAHT (Machine Aided Human Translation), but also the linguistic architecture of lexical databases supporting these resources in an operational context (CIFRE thesis with L&M).We begin with a study of the evolution of ideas in this area, since the computerization of classical dictionaries to platforms for building up true "lexical databases" such as JIBIKI-1 [Mangeot, M. et al., 2003 ; Sérasset, G., 2004] and JIBIKI-2 [Zhang, Y. et al., 2014]. The starting point was the PIVAX-1 system [Nguyen, H.-T. et al., 2007 ; Nguyen, H. T. & Boitet, C., 2009] designed for lexical bases for heterogeneous MT systems with a lexical pivot, able to support multiple volumes in each "lexical space", be it natural or artificial (as UNL). Considering the industrial context, we focused our research on some issues, in informatics and lexicography.To scale up, and to add some new features enabled by JIBIKI-2, such as the "rich links", we have transformed PIVAX-1 into PIVAX-2, and reactivated the GBDLEX-UW++ project that started during the ANR TRAOUIERO project, by re-importing all (multilingual) data supported by PIVAX-1, and making them available on an open server.Hence a need for L&M for acronyms, we expanded the "macrostructure" of PIVAX incorporating volumes of "prolexemes" as in PROLEXBASE [Tran, M. & Maurel, D., 2006]. We also show how to extend it to meet new needs such as those of the INNOVALANGUES project. Finally, we have created a "lemmatisation middleware", LEXTOH, which allows calling several morphological analyzers or lemmatizers and then to merge and filter their results. Combined with a new dictionary creation tool, CREATDICO, LEXTOH allows to build on the fly a "mini-dictionary" corresponding to a sentence or a paragraph of a text being "post-edited" online under IMAG/SECTRA, which performs the lexical proactive support functionality foreseen in [Huynh, C.-P., 2010]. It could also be used to create parallel corpora with the aim to build MOSES-based "factored MT systems".
2

Méthode et outils pour la création et l'évaluation automatiques de structures de bases lexicales multilingues (symétriques) à lexies et axies

Teeraparbseree, Aree 27 September 2005 (has links) (PDF)
Cette thèse aborde le problème de la structuration de bases lexicales multilingues (BDLM) en lexies et axies, à partir de ressources existantes. Ce travail est motivé par l'inadéquation des techniques existantes utilisées isolément, pour la structuration de BDLM.<br />Pour résoudre ce problème, la stratégie proposée est de composer des techniques existantes de désambiguïsation pour structurer semi-automatiquement des bases lexicales multilingues à lexies et acceptions interlingues. De plus, cette thèse propose une catégorisation des critères d'évaluation de la qualité des BDLM, ainsi que les mesures correspondantes.<br />Cette stratégie a été implémentée dans Jeminie, un système logiciel adaptable qui permet d'implémenter à la fois des méthodes de structuration de BDLM et des mesures de qualité, sous la forme de modules logiciels réutilisables.<br />Des compositions arbitraires de ces modules peuvent être définies par un lexicologue dans un langage de haut niveau d'abstraction, ce qui permet d'adapter facilement la structuration et l'évaluation de qualité en fonction des objectifs du lexicologue et des ressources disponibles sans nécessiter de connaissances en programmation.<br />L'intérêt de cette approche a été validé expérimentalement : la qualité des BDLM obtenues est meilleure par combinaison de techniques qu'avec chaque technique antérieure utilisée seule.
3

La consonne /R/ comme indice de la variation lectale : cas du français en contact avec le créole guadeloupéen / /R/ consonant as indication of lectal variation : case of French language in contact with Guadeloupean Creole

Akpossan, Johanne 20 January 2015 (has links)
Cette thèse a pour objectif de définir l’apport de la phonétique expérimentale dans l’identification d’une variété lectale, en prenant pour exemple les langues parlées en Guadeloupe. En Guadeloupe, deux langues cohabitent : le français et le créole. Mais, dans les faits, il y a une diversité de variétés de français d’une part, et de créole d’autre part. Chacune de ces variétés va de l’acrolecte au basilecte en passant par le mésolecte : il y a donc un continuum français et un continuum créole. La situation sociolinguistique de la Guadeloupe peut être ainsi représentée par un double continuum.Ces différentes variétés de français peuvent-elles se distinguer par des caractéristiques (1) acoustiques, (2) phonétiques, (3) phonologiques et (4) perceptives de la consonne /R/? La durée du contact avec le créole, a t-elle une influence sur la variété de français parlée par un locuteur ?Nos résultats montrent que plus la variété de français est basilectale, (1) plus la diffusion de l’énergie spectrale du /R/ est faible avec un taux de bruit réduit et une hauteur moyenne des fréquences basse ; (2) plus la variante fricatisée du /R/ est rare et plus la variante approximante est fréquente ; (3) plus le taux d’élision du /R/ en coda de syllabe augmente ainsi que le taux de réalisation de /R/ en tant que [w] en contexte labial; (4) plus la variété est perçue comme ayant un faible degré d’accent français. Généralement, plus la durée du contact entre le français et le créole est longue, plus cette variété est basilectale.Si les caractéristiques de la consonne /R/ permettent de discriminer la variété acrolectale de la variété basilectale (variétés extrêmes), il apparait plus difficile d’établir une liste d’indices (ou « lectomètres ») qui permettraient d’identifier les variétés se trouvant dans la zone intermédiaire : le mésolecte est doté d’une certaine imprévisibilité. / The goal of this thesis is to determine the contribution of experimental phonetics in the identification of a lectal variety, in taking for example languages spoken in Guadeloupe. In Guadeloupe, two languages coexist : French and Creole. But in fact, there is a diversity of varieties of French on the one hand, and of Creole on the other hand. Each of these varieties goes from acrolect to basilect through mesolect : so there are a French continuum and a Creole continuum. Thus, the sociolinguistic situation of Guadeloupe can be represented by a double continuum.These different varieties of French can they be distinguished by (1) acoustic, (2) phonetic, (3) phonological (4) and perceptual characteristics of /R/ consonant? Does the contact duration with Creole have an influence on the variety of French spoken by a speaker?Our results show that the more basilectal the variety of French is, (1) the lower spectral diffusion of /R/ energy is, with a reduced rate noise and a low frequency mean; (2) the more infrequent /R/ constrictive variants are and the more common /R/ approximant variants are ; (3) the greater rates of /R/ elision in coda of syllable and /R/ realization as [w] in labial context increase ;(4) and the more the variety is perceived as having a low degree of French accent. Usually, the longer duration of the contact between French and Creole is, the more basilectal the variety of French is.If characteristics of /R/ consonant can distinguish acrolect and basilect (extreme varieties), it’s not so easy to establish a list of indications (or « lectomètres ») in order to identify varieties in the intermediate zone: mesolect has a certain unpredictability.
4

La consonne /R/ comme indice de la variation lectale : cas du français en contact avec le créole guadeloupéen / /R/ consonant as indication of lectal variation : case of French language in contact with Guadeloupean Creole

Akpossan, Johanne 20 January 2015 (has links)
Cette thèse a pour objectif de définir l’apport de la phonétique expérimentale dans l’identification d’une variété lectale, en prenant pour exemple les langues parlées en Guadeloupe. En Guadeloupe, deux langues cohabitent : le français et le créole. Mais, dans les faits, il y a une diversité de variétés de français d’une part, et de créole d’autre part. Chacune de ces variétés va de l’acrolecte au basilecte en passant par le mésolecte : il y a donc un continuum français et un continuum créole. La situation sociolinguistique de la Guadeloupe peut être ainsi représentée par un double continuum.Ces différentes variétés de français peuvent-elles se distinguer par des caractéristiques (1) acoustiques, (2) phonétiques, (3) phonologiques et (4) perceptives de la consonne /R/? La durée du contact avec le créole, a t-elle une influence sur la variété de français parlée par un locuteur ?Nos résultats montrent que plus la variété de français est basilectale, (1) plus la diffusion de l’énergie spectrale du /R/ est faible avec un taux de bruit réduit et une hauteur moyenne des fréquences basse ; (2) plus la variante fricatisée du /R/ est rare et plus la variante approximante est fréquente ; (3) plus le taux d’élision du /R/ en coda de syllabe augmente ainsi que le taux de réalisation de /R/ en tant que [w] en contexte labial; (4) plus la variété est perçue comme ayant un faible degré d’accent français. Généralement, plus la durée du contact entre le français et le créole est longue, plus cette variété est basilectale.Si les caractéristiques de la consonne /R/ permettent de discriminer la variété acrolectale de la variété basilectale (variétés extrêmes), il apparait plus difficile d’établir une liste d’indices (ou « lectomètres ») qui permettraient d’identifier les variétés se trouvant dans la zone intermédiaire : le mésolecte est doté d’une certaine imprévisibilité. / The goal of this thesis is to determine the contribution of experimental phonetics in the identification of a lectal variety, in taking for example languages spoken in Guadeloupe. In Guadeloupe, two languages coexist : French and Creole. But in fact, there is a diversity of varieties of French on the one hand, and of Creole on the other hand. Each of these varieties goes from acrolect to basilect through mesolect : so there are a French continuum and a Creole continuum. Thus, the sociolinguistic situation of Guadeloupe can be represented by a double continuum.These different varieties of French can they be distinguished by (1) acoustic, (2) phonetic, (3) phonological (4) and perceptual characteristics of /R/ consonant? Does the contact duration with Creole have an influence on the variety of French spoken by a speaker?Our results show that the more basilectal the variety of French is, (1) the lower spectral diffusion of /R/ energy is, with a reduced rate noise and a low frequency mean; (2) the more infrequent /R/ constrictive variants are and the more common /R/ approximant variants are ; (3) the greater rates of /R/ elision in coda of syllable and /R/ realization as [w] in labial context increase ;(4) and the more the variety is perceived as having a low degree of French accent. Usually, the longer duration of the contact between French and Creole is, the more basilectal the variety of French is.If characteristics of /R/ consonant can distinguish acrolect and basilect (extreme varieties), it’s not so easy to establish a list of indications (or « lectomètres ») in order to identify varieties in the intermediate zone: mesolect has a certain unpredictability.
5

La consonne /R/ comme indice de la variation lectale : cas du français en contact avec le créole guadeloupéen / /R/ consonant as indication of lectal variation : case of French language in contact with Guadeloupean Creole

Akpossan, Johanne 20 January 2015 (has links)
Cette thèse a pour objectif de définir l’apport de la phonétique expérimentale dans l’identification d’une variété lectale, en prenant pour exemple les langues parlées en Guadeloupe. En Guadeloupe, deux langues cohabitent : le français et le créole. Mais, dans les faits, il y a une diversité de variétés de français d’une part, et de créole d’autre part. Chacune de ces variétés va de l’acrolecte au basilecte en passant par le mésolecte : il y a donc un continuum français et un continuum créole. La situation sociolinguistique de la Guadeloupe peut être ainsi représentée par un double continuum.Ces différentes variétés de français peuvent-elles se distinguer par des caractéristiques (1) acoustiques, (2) phonétiques, (3) phonologiques et (4) perceptives de la consonne /R/? La durée du contact avec le créole, a t-elle une influence sur la variété de français parlée par un locuteur ?Nos résultats montrent que plus la variété de français est basilectale, (1) plus la diffusion de l’énergie spectrale du /R/ est faible avec un taux de bruit réduit et une hauteur moyenne des fréquences basse ; (2) plus la variante fricatisée du /R/ est rare et plus la variante approximante est fréquente ; (3) plus le taux d’élision du /R/ en coda de syllabe augmente ainsi que le taux de réalisation de /R/ en tant que [w] en contexte labial; (4) plus la variété est perçue comme ayant un faible degré d’accent français. Généralement, plus la durée du contact entre le français et le créole est longue, plus cette variété est basilectale.Si les caractéristiques de la consonne /R/ permettent de discriminer la variété acrolectale de la variété basilectale (variétés extrêmes), il apparait plus difficile d’établir une liste d’indices (ou « lectomètres ») qui permettraient d’identifier les variétés se trouvant dans la zone intermédiaire : le mésolecte est doté d’une certaine imprévisibilité. / The goal of this thesis is to determine the contribution of experimental phonetics in the identification of a lectal variety, in taking for example languages spoken in Guadeloupe. In Guadeloupe, two languages coexist : French and Creole. But in fact, there is a diversity of varieties of French on the one hand, and of Creole on the other hand. Each of these varieties goes from acrolect to basilect through mesolect : so there are a French continuum and a Creole continuum. Thus, the sociolinguistic situation of Guadeloupe can be represented by a double continuum.These different varieties of French can they be distinguished by (1) acoustic, (2) phonetic, (3) phonological (4) and perceptual characteristics of /R/ consonant? Does the contact duration with Creole have an influence on the variety of French spoken by a speaker?Our results show that the more basilectal the variety of French is, (1) the lower spectral diffusion of /R/ energy is, with a reduced rate noise and a low frequency mean; (2) the more infrequent /R/ constrictive variants are and the more common /R/ approximant variants are ; (3) the greater rates of /R/ elision in coda of syllable and /R/ realization as [w] in labial context increase ;(4) and the more the variety is perceived as having a low degree of French accent. Usually, the longer duration of the contact between French and Creole is, the more basilectal the variety of French is.If characteristics of /R/ consonant can distinguish acrolect and basilect (extreme varieties), it’s not so easy to establish a list of indications (or « lectomètres ») in order to identify varieties in the intermediate zone: mesolect has a certain unpredictability.

Page generated in 0.0784 seconds