• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • 1
  • Tagged with
  • 3
  • 3
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Distributional models of multiword expression compositionality prediction / Modèles distributionnels pour la prédiction de compositionnalité d’expressions polylexicales

Cordeiro, Silvio Ricardo 18 December 2017 (has links)
Les systèmes de traitement automatique des langues reposent souvent sur l'idée que le langage est compositionnel, c'est-à-dire que le sens d'une entité linguistique peut être déduite à partir du sens de ses parties. Cette supposition ne s’avère pas vraie dans le cas des expressions polylexicales (EPLs). Par exemple, une "poule mouillée" n'est ni une poule, ni nécessairement mouillée. Les techniques pour déduire le sens des mots en fonction de leur distribution dans le texte ont obtenu de bons résultats sur plusieurs tâches, en particulier depuis l'apparition des word embeddings. Cependant, la représentation des EPLs reste toujours un problème non résolu. En particulier, on ne sait pas comment prédire avec précision, à partir des corpus, si une EPL donnée doit être traitée comme une unité indivisible (p.ex. "carton plein") ou comme une combinaison du sens de ses parties (p.ex. "eau potable"). Cette thèse propose un cadre méthodologique pour la prédiction de compositionnalité d'EPLs fondé sur des représentations de la sémantique distributionnelle, que nous instancions à partir d’une variété de paramètres. Nous présenterons une évaluation complète de l'impact de ces paramètres sur trois nouveaux ensembles de données modélisant la compositionnalité d'EPLs, en anglais, français et portugais. Finalement, nous présenterons une évaluation extrinsèque des niveaux de compositionnalité prédits par le modèle dans le contexte d’un système d'identification d'EPLs. Les résultats suggèrent que le choix spécifique de modèle distributionnel et de paramètres de corpus peut produire des prédictions de compositionnalité qui sont comparables à celles présentées dans l'état de l'art. / Natural language processing systems often rely on the idea that language is compositional, that is, the meaning of a linguistic entity can be inferred from the meaning of its parts. This expectation fails in the case of multiword expressions (MWEs). For example, a person who is a "sitting duck" is neither a duck nor necessarily sitting. Modern computational techniques for inferring word meaning based on the distribution of words in the text have been quite successful at multiple tasks, especially since the rise of word embedding approaches. However, the representation of MWEs still remains an open problem in the field. In particular, it is unclear how one could predict from corpora whether a given MWE should be treated as an indivisible unit (e.g. "nut case") or as some combination of the meaning of its parts (e.g. "engine room"). This thesis proposes a framework of MWE compositionality prediction based on representations of distributional semantics, which we instantiate under a variety of parameters. We present a thorough evaluation of the impact of these parameters on three new datasets of MWE compositionality, encompassing English, French and Portuguese MWEs. Finally, we present an extrinsic evaluation of the predicted levels of MWE compositionality on the task of MWE identification. Our results suggest that the proper choice of distributional model and corpus parameters can produce compositionality predictions that are comparable to the state of the art.
2

L’emploi d’unités polylexématiques idiomatiques à l’oral : Aspects linguistiques et psycho-cognitifs (corpus allemand et français) / The use of polylexematic idiomatic units in oral interaction : linguistic and psycho-cognitive aspects (German and French corpus)

Espinat, Marine 05 December 2015 (has links)
Ce travail s’est donné pour objectif d’étudier les unités polylexématiques (mots complexes, groupes ou énoncés) idiomatiques telles qu’elles sont employées dans l’interaction orale. L’étude s’inscrit dans la perspective de l’analyse conversationnelle, d’une part, reposant sur un corpus (allemand et français) de radio libre antenne comprenant douze heures d’enregistrement, et dans la perspective de l’analyse du discours, d’autre part, puisqu’une large place est accordée au type de discours à l’œuvre, marqué par les récits d’émotions et d’expérience. Quelles spécificités caractérisent les unités polylexématiques idiomatiques dans leur emploi ? Quelles particularités, sur le plan cognitif notamment, se font jour ? Quelle est leur ampleur réelle dans l’interaction orale ? Entravent-elles ou facilitent-elles l’intercompréhension ? Tels sont les questionnements au cœur de ce travail. L’environnement discursif des unités étudiées révèle, à l’échelle nanostructurelle, des caractéristiques telles que leur polyfonctionnalité communicative et leur nodalité dans le discours. À une échelle microstructurelle, l’analyse des échanges met au jour des fonctions (d’illustration, de dissimulation, et de représentation) et une disposition à la persistance cognitive de ces unités. Dans ces observations transparaissent les propriétés fondamentales des unités au cœur de ce travail : la stabilité et l’idiomaticité. Elles prennent cependant une tout autre dimension, et revêtent d’autres formes d’apparition, dans la confrontation à un corpus d’interaction orale. / This work set out to study polylexematic units (complex words, phrases or utterances) in their use in oral interaction. The research is grounded in the framework of conversation analysis on the one hand, with the data coming from a German and French corpus comprised of twelve hours worth’ of phone-in radio. It also relies on discourse analysis insofar as particular attention is paid to the type of discourse under scrutiny, marked by emotionally and experientially charged stories. What specific features characterize idiomatic polylexematic units in use? What specificities are brought to light, especially at the cognitive level? What is their actual extent in oral interaction? Do they hinder or facilitate mutual understanding? Those are the issues at stake in this work. At the nanostructural level, the discursive environment of the units under scrutiny reveals features such as their communicative polyfunctionality or their nodality in speech. At the microstructural level, the analysis of the exchanges brings to light functions of illustration, dissimulation and representation as well as these units’ disposition for cognitive persistence. These observations make apparent the fundamental properties of the units at stake in this work: stability and idiomaticity. They nevertheless take on a whole new dimension and appear in different forms when confronted to a corpus of oral interaction.
3

Unifying concerns and entente : locating and pursuing the idiomaticity of free improvisation / Préoccupations unificatrices et "entente" : Situer et retracer l'idiomaticité de l'improvisation libre

Bourgeois, André Louis 19 January 2017 (has links)
Cette thèse étudie la question de l'idiomaticité dans la pratique musicale de l'improvisation libre. Notre enquête débute avec une discussion sur les difficultés qu'implique toute tentative de délimiter cette activité ou de la définir en termes positifs. En effet, le produit d'une performance improvisée émerge au moment de la prestation et s'évanouit immédiatement. Ce fait a poussé de nombreux musiciens et chercheurs à classer cette pratique comme étant « non-idiomatique » (et donc comme étant résistante à l'analyse sémiotique), une désignation qui a été popularisée par Derek Bailey dans son oeuvre pionnière Improvisation. Cependant, malgré son apparent caractère insaisissable, le genre a été capable de subsister depuis plusieurs décennies et continue a se propager à de nouvelles scènes musicales à travers le monde, supporté par un ensemble relativement consistant de préoccupations idéologiques et esthétiques quiunissent et habilitent ses praticiens et admirateurs. En utilisant un modèle sémiotique triadique dans la tradition de C.S. Peirce et en considérant les différents aspects de l'improvisation libre à la lumière de sa théorie des catégories, nous sommes capables d'élaborer une analyse sémiotique des aspects émergents/évanescents de l'improvisation libre, ainsi que de ses propriétés plus durables/idiomatiques. L'improvisation libre n'est pas du tout, comme aiment l'affirmercertains, libre de toutes conventions. Un des accomplissements de cette thèse est de déconstruire de mythe de la non-idiomaticité de l'improvisation libre et de démontrer que les engagements idiomatiques particuliers de cette pratique ont tout simplement été déplacés, abandonnant pour la plupart les idiomes formels (tels des approches génériques, codifiées et reconnaissables à la tonalité et au rythme) pour privilégier des codes de conduite qui rendent l'activité cohérente et signifiante à ses participants. Les témoignages d'improvisateurs révèlent qu'ils sont largement motivés par des préoccupations et principes similaires. Quant à la valeur momentanée reconnue de n'importe quel aspect formel d'une performance improvisée, c'est grâce à l'implémentation soudaine de conventions localisées et habituellement de trèscourte durée (que nous appelons « entente ») que les musiciens arrivent à cette reconnaissance mutuelle (mais toujours contingente). Les improvisateurs tendent à vouloir déconstruire ces conventions formelle émergentes assez rapidement. Ils comptent ne laisser aucun engagement formel se solidifier au delà d'un certain caractère liminaire qu'ils jugent désirable dans le cadre de leur activité. Finalement, n'importe quel indicateur pour mesurer le succès d'une performance improvisée doit se référer soit aux principes unificateurs qui soutendent la pratique et représentent le coeur de sonidiomaticité, soit aux exigences momentanées imposées par l'entente. / This thesis studies the question of idiomaticity in the musical practice of free improvisation. Our enquiry begins with a discussion on the difficulties of delineating this activity and of defining it in positive terms. The production of improvised performances indeed emerges at the moment of its delivery and is immediately fleeting. This has led many musicians and writers to classify the practice as "non-idiomatic" (and thus resistant to semiotic analysis), a designation popularized by Derek Bailey in his pioneering book Improvisation. Yet despite its apparent elusiveness, the genre has been able to endure for several decades and keeps spreading to new music scenes throughout the world, supported by relatively consistent ideological and aesthetic preoccupations that unify and enable its practitioners and fans. By using a triadic semiotic model in the tradition of C.S. Peirce and by considering the different aspects of free improvisation in the light of his theory of categories, we are able to give a semiotic account of both the emergent/evanescent and the enduring/idiomatic aspects of free improvisation. Free improvisation is not at all, as some would hope, free from all conventions. One of the accomplishments of this thesis is to deconstruct the myth of free improvisation's non-idiomaticity and demonstrate that the practice's particular idiomatic commitments have merely been shifted away from formal idioms (such as generically codified and recognizable approaches to tonality and rhythm) and onto codes of conduct that keep the activity coherent and significant for its participants. Musician testimonies reveal that the practices of free improvisers are indeed motivated by similar underlying concerns and principles. As for agreements on the momentary value of any of the improvised performance's formal aspects, they find mutual (if contingent) recognition through short-lived localized formal conventions that we call "entente". Improvisers, however, typically playfully deconstruct these emergent formal conventions rather expeditiously; they are intent on not letting any formal commitments solidify beyond a desired liminal capacity. In the end, any gauge for the success of an improvised performance must refer either to the underlying unifying principles that make up the core of its idiomaticity or to the momentary exigencies of entente.

Page generated in 0.0641 seconds