Global ETD Search

31	Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes. Méthode basée sur l'identification automatique des chaînes de référence Longo, Laurence 12 December 2013 (has links) (PDF) Cette thèse se situe dans le domaine du Traitement Automatique des Langues et vise à optimiser la classification des documents dans les moteurs de recherche. Les travaux se concentrent sur le développement d'un outil de détection automatique des thèmes des documents (ATDS-fr). Utilisant peu de connaissances, la méthode hybride adoptée allie des techniques statistiques de segmentation thématique à des méthodes linguistiques identifiant des marqueurs de cohésion. Parmi eux, les chaînes de référence - séquence d'expressions référentielles se rapportant à la même entité du discours (e.g. Paul...il...cet homme) - ont fait l'objet d'une attention particulière, car elles constituent un indice textuel important dans la détection des thèmes (i.e. ce sont des marqueurs d'introduction, de maintien et de changement thématique). Ainsi, à partir d'une étude des chaînes de référence menée dans un corpus issu de genres textuels variés (analyses politiques, rapports publics, lois européennes, éditoriaux, roman), nous avons développé un module d'identification automatique des chaînes de référence RefGen qui a été évalué suivant les métriques actuelles de la coréférence. RefGen Détection automatique de thèmes chaînes de référence traitement automatique des langues sémantique lexicale coréférence genres textuels segmentation thématique marqueurs linguistiques cohésion linguistique de corpus
32	Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence / Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification Longo, Laurence 12 December 2013 (has links) Cette thèse se situe dans le domaine du Traitement Automatique des Langues et vise à optimiser la classification des documents dans les moteurs de recherche. Les travaux se concentrent sur le développement d’un outil de détection automatique des thèmes des documents (ATDS-fr). Utilisant peu de connaissances, la méthode hybride adoptée allie des techniques statistiques de segmentation thématique à des méthodes linguistiques identifiant des marqueurs de cohésion. Parmi eux, les chaînes de référence – séquence d’expressions référentielles se rapportant à la même entité du discours (e.g. Paul…il…cet homme) – ont fait l’objet d’une attention particulière, car elles constituent un indice textuel important dans la détection des thèmes (i.e. ce sont des marqueurs d’introduction, de maintien et de changement thématique). Ainsi, à partir d’une étude des chaînes de référence menée dans un corpus issu de genres textuels variés (analyses politiques, rapports publics, lois européennes,éditoriaux, roman), nous avons développé un module d’identification automatique des chaînes de référence RefGen qui a été évalué suivant les métriques actuelles de la coréférence. / This thesis in the field of Natural Language Processing aims at optimizing documents classification in search engines. This work focuses on the development of a tool that automatically detects documents topics (ATDS-fr). Using poor knowledge, the hybrid method combines statistical techniques for topic segmentation and linguistic methods that identify cohesive markers. Among them, reference chains - sequences of referential expressions referring to the same entity (e.g. Paul ... he ... this man) - have been given special attention as they are important topic markers (i.e. they are markers of topic introduction, maintenance and change). Thus, from a study of reference chains extracted from a corpus composed of various textual genres (newspapers, public reports, European laws, editorials and novel) we developed RefGen, an automatic reference chains identification module, which was evaluated according to current coreference metrics. Détection automatique de thèmes Chaînes de référence Traitement automatique des langues Sémantique lexicale Coréférence Genres textuels Segmentation thématique Marqueurs linguistiques Cohésion Linguistique de corpus Topic detection Reference chains Natural language processing Lexical semantics Coreference Textual genre Topic segmentation Linguistic markers Cohesion Corpus linguistics 401.4 004.678
33	Étude sémantique des mots "chance", "fortune", "hasard" et "risque" du XVIIIe au XXIe siècle : perspectives sur le lexique du français et ses usages / A semantic study of the words "chance", "fortune", "hasard" and "risque" from the eighteenth century onward : approaches to the French lexicon and its uses Courbon, Bruno 09 September 2009 (has links) La recherche a pour objet la structuration du champ lexical des mots « chance », « fortune », « hasard » et « risque » du XVIIIe au XXIe siècle. Témoin de mutations qu’a connues la civilisation occidentale durant cette période, ce champ, qui se rattache à la notion de fortune / hasard, présente une relative homogénéité sémantique.Les mots (et leurs dérivés) sont étudiés à travers le déploiement, la régulation et la répartition des normes d’usages, non seulement en français hexagonal, mais aussi en français québécois. L’étude se fonde sur l’exploitation de deux types de corpus. D’une part, un corpus d’articles extraits d’une cinquantaine de dictionnaires sert à mettre en évidence la productivité morphosémantique et sémantique de ces unités dans une perspective historique large. D’autre part, un grand ensemble d’énoncés diversifiés permet, par la mise au jour de types de contextes, d’effectuer un suivi diachronique des usages. L’approche continuiste des différences d’usages s’appuie sur une représentation fréquentielle des changements sémantiques.La thèse apporte une contribution à la question de la variation des usages et du changement sémantique, qui ouvre sur plusieurs perspectives. Elle se veut d’abord une réflexion sur la théorie et la méthodologie descriptives, appréhendées à la lumière de l’analyse de la nature et du rôle des corpus. Elle met ensuite en évidence l’importance de la dimension intersubjective dans l’activité de signification, en particulier le rôle déterminant des structures syntagmatiques dans l’établissement de nouveaux usages sémantiques. Enfin, elle permet de mettre en relation le changement sémantique avec les conditions sociohistoriques et les représentations collectives. / The present study deals with the way in which the lexical field regrouping the words “chance”, “fortune”, “hazard” and “risqué” has been structured in the French language from the eighteenth century till the present day. Revealing major changes in western societies during this period of time, the field, which corresponds to the linguistic representation of the notion of fortune / hasard, presents a certain coherence.We have examined these words and their derived forms through the display, regulation, and distribution of norms of use, not only in Hexagonal French, but also in Quebec French. Two types of corpora have been analysed. On the one hand, a corpus of articles from around 50 dictionaries has been used to emphasize the lexical and semantic productivity of the different units on a large historical scale. On the other hand, in revealing context types, a set of texts reflecting French language varieties has allowed for carrying out a diachronic analysis of lexical uses. The continuist approach to semantic differences rests upon a frequential representation of semantic changes.The thesis brings a significant contribution to the question of usage variations and semantic change, providing new perspectives. It first deals with theory and methodology of lexical description, considered through the analysis of the nature and the role of corpora. It then evidences the central role of syntagmatic structures in the setting of new semantic uses. The study has finally put into relation semantic changes with their historical background and the collective representations of the time. Sémantique lexicale Champ lexical Unité lexicale Chance Fortune Hasard Risque Diachronie Diatopie Néologie Structure Syntagmatique Actanciel Évolution Changement sémantique Usages Représentations sociales Variation Corpus Linguistics Historical semantics Historical lexicology Hexagonal French French-speaking world Lexical semantics Lexicology Lexicography Lexical field Lexical unit Diachrony Dialects Neology Structure Lexical combinations Semantic roles Semantic change Social representations
34	La polysémie des noms de parties du corps humain en français : analyse sémantique de artère, bouche, coeur épaule et pied / Polysemy of French human body part nouns : semantic analysis of artère, bouche, cœur, épaule and pied Bertin, Thomas 26 October 2018 (has links) Cette étude s'inscrit dans le champ de la sémantique lexicale et explore plus particulièrement la question de la polysémie dans le domaine nominal. Dans une première étape, on explicite les enjeux théoriques d'une telle recherche. Cela conduit à accorder une place centrale au concept d'invariant sémantique pour rendre compte de l'identité sémantique d'un nom (en langue) par-delà sa variation de sens (en contexte). Dans une deuxième étape, on circonscrit l'objet empirique – les noms de parties du corps humain en français contemporain – tout en justifiant ce terrain d'étude. Puis, on précise l'approche méthodologique. La suite de la thèse est consacrée à l'investigation empirique proprement dite. Il s'agit d'abord d'offrir une description générale du potentiel de variation sémantique des noms de parties du corps humain en français. Ensuite, c'est une analyse sémantique approfondie du nom cœur qui est proposée. D'une part, on formule un invariant sémantique susceptible de subsumer tous ses emplois (au cœur du sujet, Paul a mal au cœur, avoir à cœur de réussir...). D'autre part, on montre en quoi la diversité de ses emplois présente un caractère finalement régulier. Enfin, quatre autres noms (artère, épaule, bouche et pied) font également l'objet d'une analyse spécifique. Chacune de ces quatre études est l'occasion d'éprouver la pertinence du concept d'invariant sémantique pour rendre compte de la polysémie dans le domaine nominal. / This study comes within the scope of lexical semantics. More specifically, it deals with the topic of polysemy in the nominals. As a first step, theoretical issues of such a research are clarified. It leads to focus on the concept of semantic invariant to give an insight into the semantic identity of a given noun regardless of its contextual variations. As a second step, the empirical object of this research – human body part nouns in contemporary French – is delimited. This gives an opportunity to justify the choice of these nouns as a field of research and to set out the methodological approach. The rest of the dissertation consists in the empirical investigation itself. First of all, an overall description of the semantic variation of the French human body part nouns is provided. Then, a semantic analysis of the noun cœur (“heart”) is developed: on one hand, a semantic invariant – suiting all cœur's contextual variations (au cœur du sujet, Paul a mal au cœur, avoir à cœur de réussir…) – is formulated; on the other hand, it is shown how this variation is deeply regular. Eventually, four more nouns (artère “artery”, épaule “shoulder”, bouche “mouth” and pied “foot”) are studied from a semantic point of view. Each of these four studies offers a new opportunity to test the relevance of the semantic invariant concept in order to give an account of the polysemy in the nominals. Sémantique lexicale Domaine nominal Polysémie Invariant sémantique Nom de partie de corps humain Coeur Artère Épaule Bouche Pied Lexical semantics Nominals Polysemy Semantic invariant Human body part noun Coeur ("heart") Artère ("artery") Épaule ("shoulder") Bouche ("mouth") Pied ("foot") 401.4

Search results

Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes. Méthode basée sur l'identification automatique des chaînes de référence

La polysémie des noms de parties du corps humain en français : analyse sémantique de artère, bouche, coeur épaule et pied / Polysemy of French human body part nouns : semantic analysis of artère, bouche, cœur, épaule and pied