Spelling suggestions: "subject:"sémantique"" "subject:"émantique""
41 |
Extension des systèmes de métamodélisation persistant avec la sémantique comportementale / Handling behavioral semantics in persistent metamodeling systemsBazhar, Youness 13 December 2013 (has links)
L’Ingénierie Dirigée par les Modèles (IDM) a suscité un grand intérêt grâce aux avantages qu’elle offre. Enparticulier, l’IDM vise à accélérer le processus de développement et à faciliter la maintenance des logiciels. Mais avecl'augmentation permanente de la taille des modèles et de leurs instances, l’exploitation des modèles et de leurs instances,en utilisant des outils classiques présente des insuffisances liées au passage à l’échelle. L’utilisation des bases de donnéesest une des solutions proposées pour répondre à ce problème. Dans ce contexte, deux approches ont été proposées. Lapremière consiste à équiper les outils de modélisation avec des bases de données dédiées au stockage de modèles,appelées model repositories (p. ex. EMFStore). Ces bases de données sont équipées de langages d’exploitation limitésseulement à l’interrogation des modèles et des instances. Par conséquent, ces langages n’offrent aucune capacité poureffectuer des opérations avancées sur les modèles telles que la transformation de modèles ou la génération de code. Ladeuxième approche, que nous suivons dans notre travail, consiste à définir des environnements persistants en base dedonnées dédiés à la méta-modélisation. Ces environnements sont appelés systèmes de méta-modélisation persistants(PMMS). Un PMMS consiste en (i) une base de données dédiée au stockage des méta-modèles, des modèles et de leursinstances, et (ii) un langage d'exploitation associé possédant des capacités de méta-modélisation et d’exploitation desmodèles. Plusieurs PMMS ont été proposés tels que ConceptBase ou OntoDB/OntoQL. Ces PMMS supportentprincipalement la définition de la sémantique structurelle et descriptive des méta-modèles et des modèles en terme de(méta-)classes, (méta-)attributs, etc. Par contre, ces PMMS fournissent des mécanismes limités pour définir la sémantiquecomportementale nécessaire à l’exploitation des modèles et des instances. En effet, la sémantique comportementalepourrait être utile pour calculer des concepts dérivés, effectuer des transformations de modèles, générer du code source,etc. Ainsi, nous proposons dans notre travail d'étendre les PMMS avec la possibilité d'introduire dynamiquement desopérations qui peuvent être implémentées en utilisant des mécanismes hétérogènes. Ces opérations peuvent ainsi utiliserdes mécanismes internes au système de gestion de base de données (p. ex. les procédures stockées) tout comme desmécanismes externes tels que les services web ou les programmes externes (p. ex. Java, C++). Cette extension permetd’améliorer les PMMS en leur donnant une plus large couverture de fonctionnalités et une plus grande flexibilité. Pourvalider notre proposition, elle a été implémentée sur le prototype OntoDB/OntoQ et a été mise en oeuvre dans troiscontextes différents : (1) pour calculer les concepts dérivés dans les bases de données à base ontologique, (2) pouraméliorer une méthodologie de conception de base de données à base ontologique et finalement (3) pour faire de latransformation et de l’analyse des modèles des systèmes embarqués temps réel. / Modeling and model management have taken a great interest in software development since they accelerate thesoftware development process and facilitate their maintenance. But, with the increasing size of models and their instances,the management of models and their instances with tools evolving in main memory presents some insufficiencies relatedto scalability. Indeed, classical tools using the central memory have shown their limits when they face large scale modelsand instances. Thus, to overcome the problem of scalability, the management of models in databases becomes a necessity.Indeed, two solutions were proposed. The first one consists in equipping modeling and model management tools withspecific databases, called model repositories, (e.g., EMFStore) dedicated to store metamodels, models and instances.These model repositories are equipped with exploitation languages restricted only to querying capabilities such that modelrepositories serve only as model warehouses as processing model management tasks require loading the whole model tothe central memory. The second solution, on which we focus our approach, consists in defining database environments formetamodeling and model management. These systems, called Persistent MetaModeling Systems (PMMSs), aim atproviding a database environment for metamodeling and model management. Indeed, a PMMS consists in (i) a databasethat stores metamodels, models their instances, and (ii) an associated exploitation language possessing metamodeling andmodel management capabilities. Several PMMSs have been proposed (e.g., ConceptBase, OntoDB/OntoQL) and focusmainly on the structural definition of metamodels and models in terms of (meta-)classes, (meta-)attributes, etc. Yet,existing PMMSs provide limited capabilities to define behavioral semantics for model and data management. Indeed,behavioral semantics could be useful to compute derivations, perform model transformations, generate source code, etc.In our work, we propose to extend PMMSs with the capability to introduce dynamically user-defined model and datamanagement operations. These operations can be implemented using flexible and heterogeneous mechanisms. Indeed,they can use internal database mechanisms (e.g., stored procedures) as well as external mechanisms such as web servicesor external programs (e.g., Java, C++). As a consequence, this extension enhances PMMSs giving them more coverageand further flexibility. This extension has been implemented on the OntoDB/OntoQL prototype, and experimented tocheck the scaling of our approach. Moreover, our proposition has been used in three different contexts. In particular, (1)to compute derived concepts of ontologies, (2) to enhance an ontology-based database design methodology and (3) totransform and analyze models of real-time and embedded systems.
|
42 |
Méthodologie pour l’orchestration sémantique de services, application au traitement de documents multimédia / Methodology for semantic services orchestration, application to multimedia document processingDoucy, Jérémie 17 October 2011 (has links)
Après un état de l'art complet nous avons détaillé notre approche de services sémantiques utilisant une méthode innovante pour la composition de services, les patrons de chaînes de traitements. Notre approche est constituée d'un annuaire sémantique hybride proposant différents niveaux de correspondances entre services, de règles de compositions automatiques dans le cas où une demande de services n'est pas fructueuse et enfin d'un moteur d'exécution supportant la résolution et la composition dynamique de services. Par la suite nous avons défini une méthodologie innovante, basée sur l'utilisation de taxonomies de services permettant de peupler rapidement un annuaire sémantique de services. Pour ce faire, nous avons mis au point une ontologie de haut niveau qui permet de lier la classe d'une taxonomie avec un service abstrait annoté sémantiquement. Enfin, nous avons évalué notre prototype à partir des chaînes de traitement mises en place dans les plate-formes déployées par Cassidian. / After a complete state of the art we detailed our semantic services approach which uses an innovative method for services composition: processing chains patterns. Our approach is composed on an hybrid semantic servicers registry which propose different levels of matching between services, some composition rules when the matching phase failde and an execution engine which is able to dynamically resolve and com^pose services. In order to solve the service regitry population issue, we have designed an upper ontology, which enables links between a service taxonomy class with a semantically annotated abstract service. Finally, we have evaluated our prototype using real processing chains used by Cassidian platforms.
|
43 |
Étude lexico-sémantique et historique de l'émergence et du traitement de la notion de pluralité sémantique en linguistique allemande et française au XIXᵉ siècleGignac, Nicolas 24 October 2024 (has links)
Tableau d'honneur de la Faculté des études supérieures et postdoctorales, 2024 / La littérature contemporaine en histoire de la linguistique et plus spécifiquement de la sémantique s'intéresse au développement épistémologique des théories de formation des mots et du changement de sens. L'intérêt pour ce développement principalement théorique expose cependant une tache aveugle en histoire de la sémantique, soit l'établissement d'un ensemble de signes entourant la notion de pluralité sémantique (communément appelée polysémie depuis la fin du XIX$\mathsf{^e}$ siècle). La présente étude de sémantique lexicale s'intéresse donc à mieux comprendre comment les savants français et allemands du XIX$\mathsf{^e}$ siècle -- principaux instigateurs des recherches sur le sens lexical -- appréhendent lexicalement, sémantiquement et conceptuellement cette pluralité des sens avant sa formalisation à la fin du siècle. L'étude s'appuie sur un corpus du XIX$\mathsf{^e}$ siècle composé de 16 travaux allemands et 14 travaux français portant sur la langue, circonscrits par la littérature contemporaine en histoire de la linguistique pour leur apport clef au développement de la sémantique comme domaine scientifique. Près de 200 termes et formulations entourant la notion de pluralité sémantique (p. ex. *polysémie*, « la multiplicité des acceptions ») ou un aspect de la signification (p. ex. un sens « métaphorique », un sens « propre ») ont été extraits par script informatique, puis triés et annotés manuellement pour alimenter des analyses quantitatives et qualitatives. Celles-ci permettent d'observer en synchronie, en diachronie et d'une tradition culturelle et scientifique à l'autre (franco-allemande) les divers termes et formulations mobilisés dans le corpus ; leur valeur sémantique et leur contexte d'utilisation (p. ex. l'activité métalangagière). Les résultats obtenus et leur interprétation mettent, entre autres, en évidence certaines dissonances avec la littérature contemporaine. En effet, l'on note à travers le corpus une forte stabilité de la valeur sémantique des termes et formulations qui réfèrent à la pluralité sémantique et à ses divers aspects. Mise en saillie par cette stabilité, une instrumentalisation de la pluralité sémantique comme outil descriptif nous laisse voir une conceptualisation frappante et manifeste du phénomène dès le début du XIX$\mathsf{^e}$ siècle. Les résultats invitent donc à nuancer davantage l'établissement de cette nomenclature linguistique liée à la notion de pluralité sémantique et (re) mettent en perspective le pivot de conceptualisation supposé par la littérature contemporaine à partir du terme *polysémie* popularisé par Michel Bréal à la fin du XIX$\mathsf{^e}$ siècle, pivot qui laisse planer l'absence préalable d'une conception proprement linguistique de la pluralité sémantique. Cette étude comble ainsi le vide, en histoire de la linguistique, lié au foisonnement terminologique autour de la notion de pluralité sémantique et de son appréhension sémantique et conceptuelle à l'orée de la formalisation des études sur le sens au XIX$\mathsf{^e}$ siècle, plaide pour une approche nuancée du développement des idées linguistiques et illustre de quelle façon des éléments de la linguistique de corpus peuvent être incorporés dans les études en sémantique (lexicale) et en histoire de la linguistique. / The current literature on the history of linguistics, and semantics in particular, focuses on the epistemological development of theories of word formation and meaning change. However, the interest in this mainly theoretical development reveals a blind spot in the history of semantics, namely the establishment of a set of signs surrounding the notion of semantic plurality (commonly referred to as *polysemy* since the late 19$\mathsf{^th}$ century). The present lexical semantics study aims to understand how nineteenth-century French and German scholars - the main instigators of research on lexical meaning - lexically, semantically, and conceptually grasped this plurality of meanings before its formalization at the end of the century. The study is based on a 19th-century corpus of 16 German and 14 French texts that have been identified in the current literature on the history of linguistics as key contributions to the development of semantics as a scientific field. Nearly 200 terms and phrases surrounding the notion of semantic plurality (e.g., *polysemy*, "the multiplicity of meanings") or an aspect of meaning (e.g., a "metaphorical" meaning, a "proper" meaning) were extracted by computer script, then manually sorted and annotated to feed quantitative and qualitative analyses. These analyses provide a synchronic and diachronic view of the different terms and phrases used in the corpus, as well as their semantic value and context of use (i.e. metalinguistic activity), from one cultural and scientific tradition to another (Franco-German). The results and their interpretation highlight, among other things, some discrepancies with the contemporary literature. Indeed, throughout the corpus there is a strong stability in the semantic value of terms and phrases that refer to semantic plurality and its multiple facets. This stability highlights the instrumentalization of semantic plurality as a descriptive tool, revealing a striking and obvious conceptualization of the phenomenon since the early 19$\mathsf{^th}$ century. The results suggest that the establishment of this linguistic nomenclature associated with the notion of semantic plurality needs to be further refined, and these put into perspective the conceptual pivot assumed by contemporary literature through the use of the term *polysemy*, popularized by Michel Bréal at the end of the 19$\mathsf{^th}$ century; a pivot that suggests the prior lack of a proper linguistic conception of semantic plurality. This study thus fills the gap in the history of linguistics related to the terminological development around the notion of semantic plurality, as well as its semantic and conceptual understanding around the early formalization of 19th-century research into meaning, argues for a nuanced approach to the development of linguistic ideas, and illustrates how elements of corpus linguistics can be incorporated in (lexical) semantics and in the history of linguistics. / Die aktuelle Literatur zur Geschichte der Linguistik konzentriert sich auf die epistemologische Entwicklung der Theorien der Wortbildung und des Bedeutungswandels. Das Interesse an dieser vornehmlich theoretischen Entwicklung lässt jedoch eine Lücke in der Geschichte der Semantik erkennen, nämlich die Entwicklung eines Zeichenensembles um den Begriff der Bedeutungsvielfalt (seit Ende des 19. Jahrhunderts allgemein als *Polysemie* oder *Mehrdeutigkeit* bezeichnet). Die vorliegende Studie zur lexikalischen Semantik versucht daher, besser zu verstehen, wie die französischen und deutschen Gelehrten des 19. Jahrhunderts - die Hauptinitiatoren der Erforschung der lexikalischen Bedeutung - diese Bedeutungsvielfalt lexikalisch, semantisch und konzeptuell erfasst haben, bevor sie am Ende des Jahrhunderts formalisiert wurde. Die Studie stützt sich auf ein Korpus von 16 deutschen und 14 französischen Werken des 19. Jahrhunderts, die in der aktuellen sprachgeschichtlichen Literatur aufgrund ihres entscheidenden Beitrags zur Entwicklung der Semantik als wissenschaftlicher Disziplin beschrieben werden. Nahezu 200 Termini und Formulierungen, die den Begriff der Bedeutungsvielfalt (z.B. *Mehrdeutigkeit*, „die Vielfalt der Bedeutungen") oder einen Aspekt der Bedeutung (z.B. eine „metaphorische" Bedeutung, eine „eigentliche" Bedeutung) umgeben, wurden per Computerskript extrahiert und anschließend manuell sortiert und annotiert, um quantitative und qualitative Analysen zu ermöglichen. Diese erlauben es, die verschiedenen im Korpus verwendeten Termini und Formulierungen, ihren semantischen Wert und ihren Verwendungskontext synchron, diachron und von einer kulturellen und wissenschaftlichen Tradition zur anderen zu untersuchen. Die erzielten Ergebnisse und ihre Interpretation zeigen unter anderem gewisse Dissonanzen mit der aktuellen Literatur. Tatsächlich lässt sich im gesamten Korpus eine starke Stabilität des semantischen Werts von Termini und Formulierungen feststellen, die sich auf die Bedeutungsvielfalt und ihre verschiedenen Aspekte beziehen. Die Instrumentalisierung der Bedeutungsvielfalt als Beschreibungsinstrument, die durch diese Stabilität unterstrichen wird, deutet auf eine auffällige und offensichtliche Konzeptualisierung des Phänomens seit Beginn des 19. Jahrhunderts. Die Ergebnisse laden daher zu einer weiteren Nuancierung der Entwicklung dieser linguistischen Nomenklatur in Verbindung mit dem Konzept der Bedeutungsvielfalt ein und stellen den Dreh- und Angelpunkt der Konzeptualisierung, der in der heutigen Literatur mit dem von Michel Bréal am Ende des 19. Jahrhunderts populär gemachten Begriff der Polysemie angenommen wird. Die Studie schließt somit die Lücke in der Geschichte der Linguistik, die mit der terminologischen Vielfalt des Begriffs der Bedeutungsvielfalt und seiner semantischen und konzeptuellen Erfassung an der Schwelle zur Formalisierung der Bedeutungsstudien des 19. Jahrhunderts verbunden ist, plädiert für eine nuancierte Behandlung der Entwicklung linguistischer Ideen und zeigt, wie Elemente der Korpuslinguistik in der (lexikalischen) Semantik und der Geschichte der Linguistik integriert werden können.
|
44 |
Aide à l'identification de relations lexicales au moyen de la sémantique distributionnelle et son application à un corpus bilingue du domaine de l'environnementBernier-Colborne, Gabriel 08 1900 (has links)
L’analyse des relations lexicales est une des étapes principales du travail terminologique. Cette tâche, qui consiste à établir des liens entre des termes dont les sens sont reliés, peut être facilitée par des méthodes computationnelles, notamment les techniques de la sémantique distributionnelle. En estimant la similarité sémantique des mots à partir
d’un corpus, ces techniques peuvent faciliter l’analyse des relations lexicales.
La qualité des résultats offerts par les méthodes distributionnelles dépend, entre autres, des nombreuses décisions qui doivent être prises lors de leur mise en œuvre, notamment le choix et le paramétrage du modèle. Ces décisions dépendent, à leur tour, de divers facteurs liés à l’objectif visé, tels que la nature des relations lexicales que l’on souhaite détecter; celles-ci peuvent comprendre des relations paradigmatiques classiques telles que la (quasi-)synonymie (p. ex. conserver -> préserver), mais aussi d’autres relations telles que la dérivation syntaxique (p. ex. conserver -> conservation).
Cette thèse vise à développer un cadre méthodologique basé sur la sémantique distributionnelle pour l’analyse des relations lexicales à partir de corpus spécialisés. À cette fin, nous vérifions comment le choix, le paramétrage et l’interrogation d’un modèle distributionnel doivent tenir compte de divers facteurs liés au projet terminologique envisagé : le cadre descriptif adopté, les relations ciblées, la partie du discours des termes à décrire et la langue traitée (en l’occurrence, le français ou l’anglais).
Nous montrons que deux des relations les mieux détectées par l’approche distributionnelle sont la (quasi-)synonymie et la dérivation syntaxique, mais que les modèles qui captent le mieux ces deux types de relations sont très différents. Ainsi, les relations ciblées ont une influence importante sur la façon dont on doit paramétrer le modèle pour obtenir les meilleurs résultats possibles.
Un autre facteur à considérer est la partie du discours des termes à décrire. Nos résultats indiquent notamment que les relations entre verbes sont moins bien modélisées par cette approche que celles entre adjectifs ou entre noms.
Le cadre descriptif adopté pour un projet terminologique est également un facteur important à considérer lors de l’application de l’approche distributionnelle. Dans ce travail, nous comparons deux cadres descriptifs, l’un étant basé sur la sémantique lexicale et l’autre, sur la sémantique des cadres. Nos résultats indiquent que les méthodes distributionnelles détectent les termes qui évoquent le même cadre sémantique moins bien que certaines relations lexicales telles que la synonymie. Nous montrons que cet écart est attribuable au fait que les termes qui évoquent des cadres sémantiques comprennent une proportion importante de verbes et aux différences importantes entre les modèles qui produisent les meilleurs résultats pour la dérivation syntaxique et les relations paradigmatiques classiques telles que la synonymie.
En somme, nous évaluons deux modèles distributionnels différents, analysons systématiquement l’influence de leurs paramètres et vérifions comment cette influence varie en fonction de divers aspects du projet terminologique. Nous montrons de nombreux exemples de voisinages distributionnels, que nous explorons au moyen de graphes, et discutons les sources d’erreurs. Ce travail fournit ainsi des balises importantes pour l’application de méthodes distributionnelles dans le cadre du travail terminologique. / Identifying semantic relations is one of the main tasks involved in terminology work. This task, which aims to establish links between terms whose meanings are related, can be assisted by computational methods, including those based on distributional semantics. These methods estimate the semantic similarity of words based on corpus data, which can help terminologists identify semantic relations.
The quality of the results produced by distributional methods depends on several decisions that must be made when applying them, such as choosing a model and selecting its parameters. In turn, these decisions depend on various factors related to the target application, such as the types of semantic relations one wishes to identify. These can include typical paradigmatic relations such as (near-)synonymy (e.g. preserve -> protect), but also other relations such as syntactic derivation (e.g. preserve -> preservation).
This dissertation aims to further the development of a methodological framework based on distributional semantics for the identification of semantic relations using specialized corpora. To this end, we investigate how various aspects of terminology work must be accounted for when selecting a distributional semantic model and its parameters, as well as those of the method used to query the model. These aspects include the descriptive framework, the target relations, the part of speech of the terms being described, and the language (in this case, French or English).
Our results show that two of the relations that distributional semantic models capture most accurately are (near-)synonymy and syntactic derivation. However, the models that produce the best results for these two relations are very different. Thus, the target relations are an important factor to consider when choosing a model and tuning it to obtain the most accurate results.
Another factor that should be considered is the part of speech of the terms that are being worked on. Among other things, our results suggest that relations between verbs are not captured as accurately as those between nouns or adjectives by distributional semantic models.
The descriptive framework used for a given project is also an important factor to consider. In this work, we compare two descriptive frameworks, one based on lexical semantics and another based on frame semantics. Our results show that terms that evoke the same semantic frame are not captured as accurately as certain semantic relations, such as synonymy. We show that this is due to (at least) two reasons: a high percentage of frame-evoking terms are verbs, and the models that capture syntactic derivation most accurately are very different than those that work best for typical paradigmatic relations such as synonymy.
In summary, we evaluate two different distributional semantic models, we analyze the influence of their parameters, and we investigate how this influence varies with respect to various aspects of terminology work. We show many examples of distributional neighbourhoods, which we explore using graphs, and discuss sources of noise. This dissertation thus provides important guidelines for the use of distributional semantic models for terminology work.
|
45 |
Espaces vectoriels sémantiques : enrichissement et interprétation de requêtes dans un système d'information distribué et hétérogèneVentresque, Anthony 26 September 2008 (has links) (PDF)
Les systèmes d'information font face à un problème de pertinence dans les recherches dû à l'augmentation considérable des données accessibles. De plus, le nombre d'appareils communicants ne cesse de croître et de menacer le modèle client/serveur. Une nouvelle architecture distribuée tend donc à s'imposer : les réseaux pair-à-pair (P2P). Mais ils sont peu économes en ressource réseau (une requête inonde le réseau) et offrent des fonctionnalités limitées (recherche par mots-clés). Dans les deux communautés, RI et systèmes P2P, les recherches penchent vers l'utilisation de sémantique. En informatique, les approches basées sur la sémantique nécessitent souvent de définir des ontologies. Le développement important et distribué des ontologies génère une hétérogénéité sémantique. La solution classique est d'utiliser des correspondances entre parties de deux ontologies. Mais c'est une solution qui est difficile à obtenir et qui n'est pas toujours complète. Souvent les parties non-partagées de deux ontologies ne sont pas gérées, ce qui entraîne une perte d'information. Notre solution : EXSI2D, utilise une expansion particulière, appelée expansion structurante, du côté de l'initiateur de requêtes. Cela lui permet de préciser les dimensions de sa requête sans modifier la requête elle-même. EXSI2D offre aussi la possibilité au fournisseur d'information d'interpréter l'expansion structurante dans sa propre ontologie. Ainsi, il est possible à chaque participant d'un système d'information sémantiquement hétérogène d'utiliser toute son ontologie, y compris les parties non partagées. Nous montrons aussi l'utilisation d'EXSI2D dans un système P2P, grâce à SPARTANBFS, un protocole « frugal » pour systèmes P2P non structurés.
|
46 |
Une algèbre de processus : pour un calcul basé sur la déductionHabbas, Zineb 25 September 1992 (has links) (PDF)
.
|
47 |
Gestion de l'évolution d'un Web sémantique d'entrepriseLuong, Phuc Hiep 14 December 2007 (has links) (PDF)
Le Web Sémantique d'Entreprise (WSE) est une approche particulière de la Gestion des Connaissances d'une entreprise pour la prochaine génération du Web Sémantique. Dans la réalité, les organisations vivent dans un environnement hétérogène, dynamique et en cours d'évolution qui mène souvent à des changements externes et internes requérant l'évolution de leur système de gestion des connaissances. Peu de recherches actuelles font face aux changements du système de gestion des connaissances. L'objectif de cette thèse est de contribuer à lever cette limitation. Dans ce manuscrit, nous présentons une nouvelle approche de la gestion de l'évolution du WSE. Nous nous focalisons en particulier sur l'évolution de l'ontologie et de l'annotation sémantique qui sont deux composants importants du WSE. Nous nous intéressons à deux scénarios d'évolution de l'ontologie : (i) avec trace et (ii) sans trace de changements ontologiques effectués. Ces deux scénarios sont fréquents dans les situations réelles et ils peuvent entraîner des inconsistances au niveau des annotations sémantiques reposant sur cette ontologie modifiée. Pour chacun des contextes d'évolution, nous développons des approches équivalentes : une approche procédurale et une approche basée sur des règles en vue de gérer l'évolution des annotations sémantiques et de détecter et de corriger les annotations sémantiques inconsistantes. Ces propositions ont été implémentées et validées dans le système CoSWEM qui facilite la gestion de l'évolution du WSE. Ce système a été expérimenté dans le cadre des projets PALETTE et E-WOK_HUB sur un ensemble de données réelles et évolutives provenant de ces projets.
|
48 |
Intégration de la sémantique dans la représentation de documents par les arbres de dépendances syntaxiquesAu, Émilie January 2011 (has links)
De nombreuses applications dans le domaine de la recherche d'information voient leur performance influencée par le modèle de représentation de documents. En effet, théoriquement, meilleure est la modélisation, meilleure sera la performance de l'application qui exploite la modélisation. Or la modélisation"parfaite" d'un document est celle qui utilise l'intégralité des théories linguistiques. Cependant, en pratique, celles-ci sont difficiles à traduire sous forme de traitements informatiques. Néanmoins, il existe des modèles qui s'appuient partiellement sur ces théories comme les modèles vectoriels classiques, les modèles par séquences de mots ou encore les chaînes lexicales. Ces précédents modèles exploitent, soit l'information syntaxique, soit l'information sémantique. D'autres modèles plus raffinés exploitent à la fois l'information syntaxique et sémantique mais sont appliqués dans un contexte spécifique. Dans cette étude, nous proposons une nouvelle modélisation de documents dans un contexte général qui considère simultanément l'information syntaxique et sémantique. Notre modèle est une combinaison de deux composantes, l'une syntaxique représentée par les arbres de dépendances syntaxiques obtenus à l'aide d'un analyseur de dépendances syntaxiques, l'autre sémantique représentée par le sens des mots dans leur contexte obtenu grâce à une méthode de désambiguïsation du sens. Dans ce modèle, chaque document est représenté par un ensemble de concepts fréquents formé de sous-arbres ayant les mêmes dépendances syntaxiques et étant sémantiquement proches. L'extraction de tels concepts est réalisée à l'aide d'un algorithme de forage d'arbres FREQT. Notre modèle sera évalué sur une application de clustering de documents des collections Reuters, 20 newsgroups et Ohsumed. La mesure du cosinus valable pour un modèle vectoriel a été utilisée pour définir la mesure de similarité entre les documents. Contrairement au modèle vectoriel, l'espace vectoriel considéré n'est pas engendré par l'ensemble des mots fréquents mais par l'ensemble des concepts fréquents. Les résultats expérimentaux obtenus montrent que l'intégration de l'information sémantique dans le modèle basé sur les arbres de dépendances syntaxiques contribue à améliorer la qualité des clusters.
|
49 |
Changements catégoriels et marqueurs qui jouent un rôle sur le plan énonciatif étude lexico-sémantique d'unités appartenant au paradigme de sérieux-sérieusementLanciault, Lisanne January 2009 (has links)
Ce mémoire présente l'analyse sémantique et le traitement lexicographique d'un sous-groupe d'unités lexicales qui ont la particularité de pouvoir jouer, dans certains de leurs sens, un rôle sur le plan énonciatif. Les unités à l'étude sont les suivantes : sérieux, sérieusement, 'blague à part ', 'pas de farce ' ,'pas de joke ', 'pour vrai ', 'sans blague ', 'sans farce ', 'sans joke ' et 'sans rire '. Lorsqu'elles sont employées comme marqueurs discursifs, ces unités servent au locuteur à indiquer sa présence et sa subjectivité dans l'acte d'énonciation, notamment en lui permettant d'insister sur le fait qu'il ne produit pas à la légère un énoncé donné. Le point de départ de notre étude est le mot sérieux qui a récemment acquis, en français parlé, une fonction discursive par un processus de pragmaticalisation, à première vue inusité pour un adjectif. La recherche, qui adopte une perspective polysémique du sens, prend appui sur les travaux effectués dans le cadre de la lexicologie explicative et combinatoire.
|
50 |
Contexte et force illocutoire. Vers une théorie des actes de langage Context and illocutionary force. Towards a cognitive theory of speech actsKissine, Mikhail 11 December 2007 (has links)
L'objectif de la thèse est de formuler une théorie psychologiquement plausible de la manière dont les locuteurs assignent des forces illocutoires aux énoncés.
|
Page generated in 0.0594 seconds