Spelling suggestions: "subject:"entités"" "subject:"untités""
31 |
Méthode d’extraction d’informations géographiques à des fins d’enrichissement d’une ontologie de domaine / Geographical information extraction method in order to enrich a domain ontologyNguyen, Van Tien 15 November 2012 (has links)
Notre thèse se situe dans le contexte du projet ANR GEONTO qui porte sur la constitution, l’alignement, la comparaison et l’exploitation d’ontologies géographiques hétérogènes. Dans ce contexte, notre objectif est d'extraire automatiquement des termes topographiques à partir des récits de voyage afin d'enrichir une ontologie géographique initialement conçue par l'IGN. La méthode proposée permet de repérer et d'extraire des termes à connotation topographiques contenus dans un texte. Notre méthode est basée sur le repérage automatique de certaines relations linguistiques afin d'annoter ces termes. Sa mise en œuvre s'appuie sur le principe des relations n-aires et passe par l'utilisation de méthodes ou de techniques de TAL (Traitement Automatique de la Langue). Il s'agit de relations n-aires entre les termes à extraire et d'autres éléments du textes qui peuvent être repérés à l'aide de ressources externes prédéfinies, telles que des lexiques spécifiques: les verbes de récit de voyage (verbes de déplacement, verbes de perceptions, et verbes topographiques), les pré-positions (prépositions de lieu, adverbes, adjectifs), les noms toponymiques, des thésaurus génériques, des ontologies de domaine (ici l'ontologie géographique initialement conçue par l'IGN). Une fois marquées par des patrons linguistiques, les relations proposées nous permettent d'annoter et d'extraire automatiquement des termes dont les différents indices permettent de déduire qu'ils évoquent des concepts topographiques. Les règles de raisonnement qui permettent ces déductions s'appuient sur des connaissances intrinsèques (évocation du spatial dans la langue) et des connaissances externes contenues dans les ressources ci-dessus évoquées, ou leur combinaison. Le point fort de notre approche est que la méthode proposée permet d'extraire non seulement des termes rattachés directement aux noms toponymiques mais également dans des structures de phrase où d'autres termes s'intercalent. L'expérimentation sur un corpus comportant 12 récits de voyage (2419 pages, fournit par la médiathèque de Pau) a montré que notre méthode est robuste. En résultat, elle a permis d'extraire 2173 termes distincts dont 1191 termes valides, soit une précision de 0,55. Cela démontre que l'utilisation des relations proposées est plus efficace que celle des couples (termes, nom toponymique)(qui donne 733 termes distincts valides avec une précision de 0,38). Notre méthode peut également être utilisée pour d'autres applications telles que la reconnaissance des entités nommées géographiques, l'indexation spatiale des documents textuels. / This thesis is in the context of the ANR project GEONTO covering the constitution, alignment, comparison and exploitation of heterogeneous geographic ontologies. The goal is to automatically extract terms from topographic travelogues to enrich a geographical ontology originally designed by IGN. The proposed method allows identification and extraction of terms contained in a text with a topographical connotation. Our method is based on a model that relies on certain grammatical relations to locate these terms. The implementation of this model requires the use of methods or techniques of NLP (Processing of Language). Our model represents the relationships between terms to extract and other elements of the texts that can be identified by using external predefined resources, such as specific lexicons: verbs of travelogue (verbs of displacement, verbs of perceptions, topographical verbs), pre-positions (prepositions of place, adverbs, adjectives), place name, generic thesauri, ontologies of domain (in our case the geographical ontology originally designed by IGN). Once marked by linguistic patterns, the proposed relationships allow us to annotate and automatically retrieve terms. Then various indices help deduce whether the extracted terms evoke topographical concepts. It is through reasoning rules that deductions are made. These rules are based on intrinsic knowledge (evocation of space in the language) and external knowledge contained in external resources mentioned above, or their combination. The advantage of our approach is that the method can extract not only the terms related directly to place name but also those embedded in sentence structure in which other terms coexisted. Experiments on a corpus consisting of 12 travel stories (2419 pages, provided by the library of Pau) showed that our method is robust. As a result, it was used to extract 2173 distinct terms with 1191 valid terms, with a precision of 0.55. This demonstrates that the use of the proposed relationships is more effective than that of couples (term, place name) (which gives 733 distinct terms valid with an accuracy of 0.38). Our method can also be used for other applications such as geographic named entity recognition, spatial indexing of textual documents.
|
32 |
Conception du système de fabrication de pièces mécaniques en grand série : formalisation de la configuration géométrique (enveloppe) et cinématique de Machine-Outil Reconfigurable (MOR)Aladad, Hasan 09 July 2009 (has links) (PDF)
Tous les secteurs industriels sont aujourd'hui soumis à une pression économique importante et à une concurrence internationale accrue de part la globalisation des marchés. Pour répondre à cet état de fait, les entreprises sont contraintes d'innover et d'améliorer le cycle d'élaboration des produits et/ou processus depuis l'idée jusqu'au la mise sur le marché des produits. L'évolutivité rapide des produits et de la concurrence ont conduit les entreprises industrielles à faire un pas supplémentaire en imaginant de nouveaux systèmes de fabrication pour assurer simultanément une haute productivité et une haute flexibilité avec la contrainte nouvelle de changements rapides de famille de pièces. Le principe de « reconfigurabilité » de système de fabrication répond à ces contraintes. Or, il faut aujourd'hui faire preuve d'une très grande réactivité, pouvoir répondre rapidement à l'apparition d'un nouveau produit (évolution du design) et/ou une nouvelle demande (fluctuation de volume) afin de rester compétitif. L'objectif de notre travail est de proposer une méthodologie de conception concernant les « Machines-Outils Reconfigurable » (MORs). Ces nouvelles machines-outils disposant de multibroches sont une réponse face aux fluctuations (changements fréquents) de la demande, de manière rapide et rentable en tenant compte du nombre croissant de variantes (variabilité en fonctionnalités et en volumes). La particularité de ce type de machine par rapport aux autres types conventionnels réside dans la possibilité d'évolution au niveau de la capacité et/ou de la flexibilité et d'exécuter simultanément plusieurs opérations à l'aide de broches actionnant de façon simultanée. Le domaine concerné porte sur la fabrication de famille de pièces mécaniques essentiellement prismatiques utilisant les techniques d'usinage (fraisage, opérations axiales
|
33 |
Traitement automatique des langues pour l'indexation d'imagesTirilly, Pierre 07 July 2010 (has links) (PDF)
Bien que s'inscrivant dans un cadre global de recherche d'information (RI) classique, l'indexation d'image ne tire que peu parti des nombreux travaux existants en RI textuelle et en traitement automatique des langues (TAL). Nous identifions deux niveaux auxquels de tels travaux peuvent s'intégrer aux systèmes d'indexation d'images. Le premier niveau est celui de la description du contenu visuel des images. Pour y intégrer des techniques de TAL, nous adoptons la description des images par mots visuels proposée par Sivic et Zisserman. Cette représentation soulève deux problématiques similaires aux problématiques classiques de la RI textuelle~: le choix des termes d'indexation les plus pertinents pour décrire les documents et la prise en compte des relations entre ces termes. Pour répondre à la première de ces problématiques nous proposons une étude des stop-lists et des pondérations dans le cadre de l'indexation d'images. Cette étude montre que, contrairement au cas des textes, il n'existe pas de pondération optimale pour tous types de requêtes, et que la pondération doit être choisie en fonction de la requête. Pour la seconde, nous utilisons des modèles de langues, outil classique du TAL que nous adaptons au cas des images, pour dépasser l'hypothèse d'indépendance des termes dans un cadre de classification d'images. Nos expérimentations montrent que prendre en compte des relations géométriques entre mots visuels permet d'améliorer les performances des systèmes. Le second niveau étudié est l'indexation sémantique des images : il est possible d'utiliser des méthodes de TAL sur des textes accompagnant les images pour obtenir des descriptions textuelles de celles-ci. Dans un premier temps, nous montrons que les descripteurs classiques d'images ne permettent pas d'obtenir des systèmes d'annotation d'images efficaces. Puis nous proposons une méthode d'annotation qui contourne cet écueil en se basant sur des descripteurs textuels et visuels de haut-niveau~: nous extrayons des textes des entités nommées, que nous mettons en relation avec des concepts visuels détectés dans les images afin d'annoter celles-ci. Nous validons notre approche sur un corpus réel et de grande taille composé d'articles de presse.
|
34 |
Acquisition de la référence aux entités et au temps chez des apprenants héllénophones de français deuxième langue (FL2), troisième langue (FL3) et quatrième langue (FL4) : effets translinguistiques. / Acquisition of the reference at entities and at time among Greek-speaking learners of French as a second (FL2), as a third (FL3) and as a fourth language (FL4) : cross-linguistic effectsPapadopoulou, Zafeiroula 15 November 2011 (has links)
Cette recherche traite de l’influence translinguistique qu’exercent des langues apprises antérieurement sur l’apprentissage du français L2, L3 et L4 par des apprenants hellénophones. Une étude comparative a été menée auprès de 13 apprenants de français de niveaux linguistiques différents. La référence aux entités et l’expression de la temporalité ont été analysées dans les productions orales et écrites de ces sujets. / This work presents a study of the cross-linguistic influence of previously learned languages in second, third and fourth language acquisition, as it is the case for Greekspeaking learners of French as foreign language (FLE). A comparative study is conducted among 13 learners of English who have different linguistic background and proficiency. Reference to entities and the expression of temporality have been analyzed in the oral and the written data provided by the participants to the study.
|
35 |
La décentralisation en Angola et au Mozambique : Du discours à la consécration juridique / The decentralization in Angola and Mozambique : From discourse to legal consecrationVarimelo, Arquimedes João F. 21 December 2017 (has links)
Après avoir adopté la centralisation comme mode d´organisation politique etadministrative, l´Angola et le Mozambique ont décidé d’emprunter la voie de ladécentralisation.Cette option pour la décentralisation se justifierait, selon le discours porté,principalement, par les acteurs politiques, par sa capacité à répondre à des enjeuxpolitiques, sociaux, économiques et administratifs qui on trouve dans ces deux pays.Cependant, le synchronisme entre ce discours et la consécration juridique de ladécentralisation dans ces pays reste loin d´être une réalité.Ainsi, la présente étude analyse la consécration juridique de la décentralisation,compte tenu du discours sur la décentralisation tenu dans ces deux pays. / After adopting political centralization as a form of political and administrativeorganization, Angola and Mozambique made up on decentralization reforms as a largeprocess of administrative reform.This choice for decentralization reforms would be warranted, according to theprevailing discourse, mainly by political actors, by its capacity to address certainpolitical, social, economic and administrative problems that can be found in these twocountries.However, the synchronism between this discourse and the legal consecration ofdecentralization in these countries remains far from being a reality.Thus, this study analyzes the legal consecration of decentralization, taking into accountthe discourse of decentralization prevailing in both countries.
|
36 |
Théorie générale de la manipulation / intervention : son implémentation aux expériences de la physique et d'astrophysique / General theory of manipulation/intervention : Its implementation on physics and astrophysics experimentsHiahemzizou, Rafik 05 December 2016 (has links)
Dans ce travail, nous analysons le concept de manipulation à travers une théorie élargie qui inclut le réalisme des entités et la théorie causale de la manipulation. Dans une seconde étape, nous appliquons cette théorie à plusieurs expériences scientifiques. Cette thèse est articulée autour de quatre parties : Dans la Partie I nous exposons le concept de manipulation. Nous examinons le réalisme structurel en mettant l’accent sur ses difficultés concernant particulièrement les incertitudes ontologiques de la physique. Cet examen du réalisme structurel nous permettra de développer un réalisme des entités qui est susceptible de constituer une alternative au réalisme structurel.La partie II est consacrée aux aspects clés du réalisme des entités, c’est-à-dire ses fondements, ses arguments ainsi qu’une définition aussi précise que possible du concept de manipulation.Dans la partie III, nous élaborons une théorie générale de la manipulation/intervention qui est basée sur le réalisme des entités et la théorie de Woodward sur l’intervention, l’invariance et la profondeur de l’explication des évènements causaux. Nous allons développer trois éléments : 1-un système des conditions de l’intervention, 2- une typologie de l’intervention, 3-l’intervention probabiliste. Ce dernier type de l’intervention est applicable à l’expérience EPR. Dans la partie IV- Nous appliquons cette théorie à cinq expériences scientifiques : l’expérience EPR, l’expérience de l’électrodynamique quantique en cavité, l’expérience sur l’effet Zeeman, l’expérience du Tevatron (collisions de protons) et la dernière est non des moindres, est une expérience d’astrophysique (ondes gravitationnelles). Dans chacune de ces expériences, notre théorie a trouvé une application réussie. Toutes les conditions de l’intervention sont applicables sur les cinq expériences et une typologie bien définie de l’intervention a été élaborée et qui met en évidence les résultats de l’intervention dans les différentes séquences de ces expériences.Par conséquent, notre théorie de la manipulation reflète une utilité authentique et réelle dans différent domaines de la physique et de l’astrophysique. Un pareil résultat est important tenant compte du rôle de la manipulation expérimentale pour la science moderne. / In this work, we analyze the concept of manipulation through a comprehensive theory which includes the entity realism and the causal theory of manipulation. At the second stage, we implement this theory to several scientific experiments. It is divided into four parts:In Part I, we will have a long journey until we will reach the true concept of manipulation. We analyze the structural realism and we explore its difficulties regarding ontological problems of physics. Our survey of structural realism enables to open a new way to developing entity realism instead of structural realism.Part II will be dedicated to the core aspect of entity realism such as its foundations, its arguments and our aim to reach a global definition of manipulation concept.In Part III I will achieve my aim which is elaborating a global theory of manipulation/intervention based on entity realism and the Woodward theory of intervention, invariance and depth explanation of causal events. We will develop three items : 1- a system of intervention conditions 2-a typology of intervention, 3-probabilistic intervention. Such type of intervention is applicable to EPR experiment. In Part IV, we implement our theory to five scientific experiments: EPR experiment, electrodynamics cavity experiment, Zeeman effect experiment, Tevatron experiment (collision of protons) and last but not least an astrophysical experiment (gravitational waves).In each case, our theory is successful. All intervention conditions are applicable to our five experiments and a well defined typology of intervention is developed based on intervention results through different stages of those experiments. Therefore, the theory of manipulation shows a real and genuine application in different domains of physics and astrophysics. Such result is important regarding the role of manipulation in modern science.
|
37 |
Entity-level Event Impact Analytics / Analyse de l'impact des évenements au niveau des entitésGovind, . 12 December 2018 (has links)
Notre société est de plus en plus présente sur le Web. En conséquence, une grande partie des événements quotidiens a vocation à être numérisée. Dans ce cadre, le Web contient des descriptions de divers événements du monde réel et provenant du monde entier. L'ampleur de ces événements peut varier, allant de ceux pertinents uniquement localement à ceux qui retiennent l'attention du monde entier. La presse et les médias sociaux permettent d’atteindre une diffusion presque mondiale. L’ensemble de toutes ces données décrivant des événements sociétaux potentiellement complexes ouvre la porte à de nombreuses possibilités de recherche pour analyser et mieux comprendre l'état de notre société.Dans cette thèse, nous étudions diverses tâches d’analyse de l’impact des événements sociétaux. Plus précisément, nous abordons trois facettes dans le contexte des événements et du Web, à savoir la diffusion d’événements dans des communautés de langues étrangères, la classification automatisée des contenus Web et l’évaluation et la visualisation de la viralité de l’actualité. Nous émettons l'hypothèse que les entités nommées associées à un événement ou à un contenu Web contiennent des informations sémantiques précieuses, qui peuvent être exploitées pour créer des modèles de prédiction précis. À l'aide de nombreuses études, nous avons montré que l'élévation du contenu Web au niveau des entités saisissait leur essence essentielle et offrait ainsi une variété d'avantages pour obtenir de meilleures performances dans diverses tâches. Nous exposons de nouvelles découvertes sur des tâches disparates afin de réaliser notre objectif global en matière d'analyse de l’impact des événements sociétaux. / Our society has been rapidly growing its presence on the Web, as a consequence we are digitizing a large collection of our daily happenings. In this scenario, the Web receives virtual occurrences of various events corresponding to their real world occurrences from all around the world. Scale of these events can vary from locally relevant ones up to those that receive global attention. News and social media of current times provide all essential means to reach almost a global diffusion. This big data of complex societal events provide a platform to many research opportunities for analyzing and gaining insights into the state of our society.In this thesis, we investigate a variety of social event impact analytics tasks. Specifically, we address three facets in the context of events and the Web, namely, diffusion of events in foreign languages communities, automated classification of Web contents, and news virality assessment and visualization. We hypothesize that the named entities associated with an event or a Web content carry valuable semantic information, which can be exploited to build accurate prediction models. We have shown with the help of multiple studies that raising Web contents to the entity-level captures their core essence, and thus, provides a variety of benefits in achieving better performance in diverse tasks. We report novel findings over disparate tasks in an attempt to fulfill our overall goal on societal event impact analytics.
|
38 |
Le repérage automatique des entités nommées dans la langue arabe : vers la création d'un système à base de règlesZaghouani, Wajdi January 2009 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
|
39 |
Le repérage automatique des entités nommées dans la langue arabe : vers la création d'un système à base de règlesZaghouani, Wajdi January 2009 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
|
40 |
Formalisation de connaissances à partir de corpus : modélisation linguistique du contexte pour l'extraction automatique de relations sémantiquesEl Maarouf, Ismaïl 06 December 2011 (has links) (PDF)
Les corpus, collections de textes sélectionnés dans un objectif spécifique, occupent une place de plus en plus déterminante en Linguistique comme en Traitement Automatique des Langues (TAL). Considérés à la fois comme source de connaissances sur l'usage authentique des langues, ou sur les entités que désignent des expressions linguistiques, ils sont notamment employés pour évaluer la performance d'applications de TAL. Les critères qui prévalent à leur constitution ont un impact évident, mais encore délicat à caractériser, sur (i) les structures linguistiques majeures qu'ils renferment, (ii) les connaissances qui y sont véhiculées, et, (iii) la capacité de systèmes informatiques à accomplir une tâche donnée. Ce mémoire étudie des méthodologies d'extraction automatique de relations sémantiques dans des corpus de textes écrits. Un tel sujet invite à examiner en détail le contexte dans lequel une expression linguistique s'applique, à identifier les informations qui déterminent son sens, afin d'espérer relier des unités sémantiques. Généralement, la modélisation du contexte est établie à partir de l'analyse de co-occurrence d'informations linguistiques issues de ressources ou obtenues par des systèmes de TAL. Les intérêts et limites de ces informations sont évalués dans le cadre de la tâche d'extraction de relations sur des corpus de genre différent (article de presse, conte, biographie). Les résultats obtenus permettent d'observer que pour atteindre une représentation sémantique satisfaisante ainsi que pour concevoir des systèmes robustes, ces informations ne suffisent pas. Deux problèmes sont particulièrement étudiés. D'une part, il semble indispensable d'ajouter des informations qui concernent le genre du texte. Pour caractériser l'impact du genre sur les relations sémantiques, une méthode de classification automatique, reposant sur les restrictions sémantiques qui s'exercent dans le cadre de relations verbo-nominales, est proposée. La méthode est expérimentée sur un corpus de conte et un corpus de presse. D'autre part, la modélisation du contexte pose des problèmes qui relèvent de la variation discursive de surface. Un texte ne met pas toujours bout à bout des expressions linguistiques en relation et il est parfois nécessaire de recourir à des algorithmes complexes pour détecter des relations à longue portée. Pour répondre à ce problème de façon cohérente, une méthode de segmentation discursive, qui s'appuie sur des indices de structuration de surface apparaissant dans des corpus écrits, est proposée. Elle ouvre le champ à la conception de grammaires qui permettent de raisonner sur des catégories d'ordre macro-syntaxique afin de structurer la représentation discursive d'une phrase. Cette méthode est appliquée en amont d'une analyse syntaxique et l'amélioration des performances est évaluée. Les solutions proposées à ces deux problèmes nous permettent d'aborder l'extraction d'information sous un angle particulier : le système implémenté est évalué sur une tâche de correction d'Entités Nommées dans le contexte d'application des Systèmes de Question-Réponse. Ce besoin spécifique entraîne l'alignement de la définition d'une catégorie sur le type de réponse attendue par une question.
|
Page generated in 0.0512 seconds