• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 12
  • 3
  • Tagged with
  • 15
  • 15
  • 15
  • 7
  • 6
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Construction de fiches de synthèse par annotation sémantique automatique des publications scientifiques : application aux articles en biologie / Thematic sheets construction of scientific publications using semantic annotation of scientific publications : Application to biomedical papers.

Makkaoui, Olfa 17 January 2014 (has links)
Les fiches de synthèse multi-documents sont considérées comme une représentation textuelle organisée et structurée des segments textuels. La construction de ces fiches repose sur l’annotation sémantique des publications scientifiques suivant un ensemble de catégories discursives qu’on appelle des points de vue de fouille (comme les hypothèses plausibles, les résultats, ou les conclusions,…). L’annotation sémantique est réalisée automatiquement par la méthode de l’Exploration Contextuelle. Il s’agit d’une méthode linguistique computationnelle, implémentée par un moteur d’annotation sémantique, qui repose sur un ensemble de marqueurs linguistiques associés à des points de vue de fouille. Afin de pouvoir expérimenter la pertinence des résultats de notre système, nous avons procédé à l’évaluation des annotations automatiques sur des textes en biologie. La notion des spéculations (hypothèses plausibles), particulièrement décrite dans ce travail, a été évaluée sur le corpus BioScope annoté manuellement pour les spéculations et les négations. Nous proposons une application informatique qui permet aux utilisateurs d’obtenir des fiches de synthèse organisées suivant des critères sémantiques paramétrables par l’utilisateur. / Multi-documents thematic sheets are considered as an organized and structured textual representationof textual segments. The thematic sheets construction is based on the semantic annotation ofscientific publications according to a set of discursive categories called search view points (such asspeculation, results or conclusions, ?). The semantic annotation is performed automatically by theContextual Exploration process. It is a computational linguistic method based on a set of linguisticmarkers associated with search view points. This method is implemented by a semantic annotationengine. In order to evaluate the relevance of the results of our system, we used biological papers toevaluate the automatic annotation. The concept of speculation (plausible hypothesis), specificallydescribed in this work, was evaluated on the Bioscope corpus which is manually annotated forspeculation and negation. We propose an application that allows users to obtain thematic sheetsorganized according to semantic criteria configurable by the user.
12

Visualisation de données dans le domaine de l’E-recrutement

Outerqiss, Abdessamad 12 1900 (has links)
No description available.
13

Génération de phrases multilingues par apprentissage automatique de modèles de phrases / Multilingual Natural Language Generation using sentence models learned from corpora

Charton, Éric 12 November 2010 (has links)
La Génération Automatique de Texte (GAT) est le champ de recherche de la linguistique informatique qui étudie la possibilité d’attribuer à une machine la faculté de produire du texte intelligible. Dans ce mémoire, nous présentons une proposition de système de GAT reposant exclusivement sur des méthodes statistiques. Son originalité est d’exploiter un corpus en tant que ressource de formation de phrases. Cette méthode offre plusieurs avantages : elle simplifie l’implémentation d’un système de GAT en plusieurs langues et améliore les capacités d’adaptations d’un système de génération à un domaine sémantique particulier. La production, d’après un corpus d’apprentissage, des modèles de phrases finement étiquetées requises par notre générateur de texte nous a conduit à mener des recherches approfondies dans le domaine de l’extraction d’information et de la classification. Nous décrivons le système d’étiquetage et de classification de contenus encyclopédique mis au point à cette fin. Dans les étapes finales du processus de génération, les modèles de phrases sont exploités par un module de génération de texte multilingue. Ce module exploite des algorithmes de recherche d’information pour extraire du modèle une phrase pré-existante, utilisable en tant que support sémantique et syntaxique de l’intention à communiquer. Plusieurs méthodes sont proposées pour générer une phrase, choisies en fonction de la complexité du contenu sémantique à exprimer. Nous présentons notamment parmi ces méthodes une proposition originale de génération de phrases complexes par agrégation de proto-phrases de type Sujet, Verbe, Objet. Nous envisageons dans nos conclusions que cette méthode particulière de génération puisse ouvrir des voies d’investigations prometteuses sur la nature du processus de formation de phrases / Natural Language Generation (NLG) is the natural language processing task of generating natural language from a machine representation system. In this thesis report, we present an architecture of NLG system relying on statistical methods. The originality of our proposition is its ability to use a corpus as a learning resource for sentences production. This method offers several advantages : it simplifies the implementation and design of a multilingual NLG system, capable of sentence production of the same meaning in several languages. Our method also improves the adaptability of a NLG system to a particular semantic field. In our proposal, sentence generation is achieved trough the use of sentence models, obtained from a training corpus. Extracted sentences are abstracted by a labelling step obtained from various information extraction and text mining methods like named entity recognition, co-reference resolution, semantic labelling and part of speech tagging. The sentence generation process is achieved by a sentence realisation module. This module provide an adapted sentence model to fit a communicative intent, and then transform this model to generate a new sentence. Two methods are proposed to transform a sentence model into a generated sentence, according to the semantic content to express. In this document, we describe the complete labelling system applied to encyclopaedic content to obtain the sentence models. Then we present two models of sentence generation. The first generation model substitute the semantic content to an original sentence content. The second model is used to find numerous proto-sentences, structured as Subject, Verb, Object, able to fit by part a whole communicative intent, and then aggregate all the selected proto-sentences into a more complex one. Our experiments of sentence generation with various configurations of our system have shown that this new approach of NLG have an interesting potential
14

Désambiguïsation de l’arabe écrit et interprétation sémantique / Word sense disambiguation of written arabic and semantic interpretation

Gzawi, Mahmoud 17 January 2019 (has links)
Cette thèse se situe à l’intersection des domaines de la recherche en linguistique et du traitement automatique de la langue. Ces deux domaines se croisent pour la construction d’outils de traitement de texte, et des applications industrielles intégrant des solutions de désambiguïsation et d’interprétation de la langue.Une tâche difficile et très peu abordée et appliqué est arrivée sur les travaux de l’entreprise Techlimed, celle de l’analyse automatique des textes écrits en arabe. De nouvelles ressources sont apparues comme les lexiques de langues et les réseaux sémantiques permettant à la création de grammaires formelles d’accomplir cette tâche.Une métadonnée importante pour l’analyse de texte est de savoir « qu’est-ce qui est dit, et que signifie-t-il ? ». Le domaine de linguistique computationnelle propose des méthodes très diverses et souvent partielle pour permettre à l’ordinateur de répondre à de telles questions.L’introduction et l’application des règles de grammaire descriptives de langues dans les langages formels spécifiques au traitement de langues par ordinateur est l’objet principal de cette thèse.Au-delà de la réalisation d’un système de traitement et d’interprétation de textes en langue arabe, basé aussi sur la modélisation informatique, notre intérêt s’est porté sur l’évaluation des phénomènes linguistiques relevés par la littérature et les méthodes de leur formalisation en informatique.Dans tous les cas, nos travaux de recherche ont été testés et validés dans un cadre expérimental rigoureux autour de plusieurs formalismes et outils informatiques.Nos expérimentations concernant l'apport de la grammaire syntaxico-sémantique, a priori, ont montré une réduction importante de l’ambiguïté linguistique dans le cas de l'utilisation d’une grammaire à état fini écrite en Java et une grammaire générativetransformationnelle écrite en Prolog, intégrant des composants morphologiques, syntaxiques et sémantiques.La mise en place de notre étude a requis la construction d’outils de traitement de texte et d’outils de recherche d’information. Ces outils ont été construits par nos soins et sont disponible en Open-source.La réussite de l’application de nos travaux à grande échelle s’est conclue par la condition d’avoir de ressources sémantiques riches et exhaustives. Nous travaux ont été redirigés vers une démarche de production de telles ressources, en termes de recherche d’informations et d’extraction de connaissances. Les tests menés pour cette nouvelle perspective ont étéfavorables à d’avantage de recherche et d’expérimentation. / This thesis lies at the frontier of the fields of linguistic research and the automatic processing of language. These two fields intersect for the construction of natural language processing tools, and industrial applications integrating solutions for disambiguation and interpretation of texts.A challenging task, briefly approached and applied, has come to the work of the Techlimed company, that of the automatic analysis of texts written in Arabic. Novel resources have emerged as language lexicons and semantic networks allowing the creation of formal grammars to accomplish this task.An important meta-data for text analysis is "what is being said, and what does it mean". The field of computational linguistics offers very diverse and, mostly, partial methods to allow the computer to answer such questions.The main purpose of this thesis is to introduce and apply the rules of descriptive language grammar in formal languages specific to computer language processing.Beyond the realization of a system of processing and interpretation of texts in Arabic language based on computer modeling, our interest has been devoted to the evaluation of the linguistic phenomena described by the literature and the methods of their formalization in computer science.In all cases, our research was tested and validated in a rigorous experimental framework around several formalisms and computer tools.The experiments concerning the contribution of syntaxico-semantic grammar, a priori, have demonstrated a significant reduction of linguistic ambiguity in the case of the use of a finite-state grammar written in Java and a transformational generative grammarwritten in Prolog, integrating morphological, syntactic and semantic components.The implementation of our study required the construction of tools for word processing, information retrieval tools. These tools were built by us and are available in Open-source.The success of the application of our work in large scale was concluded by the requirement of having rich and comprehensive semantic resources. Our work has been redirected towards a process of production of such resources, in terms of informationretrieval and knowledge extraction. The tests for this new perspective were favorable to further research and experimentation.
15

Méthodologies pour la création de connaissances relatives au marché chinois dans une démarche d'Intelligence Économique : application dans le domaine des biotechnologies agricoles / Methodologies for building knowledge about the Chinese market in a business intelligence approach : application in the field of agricultural biotechnologies

Guénec, Nadège 02 July 2009 (has links)
Le décloisonnement des économies et l’accélération mondiale des échanges commerciaux ont, en une décennie à peine, transformés l’environnement concurrentiel des entreprises. La zone d’activités s’est élargie en ouvrant des nouveaux marchés à potentiels très attrayants. Ainsi en est-il des BRIC (Brésil, Russie, Inde et Chine). De ces quatre pays, impressionnants par la superficie, la population et le potentiel économique qu’ils représentent, la Chine est le moins accessible et le plus hermétique à notre compréhension de par un système linguistique distinct des langues indo-européennes d’une part et du fait d’une culture et d’un système de pensée aux antipodes de ceux de l’occident d’autre part. Pourtant, pour une entreprise de taille internationale, qui souhaite étendre son influence ou simplement conserver sa position sur son propre marché, il est aujourd’hui absolument indispensable d’être présent sur le marché chinois. Comment une entreprise occidentale aborde-t-elle un marché qui de par son altérité, apparaît tout d’abord comme complexe et foncièrement énigmatique ? Six années d’observation en Chine, nous ont permis de constater les écueils dans l’accès à l’information concernant le marché chinois. Comme sur de nombreux marchés extérieurs, nos entreprises sont soumises à des déstabilisations parfois inimaginables. L’incapacité à « lire » la Chine et à comprendre les enjeux qui s’y déroulent malgré des effets soutenus, les erreurs tactiques qui découlent d’une mauvaise appréciation du marché ou d’une compréhension biaisée des jeux d’acteurs nous ont incités à réfléchir à une méthodologie de décryptage plus fine de l’environnement d’affaire qui puisse offrir aux entreprises françaises une approche de la Chine en tant que marché. Les méthodes de l’Intelligence Economique (IE) se sont alors imposées comme étant les plus propices pour plusieurs raisons : le but de l’IE est de trouver l’action juste à mener, la spécificité du contexte dans lequel évolue l’organisation est prise en compte et l’analyse se fait en temps réel. Si une approche culturelle est faite d’interactions humaines et de subtilités, une approche « marché » est dorénavant possible par le traitement automatique de l’information et de la modélisation qui s’en suit. En effet, dans toute démarche d’Intelligence Economique accompagnant l’implantation d’une activité à l’étranger, une grande part de l’information à portée stratégique vient de l’analyse du jeu des acteurs opérants dans le même secteur d’activité. Une telle automatisation de la création de connaissance constitue, en sus de l’approche humaine « sur le terrain », une réelle valeur ajoutée pour la compréhension des interactions entre les acteurs car elle apporte un ensemble de connaissances qui, prenant en compte des entités plus larges, revêtent un caractère global, insaisissable par ailleurs. La Chine ayant fortement développé les technologies liées à l’économie de la connaissance, il est dorénavant possible d’explorer les sources d’information scientifiques et techniques chinoises. Nous sommes en outre convaincus que l’information chinoise prendra au fil du temps une importance de plus en plus cruciale. Il devient donc urgent pour les organisations de se doter de dispositifs permettant non seulement d’accéder à cette information mais également d’être en mesure de traiter les masses d’informations issues de ces sources. Notre travail consiste principalement à adapter les outils et méthodes issues de la recherche française à l’analyse de l’information chinoise en vue de la création de connaissances élaborées. L’outil MATHEO, apportera par des traitements bibliométriques une vision mondiale de la stratégie chinoise. TETRALOGIE, outil dédié au data-mining, sera adapté à l’environnement linguistique et structurel des bases de données scientifiques chinoises. En outre, nous participons au développement d’un outil d’information retreival (MEVA) qui intègre les données récentes des sciences cognitives et oeuvrons à son application dans la recherche de l’information chinoise, pertinente et adéquate. Cette thèse étant réalisée dans le cadre d’un contrat CIFRE avec le Groupe Limagrain, une application contextualisée de notre démarche sera mise en œuvre dans le domaine des biotechnologies agricoles et plus particulièrement autour des enjeux actuels de la recherche sur les techniques d’hybridation du blé. L’analyse de ce secteur de pointe, qui est à la fois une domaine de recherche fondamentale, expérimentale et appliquée donne actuellement lieu à des prises de brevets et à la mise sur le marché de produits commerciaux et représente donc une thématique très actuelle. La Chine est-elle réellement, comme nous le supposons, un nouveau territoire mondial de la recherche scientifique du 21e siècle ? Les méthodes de l’IE peuvent-elles s’adapter au marché chinois ? Après avoir fourni les éléments de réponses à ces questions dans es deux premières parties de notre étude, nous poserons en troisième partie, le contexte des biotechnologies agricoles et les enjeux mondiaux en terme de puissance économico-financière mais également géopolitique de la recherche sur l’hybridation du blé. Puis nous verrons en dernière partie comment mettre en œuvre une recherche d’information sur le marché chinois ainsi que l’intérêt majeur en terme de valeur ajoutée que représente l’analyse de l’information chinoise / The rise of globalization, including technological innovations and the dismantling of trade barriers, has spurred the steady acceleration of global trade and, in barely a decade, has transformed the competitive environment of enterprises. The area of activity has been expanded by the emergence of new markets with very attractive potential. So are the BRIC (Brazil, Russia, India and China). Among the four of them, all impressive by their size, population and economic potential they represent, China is the least accessible and the more closed to our understanding because of a linguistic system radically different from the Indo-European languages on the one hand and of the fact of a culture and a thought system at odds with those of Western countries. Yet for a company of international size, which wants to extend its influence or simply to maintain its market position, including its own market, it is now essential to be present on the Chinese market. How does a western company operate on a market that appears at first as inherently complex and enigmatic because of its otherness? During six years of observation in China, we have found out the pitfalls in access to information about the Chinese market. As on many markets, our companies are subject to some unimaginable destabilization. The inability to “read” China and understand the issues that take place in spite of sustained efforts, the tactical errors that arise from a misjudgement of the market or a biased understanding of the game players led us to consider a methodology that could provide French companies an approach to China as a market. The methodologies of Business Intelligence (BI) came out to be the most suitable for several reasons: the goal of BI is to find out the right action to realise, the specificity of the context in which the organization is evolving is taken into consideration and the analysis is done just in time. If a cultural approach is made of human interactions and subtleties, a market approach is now possible by the automatic processing of information and its modelling. In any process of economic intelligence accompanying the establishment of a foreign operation, a large part of the strategic information comes from analysis of the game players operating in the same sector of activity. Such an automation of knowledge creation is, in addition to the human approach on the field, a real high value added to help the understanding of the interactions between the players. It provides a set of knowledge, which taking into account more large entities, are more comprehensive. They are more elusive anywhere else. Because has highly developed technologies linked to the knowledge economy, it is now possible to explore the scientific and technological sources of information science in China. We are also convinced that Chinese sources of information will take a more and more crucial importance in any global watch. It is therefore an urgent need for organizations to get solutions that not only allow the access to this information but also are able to handle the masses of information from these sources. The aim of this thesis is mainly to adapt the tools and the methods invented by French university research to the analysis of Chinese information in order to create useful knowledge. Matheo software will provide some bibliometrical treatments that will give a global vision of the Chinese strategy. Tetralogy software, a tool dedicated to data-mining, will be tailored to the linguistic environment and to the structure of the Chinese scientific databases. In addition, we participate in the development of a method for the information retrieval (MEVA) which integrates the data of recent discoveries in cognitive science. We develop this method to the research of the relevant and appropriate information among the Chinese datas. As this thesis is conduced under a contract university /enterprise with Limagrain, an application of our approach will be implemented in the field of agricultural biotechnology and in particular around issues of research on techniques for hybridization of wheat. The analysis of this sector, which is an area of fundamental research, experimental and applied is a very current topic as it gives rise to the acquisition of patents and to the marketing of commercial products. Is China really, as we suppose to, a new territory Global Scientific Research of the 21st century? Can the methods of BI be adapted to the Chinese market? After providing some answers to these questions in the first two parts of our study, the third part will describe the global context of agricultural biotechnologies and its issues in terms of economic and financial power but also geopolitical. Then we will focus on the problematic of research on hybridization wheat. Then we will see in the fourth and last part how to implement a search for information on the Chinese market and the major interest in terms of added value of information analysis in China

Page generated in 0.1346 seconds