Global ETD Search

1	Les relations de causalité en arabe et en français avec une constitution de ressources linguistiques utilisables par l’informatique / Relations of causality in Arabic and French with a constitution of linguistic resources for automatic processing Sabra, Amani 08 December 2012 (has links) Cette thèse propose une analyse contrastive de la causalité en arabe et en français. L’intérêt d’une telle étude est double. Nous exposons un cadre linguistique concernant l'analyse des différentes manifestations linguistiques causales. Ensuite, nous établissons de ressources linguistiques relatives à la causalité selon la méthode d’exploration contextuelle (Desclés 1997) destinées à un traitement automatique pour une recherche d’information. Nous passons à l'étude du lexique verbal afin d’organiser une grande diversité des verbes indicateursde causalitéen arabe ainsi que de dresser une liste assez complète des significations des verbes indicateurs répertoriés et de les classer dans des catégories sémantiques. Dans le but d’élaborer une carte sémantique causale, nous avons été obligées de préciser un réseau de concepts théoriques relatifs à la causalité. Le modèle de Talmy a constitué notre point de départ, il nous a permis une première décomposition de la signification des verbes indicateurs causaux. Le modèle de la Grammaire applicative et cognitive (Desclés 1990) nous a fourni un cadre pertinent pour représenter cette décomposition et l’affiner également. Pour finir, nous avons élaboré les schèmes sémantico-cognitifs des verbes indicateurs causals ainsi que des schémas aspecto-temporels en tenant compte des arguments impliqués par la causalité. / This thesis proposes a contrastive analysis of causality in Arabic and French. The interest of such study is twofold. We present a linguistic framework for the analysis of different linguistic causal manifestations. Then, we establish linguistic resources of causality following the contextual exploration method (Desclés 1997) used in automatic processingfor information retrieval. We turn to the study of the verbal lexicon to organize a wide variety of existing indicators verbsof causality in Arabic, and to compile a fairly complete list of the meanings of verbs indicators listed and classify them into semantic categories. In order to develop a causal semantic map, we have been obliged to specify a network of theoretical concepts related to causality. Talmy model was our starting point; it allowed us to undertake a certain decomposition of the meaning of causal indicators verbs. The model of Applicative and Cognitive Grammar (Desclés 1990) provided us with a relevant theoretical framework to analyze this decomposition. Finally, we have developed semantic-cognitive patterns for the causal indicators verbs as well as aspectual-temporal patterns taking into account the arguments involved by in the causality. Causalité Verbes Indicateurs de causalité Grammaire Applicative et Cognitive Recherche d’informations Ressources linguistiques Agent Exploration contextuelle Causality Verbs Contextual exploration
2	Pratiques et difficultés de l'enseignement de la traduction en Corée : comparaison avec sa pratique en France / Practice and challenges of translation education in Korea : a comparison with France Kim, Daeyoung 10 May 2013 (has links) Cette thèse analyse les pratiques actuelles de l’enseignement de la traduction dans les universités et les écoles professionnelles en Corée, par comparaison avec la situation en France, à partir d’entretiens, de QCM et de l’observation de cours de traduction. L’objectif est de reconnaître les particularités de la situation en Corée et d’en repérer les principales difficultés. Il apparaît que les facteurs socioculturels coréens, tels que la société autoritaire et collectiviste, induisent des cours centrés sur l’enseignant et la passivité des élèves. Nous découvrons aussi le faible niveau de créativité des étudiants coréens du fait d’un recours systématique à la mémorisation et aux QCM dans le système éducatif coréen. L’évaluation orientée processus et l’évaluation diagnostique font largement défaut tant à l’université qu’à l’école professionnelle de traduction, où l’évaluation est sommative plus que formative. Sous forme d’évaluation microstructurelle, les enseignants coréens pratiquent une évaluation globale et variable qui leur est personnelle, par manque de critères précis et concrets d’évaluation et de barème commun ayant force de directive. L’accent est mis sur les compétences linguistiques et textuelles plus que sur les autres compétences, au constat établi que ce sont celles qui font le plus défaut aux étudiants, aussi bien à l’université qu’à l’école professionnelle. Il y a peu de différences entre les étudiants coréens de l’université et de l’école professionnelle en matière de recherche d’informations. Malgré les difficultés particulières affectant les cours de traduction à l’université, la possibilité existe d’y former à la traduction professionnelle. / This thesis analyzes the translation education currently conducted in Korean universities and other highereducational institutions in comparison with those conducted in France. The data is gathered through three methods: interviews, MCQ (Multiple-Choice Questions), and class observation. The purpose is to pinpoint the characteristics of translation education in Korea and to outline the key issues deriving from these particularities. According to the study, socio-cultural factors in Korean society including hierarchy, collectivism, and the cultural tendency to refrain from classroom discussion in favor of professor-centered teaching methods, have led to students’ passive attitude toward learning. In addition, we found that cramming for exams and permanent MCQ assessment in the Korean education system weaken their students’ creativity. Korean teachers place more emphasis on result-oriented, summative assessment than on process-oriented, diagnostic and formative assessment. In microstructural assessment, teachers rely on subjective criteria due to a lack of concrete and precise assessment rules to serve as grading guidelines. In most cases, translation education is dedicated to enhancing linguistic and textual competencies found most lacking among Korean students. Additionally, in terms of information acquisition skills, there are few differences between Korean students in undergraduate programs and those in higher-education institutions. Despite the difficulties of teaching translation, there are still opportunities for professional translation courses at the university. Enseignement de la traduction Facteurs socioculturels Compétences en traduction Évaluation de la traduction Thèories de traduction Recherche d’informations Translation education Socio-cultural factors Translation theories Translation competency Translation assessment Document research
3	Toward Scalable Hierarchical Clustering and Co-clustering Methods : application to the Cluster Hypothesis in Information Retrieval / Méthodes de regroupement hiérarchique agglomératif et co-clustering, leurs applications aux tests d’hypothèse de cluster et implémentations distribuées Wang, Xinyu 29 November 2017 (has links) Comme une méthode d’apprentissage automatique non supervisé, la classification automatique est largement appliquée dans des tâches diverses. Différentes méthodes de la classification ont leurs caractéristiques uniques. La classification hiérarchique, par exemple, est capable de produire une structure binaire en forme d’arbre, appelée dendrogramme, qui illustre explicitement les interconnexions entre les instances de données. Le co-clustering, d’autre part, génère des co-clusters, contenant chacun un sous-ensemble d’instances de données et un sous-ensemble d’attributs de données. L’application de la classification sur les données textuelles permet d’organiser les documents et de révéler les connexions parmi eux. Cette caractéristique est utile dans de nombreux cas, par exemple, dans les tâches de recherche d’informations basées sur la classification. À mesure que la taille des données disponibles augmente, la demande de puissance du calcul augmente. En réponse à cette demande, de nombreuses plates-formes du calcul distribué sont développées. Ces plates-formes utilisent les puissances du calcul collectives des machines, pour couper les données en morceaux, assigner des tâches du calcul et effectuer des calculs simultanément.Dans cette thèse, nous travaillons sur des données textuelles. Compte tenu d’un corpus de documents, nous adoptons l’hypothèse de «bag-of-words» et applique le modèle vectoriel. Tout d’abord, nous abordons les tâches de la classification en proposant deux méthodes, Sim_AHC et SHCoClust. Ils représentent respectivement un cadre des méthodes de la classification hiérarchique et une méthode du co-clustering hiérarchique, basé sur la proximité. Nous examinons leurs caractéristiques et performances du calcul, grâce de déductions mathématiques, de vérifications expérimentales et d’évaluations. Ensuite, nous appliquons ces méthodes pour tester l’hypothèse du cluster, qui est l’hypothèse fondamentale dans la recherche d’informations basée sur la classification. Dans de tels tests, nous utilisons la recherche du cluster optimale pour évaluer l’efficacité de recherche pour tout les méthodes hiérarchiques unifiées par Sim_AHC et par SHCoClust . Nous aussi examinons l’efficacité du calcul et comparons les résultats. Afin d’effectuer les méthodes proposées sur des ensembles de données plus vastes, nous sélectionnons la plate-forme d’Apache Spark et fournissons implémentations distribuées de Sim_AHC et de SHCoClust. Pour le Sim_AHC distribué, nous présentons la procédure du calcul, illustrons les difficultés rencontrées et fournissons des solutions possibles. Et pour SHCoClust, nous fournissons une implémentation distribuée de son noyau, l’intégration spectrale. Dans cette implémentation, nous utilisons plusieurs ensembles de données qui varient en taille pour examiner l’échelle du calcul sur un groupe de noeuds. / As a major type of unsupervised machine learning method, clustering has been widely applied in various tasks. Different clustering methods have different characteristics. Hierarchical clustering, for example, is capable to output a binary tree-like structure, which explicitly illustrates the interconnections among data instances. Co-clustering, on the other hand, generates co-clusters, each containing a subset of data instances and a subset of data attributes. Applying clustering on textual data enables to organize input documents and reveal connections among documents. This characteristic is helpful in many cases, for example, in cluster-based Information Retrieval tasks. As the size of available data increases, demand of computing power increases. In response to this demand, many distributed computing platforms are developed. These platforms use the collective computing powers of commodity machines to parallelize data, assign computing tasks and perform computation concurrently.In this thesis, we first address text clustering tasks by proposing two clustering methods, Sim_AHC and SHCoClust. They respectively represent a similarity-based hierarchical clustering and a similarity-based hierarchical co-clustering. We examine their properties and performances through mathematical deduction, experimental verification and evaluation. Then we apply these methods in testing the cluster hypothesis, which is the fundamental assumption in cluster-based Information Retrieval. In such tests, we apply the optimal cluster search to evaluation the retrieval effectiveness of different clustering methods. We examine the computing efficiency and compare the results of the proposed tests. In order to perform clustering on larger datasets, we select Apache Spark platform and provide distributed implementation of Sim_AHC and of SHCoClust. For distributed Sim_AHC, we present the designed computing procedure, illustrate confronted difficulties and provide possible solutions. And for SHCoClust, we provide a distributed implementation of its core, spectral embedding. In this implementation, we use several datasets that vary in size to examine scalability. Classification ascendante hiérarchique Co-clustering Recherche d’informations Hypothèse de cluster Calcul distribué Hierarchical clustering Co-clustering Information Retrieval Cluster hypothesis Distributed computing
4	Impact des situations d’attention partagée sur le traitement de l’information chez les conducteurs novices / Impact of divided attention situations on novice drivers’ information processing Hamama, Houda 09 July 2010 (has links) Ce travail de thèse est centré sur les effets de la distraction sur les performances de conduite. Lorsqu’il conduit, un conducteur doit non seulement être capable de maintenir le contrôle du véhicule, mais également être en mesure de prélever et de traiter les informations pertinentes provenant de l’environnement routier. Ces capacités peuvent être mises à défaut par l’introduction des systèmes de communications et d’informations dans les véhicules qui le placent en situation d’attention partagée et augmentent les sources de distraction. Ce travail a tenté de déterminer comment la population des jeunes conducteurs novices, caractérisée par un fort taux d’accidents (Clarke et al. 2005) et des compétences de conduite faiblement développées (Whelan at al. 2004) gère ces situations d’attention partagée. Deux expérimentations ont alimentés cette thèse. La première, en environnement réel de conduite, visait à analyser les effets de l’utilisation conjointe d’un système de navigation et d’un téléphone portable sur la qualité de la prise d’information et du traitement de l’information (au travers de différents paramètres comportementaux). La seconde, réalisée en laboratoire, était destinée à compléter les résultats de la première expérimentation en se concentrant exclusivement sur les modalités de recherche et de prise d’informations selon que le conducteur soit novice ou expérimenté. En fonction de l’expérience de conduite, les résultats offrent des conclusions mitigées en matière de traitement de l’information en situations d’attention partagée. / This PhD thesis aims to study the distraction effects on driver performances. While driving, a driver must be able to maintain the vehicle control and also to process the relevant information from the road environment. These abilities can be impaired by the introduction of information and communication systems inside the car which put the driver in dual-task situation and increase the sources of distraction. This work tries to determine how the population of young novice drivers, characterized by a high crash rate (Clarke et al. 2005) and by poorly developed driving skills (Whelan et al. 2004) manages these situations of time sharing.Two experimentations were conducted. The first one, on real road, aims at analyzing the effects of simultaneously use of a navigation system and a mobile phone on the information processing (achieve by analyzing behavior parameters). The second one, in laboratory, aims at completing the first results, by focusing on modalities of research and handling information according to the drivers’ experience (novice or experienced). According to the driving experience, results are ambivalent in terms of information processing during divided attention situations. Attention Attention partagée Recherche d’informations Traitement de l’information Conscience de la situation Conducteurs novices Téléphone portable Système de navigation Erreurs Prise de décision Divided attention Information processing Situation awareness Novice drivers Mobile phone Navigation system Errors Decision making
5	Proposition d'un cadre pour l'analyse automatique, l'interprétation et la recherche interactive d'images de bande dessinée / A framework for the automated analysis, interpretation and interactive retrieval of comic books' images Guérin, Clément 24 November 2014 (has links) Le paysage numérique de la culture française et mondiale subit de grands bouleversements depuis une quinzaine d’années avec des mutations historiques des médias, de leur format traditionnel au format numérique, tirant avantageusement parti des nouveaux moyens de communication et des dispositifs mobiles aujourd’hui popularisés. Aux côtés de formes culturelles ayant achevé, ou étant en passe d’achever, leur transition vers le numérique, la bande dessinée tâtonne encore pour trouver sa place dans l’espace du tout dématérialisé. En parallèle de l’émergence de jeunes auteurs créant spécifiquement pour ces nouveaux supports de lecture que sont ordinateurs, tablettes et smartphones, plusieurs acteurs du monde socio-économique s’intéressent à la valorisation du patrimoine existant. Les efforts se concentrent autant sur une démarche d’adaptation des œuvres aux nouveaux paradigmes de lecture que sur celle d’une indexation de leur contenu facilitant la recherche d’informations dans des bases d’albums numérisés ou dans des collections d’œuvres rares. La problématique est double, il s’agit premièrement d’être en mesure d’identifier la structure d’une planche de bande dessinée en se basant sur des extractions de primitives, issues d’une analyse d’image, validées et corrigées grâce à l’action conjointe de deux ontologies, la première manipulant les extractions d’images bas-niveau, la deuxième modélisant les règles de composition classiques de la bande dessinée franco-belge. Dans un second temps l’accent est mis sur l’enrichissement sémantique des éléments identifiés comme composants individuels d’une planche en s’appuyant sur les relations spatiales qu’ils entretiennent les uns avec les autres ainsi que sur leurs caractéristiques physiques intrinsèques. Ces annotations peuvent porter sur des éléments seuls (place d’une case dans la séquence de lecture) ou sur des liens entre éléments (texte prononcé par un personnage). / Since the beginning of the twenty-first century, the cultural industry, both in France and worldwide, has been through a massive and historical mutation. They have had to adapt to the emerging digital technology represented by the Internet and the new handheld devices such as smartphones and tablets. Although some industries successfully transfered a piece of their activity to the digital market and are about to find a sound business model, the comic books industry keeps looking for the right solution and has not yet produce anything as convincing as the music or movie offers. While many new young authors and writers use their creativity to produce specifically digital designed pieces of art, some other minds are focused on the preservation and the development of the already existing heritage. So far, efforts have been concentrated on the transfer from printed to digital support, with a special attention given to their specific features and how they can be used to create new reading conventions. There has also been some concerns about the content indexing, which is a hard task regarding the large amount of data created since the very beginning of the comics history. From a scientific point of view, there are several issues related to these goals. First, it implies to be able to identify the underlying structure of a comic books page. This comes through the extraction of the page's components, their validation and their correction based on the representation and reasoning capacities of two ontologies. The first one focus on the representation of the image analysis concepts and the second one represents the comic books domain knowledge. Secondly, a special attention is given to the semantic enhancement of the extracted elements, based on their spatial relations to each others and on their own characteristics. These annotations can be related to elements only (e.g. the position of a panel in the reading sequence), or to the bound between several elements (e.g. the text pronounced by a character). Bande dessinée Images Données complexes Représentation des connaissances Ontologies Raisonnement spatial Fossé sémantique Recherche d’informations Interactivité Comic books Images Complex data Knowledge representation Ontologies Spatial reasoning Semantic gap Information retrieval Interactivity
6	La programmation DC et la méthode Cross-Entropy pour certaines classes de problèmes en finance, affectation et recherche d’informations : codes et simulations numériques / The DC programming and the cross- entropy method for some classes of problems in finance, assignment and search theory Nguyen, Duc Manh 24 February 2012 (has links) La présente thèse a pour objectif principal de développer des approches déterministes et heuristiques pour résoudre certaines classes de problèmes d'optimisation en Finance, Affectation et Recherche d’Informations. Il s’agit des problèmes d’optimisation non convexe de grande dimension. Nos approches sont basées sur la programmation DC&DCA et la méthode Cross-Entropy (CE). Grâce aux techniques de formulation/reformulation, nous avons donné la formulation DC des problèmes considérés afin d’obtenir leurs solutions en utilisant DCA. En outre, selon la structure des ensembles réalisables de problèmes considérés, nous avons conçu des familles appropriées de distributions pour que la méthode Cross-Entropy puisse être appliquée efficacement. Toutes ces méthodes proposées ont été mises en œuvre avec MATLAB, C/C++ pour confirmer les aspects pratiques et enrichir notre activité de recherche. / In this thesis we focus on developing deterministic and heuristic approaches for solving some classes of optimization problems in Finance, Assignment and Search Information. They are large-scale nonconvex optimization problems. Our approaches are based on DC programming & DCA and the Cross-Entropy method. Due to the techniques of formulation/reformulation, we have given the DC formulation of considered problems such that we can use DCA to obtain their solutions. Also, depending on the structure of feasible sets of considered problems, we have designed appropriate families of distributions such that the Cross-Entropy method could be applied efficiently. All these proposed methods have been implemented with MATLAB, C/C++ to confirm the practical aspects and enrich our research works. Programmation DC et DCA Méthode Cross-Entropy Recherche d’Informations Problème d'affectation Gestion de portefeuille Value-at-Risk DC programming and DCA Cross-Entropy method Search Theory Assignment Problem Portfolio Management Value-at-Risk

1

Page generated in 0.1514 seconds