• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 58
  • 32
  • 9
  • 1
  • Tagged with
  • 96
  • 26
  • 16
  • 15
  • 14
  • 12
  • 12
  • 10
  • 10
  • 9
  • 9
  • 9
  • 8
  • 8
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Etude des déficits cognitifs à l'origine de la dyslexie : influence de la capacité à mémoriser des associations à composante verbale : aspects développementaux et neuropsychologiques / Cognitive deficits causing dyslexia : influence of the ability to store associations with verbal component : a developmental and neuropsychological study

Gérard, Caroline 31 August 2016 (has links)
Cette recherche avait pour objectif d’étudier les troubles cognitifs à l’origine de la dyslexie, et plus particulièrement le déficit d’apprentissage de paires associées (PAL) à composante verbale (input ou output). Tout d’abord, une étude longitudinale menée auprès d’enfants tout-venant pré-lecteurs et apprentis lecteurs a permis de mettre en évidence une contribution spécifique des PAL intermodales à l’efficience ultérieure en lecture/transcription. Les résultats de l’étude neuropsychologique indiquent pour leur part que les enfants dyslexiques présentent un déficit pour tous les types de PAL à composante verbale. Ce déficit apparait toucher à la fois la mémorisation des réponses, notamment verbales, et la mémorisation des liens entre les deux items. Il serait lié à un défaut de stockage de l’information et non à un problème de récupération et affecterait l’apprentissage des paires associées sans entraver leur rétention à long terme. / This research aimed to study the cognitive causes of dyslexia, particularly the paired associate learning (PAL) including a verbal component (input or output) deficit. First, a longitudinal study of normally developing pre-readers and beginning readers highlighted a specific contribution of intermodal PAL as predictors of later reading/transcription skills. As for the results of our neuropsychological study, they indicate that dyslexic children exhibit a deficit for all types of PAL with verbal component. This deficit appears to reach both the memorization of answers, especially verbal answers, and the storage of the mapping between the two items. It would be linked to an information storage failure but not to a recovery problem, and would affect the buildup of associations without impairing their long-term retention.
32

Invariants Topologiques d'Arrangements de droites / Topological invariants of line arrangements

Guerville, Benoît 06 December 2013 (has links)
Cette thèse est le point d’intersection entre deux facettes de l’étude des arrangements de droites : la combinatoire et la topologie. Dans une première partie nous avons étudié l’inclusion de la variété bord dans le complémentaire d’un arrangement. Nous avons ainsi généralisé le résultat d’E. Hironaka au cas de tous les arrangements complexes. Pour contourner les problèmes provenant des arrangements non réels, nous avons étudié le diagramme de câblage, dit wiring diagram, qui code la monodromie de tresses sous forme de tresse singulière. Pour pouvoir l'utiliser, nous avons implémenté un programme sur Sage permettant de calculer ce diagramme en fonction des équations de l’arrangement. Cela nous a permis de d’obtenir deux descriptions explicites de l’application induite par l’inclusion de la variété bord dans le complémentaire sur les groupes fondamentaux. Nous obtenons ainsi deux nouvelles présentations du groupe fondamental du complémentaire d’un arrangement. L’une d’entre elle généralise le théorème de R. Randell au cas des arrangements complexes. Pour continuer ces travaux, nous avons étudié l’application induite par l’inclusion sur le premier groupe d’homologie. Nous obtenons deux descriptions simples de cette application. En s’inspirant des travaux de J.I. Cogolludo, nous décrivons une décomposition canonique du premier groupe d’homologie de la variété bord comme produit de la 1-homologie et de la 2-cohomologie du complémentaire, ainsi qu'un isomorphisme entre la 2-cohomologie du complémentaire et la 1-homologie du graphe d’incidence. Dans la seconde partie de notre travail nous nous sommes intéressés à l’étude des caractères du groupe fondamental du complémentaire. Nous partons des résultats obtenus par E. Artal sur le calcul de la profondeur d’un caractère. Cette profondeur peut être décomposée en un terme projectif et un terme quasi-projectif. Un algorithme pour calculer la partie projective a été donné par A. Libgober. Les travaux de E. Artal concernent la partie quasi-projective. Il a obtenu une méthode pour la calculer en fonction de l’image de certains cycles particuliers du complémentaire par le caractère. En utilisant les résultats obtenus dans la première partie, nous avons obtenu un algorithme complet permettant le calcul de la profondeur quasi-projective d’un caractère. A travers l’étude de cet algorithme, nous avons obtenu une condition combinatoire pour admettre une profondeur quasi-projective potentiellement non combinatoire. Nous avons ainsi défini la notion de caractère inner-cyclic . Cette notion nous a permis de formuler des conditions fortes sur la combinatoire pour qu’un arrangement n’ait que des caractères de profondeur quasi-projective nulle. Enfin pour diminuer le nombre d’exemples à considérer nous avons introduit la notion de combinatoire première. Si une combinatoire ne l’est pas, alors les variétés caractéristiques de ses réalisations sont définies par celles d’un arrangement avec moins de droites. En parallèle à cette étude, nous avons observé que la composition de l’application induite par l’inclusion sur le premier groupe d’homologie avec un caractère nous fournit un invariant topologique de l'arrangement obtenu en désingularisant les points multiples (blow-up). De plus, nous montrons que cet invariant n’est pas de nature combinatoire. Il nous a ainsi permis de découvrir deux nouvelles nc-paires de Zariski. / This thesis is the intersection point between the two facets of the study of line arrangements: combinatorics and topology. In the first part, we study the inclusion of the boundary manifold in the complement of an arrangement. We generalize the results of E. Hironaka to the case of any complex line arrangement. To get around the problems due to the case of non complexified real arrangement, we study the braided wiring diagram. We develop a Sage program to compute it from the equation of the complex line arrangement. This diagram allows to give two explicit descriptions of the map induced by the inclusion on the fundamental groups. From theses descriptions, we obtain two new presentations of the fundamental group of the complement. One of them is a generalization of the R. Randell Theorem to any complex line arrangement. In the next step of this work, we study the map induced by the inclusion on the first homology group. Then we obtain two simple descriptions of this map. Inspired by ideas of J.I. Cogolludo, we give a canonical description of the homology of the boundary manifold as the product of the 1-homology with the 2-cohomology of the complement. Finally, we obtain an isomorphism between the 2-cohomology of the complement with the 1-homology of the incidence graph of the arrangement. In the second part, we are interested by the study of character on the group of the complement. We start from the results of E. Artal on the computation of the depth of a character. This depth can be decomposed into a projective term and a quasi-projective term, vanishing for characters that ramify along all the lines. An algorithm to compute the projective part is given by A. Libgober. E. Artal focuses on the quasi-projective part and gives a method to compute it from the image by the character of certain cycles of the complement. We use our results on the inclusion map of the boundary manifold to determine these cycles explicitly. Combined with the work of E. Artal we obtain an algorithm to compute the quasi-projective depth of any character. From the study of this algorithm, we obtain a strong combinatorial condition on characters to admit a quasi-projective depth potentially not determined by the combinatorics. With this property, we define the inner-cyclic characters. From their study, we observe a strong condition on the combinatorics of an arrangement to have only characters with null quasi-projective depth. Related to this, in order to reduce the number of computations, we introduce the notion of prime combinatorics. If a combinatorics is not prime, then the characteristics varieties of its realizations are completely determined by realization of a prime combinatorics with less line. In parallel, we observe that the composition of the map induced by the inclusion with specific characters provide topological invariants of the blow-up of arrangements. We show that the invariant captures more than combinatorial information. Thereby, we detect two new examples of nc-Zariski pairs.
33

Mesure de la section efficace de production de paires de quarks top dans le canal lepton+tau+jets+met dans l'expérience D0 et interprétation en terme de boson de Higgs chargé

Lacroix, F. 05 December 2008 (has links) (PDF)
Le modèle standard de la physique des particules décrit la matière constituée de particules élémentaires qui interagissent via les interactions fortes et électrofaibles. Le quark top est le quark le plus lourd décrit par ce modèle et a été découvert en 1995 par les collaborations CDF et D0 dans les collisions proton-antiproton du Tevatron. Cette thèse est consacrée à la mesure de la section efficace de production de paire de quarks top par interaction forte, dans un état final contenant un lepton, un tau hadronique, deux jets de b et de l'énergie transverse manquante. Cette analyse utilise les données collectées au début du Run IIb entre juillet 2006 et aout 2007, soit une luminosité de 1,2 fb-1 qui sont combinées avec les données du Run IIa pour atteindre une luminosité de 2,2 fb-1. Une partie du travail de thèse décrit ici est consacrée au système de déclenchement du détecteur D0, qui constitue la première étape de toutes les analyses, et en particulier à l'identification des leptons taus au niveau 3 du système de déclenchement et aux déclenchements « jets+met » basés sur la présence de jets et d'énergie transverse manquante. La problématique de la résolution en énergie des jets est également abordée, sous l'angle de<br />l'intercalibration en eta du calorimètre hadronique et avec l'utilisation du détecteur de pied de gerbe central (CPS) dans la définition de l'énergie des jets. La section efficace de production de paires de quark top obtenue est :<br />sigma=7,32+1,34-1,24(stat)+1,20-1,06(syst)±0,45(lumi) pb<br />Cette mesure est en accord avec les prédictions du modèle standard et permet de contraindre la présence de nouvelle physique, telle que l'existence d'un boson de Higgs chargé plus léger que le quark top. Une limite d'exclusion a ainsi été obtenue dans le plan (tan beta, mH±) et est présentée dans la dernière partie de ce manuscrit.
34

Interprétation et traitement des données de sonde atomique tomographique : application à la precipitation dans les Al-Mg-Si

De Geuser, Frederic 13 December 2005 (has links) (PDF)
Les alliages Al-Mg-Si-(Cu) de la série 6016 sont utilisés sous forme de tôles pour<br />la réalisation d'ouvrants dans l'industrie automobile. Leur particularité est de pouvoir<br />être durcis durant la cuisson des peintures (typiquement 30 minutes à 185°C). Ce phénomène<br />s'explique par un durcissement structural : le traitement thermique de cuisson des<br />peintures appliqué à une solution solide sursaturée active la diffusion des solutés et la précipitation<br />de phases métastables plus ou moins cohérentes avec la matrice d'aluminium<br />qui vont ralentir le mouvement des dislocations.<br />Ces différentes phases métastables ont des tailles extrêmement petites (parfois inférieures<br />à 1nm), ce qui les rend difficiles à analyser autrement qu'en sonde atomique tomographique.<br />Une attention toute particulière a été apportée au développement de nouvelles<br />techniques d'interprétation et de traitement des données afin de faire reculer les limites de<br />l'instrument.<br />Grâce à la sonde atomique, parfois couplée au microscope électronique en transmission,<br />les mécanismes de précipitation de la phase beta" ont été mieux compris. En particulier,<br />nous avons montré qu'un traitement de prérevenu à 90°C appliqué avant le revenu rendait<br />ce dernier plus efficace par la formation d'amas diffus de Mg et de Si qui augmentent la<br />densité numérique d'objets durcissants (amas +beta"). La présence d'aluminium dans les<br />précipités a été démontrée.<br />L'effet du prérevenu sur la corrélation entre les atomes durant les tout premiers stades<br />de décomposition a été étudié directement par le calcul de fonctions partielles de corrélation<br />de paires. Cette méthode a également permis de suggérer un scénario expliquant le<br />durcissement pendant le stockage à l'ambiante par la formation d'atmosphères de solutés<br />autour des dislocations, ralentissant ainsi leur mouvement.
35

Transport quantique dans des nanostructures hybrides

Kontos, Takis 15 October 2009 (has links) (PDF)
Ce mémoire illustre les recherches que j'ai menées pendant les sept dernières années. Depuis ma thèse, mon activité a visé à explorer le transport quantiques dans différents types de nanostructures hybrides. Dans ces structures, il s'agit de combiner des conducteurs comportant différents ordres électroniques ou bien différentes dimensionalités. Une des idées principales qui ont guidé mes recherches est d'implémenter des expériences de pensée de transport quantique en utilisant de tels systèmes. Mon travail s'est décliné autour de trois thématiques distinctes : la coexistence entre l'ordre ferromagnétique et l'ordre supraconducteur, l'électronique de spin moléculaire et l'effet Kondo dans les boîtes quantiques. Le premier chapitre a pour but de mettre en exergue la richesse des nanotubes de carbone pour l'élaboration de structures hybrides. Au chapitre 2, je présente l'expérience d'injection de spin dans les nanotubes et la replace dans son contexte général. Dans le chapitre 3, je détaille les expériences de mesures de bruit que j'ai menées récemment. Les chapitres 1, 2 et 3 sont indépendants. A la fin des chapitres 2 et 3, je détaille les développements immédiats des études présentées. Je conclue enfin en indiquant les perspectives de mon travail, essentiellement reliées à la mesure directe des aspect dynamiques de nano-circuits hybrides.
36

Rôle des états de Rydberg dans la dynamique de photoionisation et de formation de paires d'ions (NO+,O-) de la molécule NO2 : photoémission induite par rayonnement synchrotron et impulsions lasers femtosecondes

Marggi Poullain, Sonia 14 January 2014 (has links) (PDF)
L'étude comparée des réactions de formation de paires d'ions et de simple photoionisation de la molécule NO2 induites par rayonnement synchrotron (RS) d'une part et par impulsions laser femtosecondes (fs) d'autre part, démontre le rôle remarquable de l'excitation résonante d'états de Rydberg dans la dynamique électronique et nucléaire induite. Trois réactions principales, la photoionisation non dissociative (NO2+ (X 1Σ+g) + e), la photoionisation dissociative (NO+ (X 1Σ+) + O(3P) + e) et la formation de paires d'ions, (NO+ (X 1Σ+) + O- (2P)), ont été caractérisées en utilisant la méthode des corrélations vectorielles ou spectroscopie en coïncidence des impulsions du photoélectron et des photoions, auprès des sources RS (SOLEIL, DESIRS) et lasers fs (CEA, Saclay), respectivement. Le diagramme de corrélation des énergies cinétiques électron-ion, première observable issue de ces mesures, met en évidence un partage de l'énergie en excès entre noyaux et électrons qui dépend fortement du mode d'excitation photonique. Les déviations significatives observées par rapport aux profils d'ionisation de type Franck Condon sont attribuées à des couplages vibroniques entre états excités NO2*, tels que ceux induits par une intersection conique. Les chemins réactionnels identifiés confirment le rôle de l'excitation des séries de Rydberg [R*(6a1)-1] et [R*(4b2)-1] intervenant comme états intermédiaires dans l'excitation multiphotonique ou dans le continuum d'ionisation exploré. Une étude complémentaire par spectroscopie à haute résolution des états [R*(6a1)-1] a été mise en œuvre (UBC, Vancouver).Pour une réaction de photoionisation dissociative (PID), l'observable la plus complète est la distribution angulaire des photoélectrons dans le référentiel lié à la vitesse de recul de l'ion fragment (RFPAD) déduite de la mesure de la corrélation vectorielle (Vi, Ve, P). Afin d'accéder aux éléments de matrice dipolaire décrivant la photoionisation de l'état électronique considéré, le formalisme développé en collaboration avec R. R. Lucchese (Texas A&M) décrivant la photoémission dans le référentiel moléculaire pour la simple PID d'une molécule linéaire par excitation à un photon, a été étendu à l'étude des réactions de PID par excitation multiphotonique d'une molécule polyatomique, telle que la molécule NO2 de symétrie C2v. L'analyse multivariée de la RFPAD multiphotonique proposée constitue une stratégie fructueuse en vue d'extraire l'information optimale sur la dynamique complexe de photoionisation et de réaliser une comparaison détaillée entre les résultats expérimentaux et les calculs de photoionisation des états excités de la molécule.
37

Weaving an ambiguous lexicon / Construire un lexique ambigu

Dautriche, Isabelle 18 September 2015 (has links)
Il y a (au moins) deux questions fondamentales que l’on est amené à se poser lorsqu’on étudie le langage: comment acquiert-on le langage? —le problème d’apprentissage —et pourquoi les langues du monde partagent certaines propriétés mais pas d’autres? —le problème typologique. Dans cette thèse, j’entreprends de relier ces deux domaines en me focalisant sur le lexique, l’ensemble des mots de notre langue et leur sens associés, en posant les questions suivantes: pourquoi le lexique est-il tel qu’il est? Et est-ce que les propriétés du lexique peuvent être (en partie) expliquées par la façon dont les enfants apprennent leur langue? Un des aspects les plus frappants du lexique est que les mots que nous utilisons sont ambigus et peuvent être confondus facilement avec d’autres. En effet, les mots peuvent avoir plusieurs sens (par exemple, les homophones) et sont représentés par un ensemble limité de sons qui augmentent la possibilité qu’ils soient confondus (par exemple, les paires minimales). L’existence de ces mots semble présenter un problème pour les enfants qui apprennent leur langue car il a été montré qu’ils ont des difficultés à apprendre des mots dont les formes sonores sont proches et qu’ils résistent à l’apprentissage des mots ayant plusieurs sens. En combinant une approche computationnelle et expérimentale, je montre, quantitativement, que les mots du lexique sont, en effet, plus similaires que ce qui serait attendu par chance, et expérimentalement, que les enfants n’ont aucun problème à apprendre ces mots à la condition qu’ils apparaissent dans des contextes suffisamment distincts. Enfin, je propose que l’étude des mots ambigus permet de révéler des éléments importants du mécanisme d’apprentissage du langage qui sont actuellement absents des théories actuelles. Cet ensemble d’études suggère que les mots ambigus et les mots similaires, bien que présents dans le langage, n’apparaissent pas arbitrairement dans le langage et que leur organisation reflète (en partie) la façon dont les enfants apprennent leur langue. / Modern cognitive science of language concerns itself with (at least) two fundamental questions: how do humans learn language? —the learning problem —and why do the world’s languages exhibit some properties and not others? —the typology problem. In this dissertation, I attempt to link these two questions by looking at the lexicon, the set of word-forms and their associated meanings, and ask why do lexicons look the way they are? And can the properties exhibited by the lexicon be (in part) explained by the way children learn their language? One striking observation is that the set of words in a given language is highly ambiguous and confusable. Words may have multiple senses (e.g., homonymy, polysemy) and are represented by an arrangement of a finite set of sounds that potentially increase their confusability (e.g., minimal pairs). Lexicons bearing such properties present a problem for children learning their language who seem to have difficulty learning similar sounding words and resist learning words having multiple meanings. Using lexical models and experimental methods in toddlers and adults, I present quantitative evidence that lexicons are, indeed, more confusable than what would be expected by chance alone. I then present empirical evidence suggesting that toddlers have the tools to bypass these problems given that ambiguous or confusable words are constrained to appear in distinct context. Finally, I submit that the study of ambiguous words reveal factors that were currently missing from current accounts of word learning. Taken together this research suggests that ambiguous and confusable words, while present in the language, may be restricted in their distribution in the lexicon and that these restrictions reflect (in part) how children learn languages.
38

Spectroscopie optique des paires d'ions : De la caractérisation des modèles en phase gazeuse à l'identification des paires d'ions en solution / Optical spectroscopy of ion pairs : From the Characterization of Gas Phase Models to Identifying Ion Pairs in Solution

Habka, Sana 15 September 2017 (has links)
Les appariements d’ions sontomniprésents dans la nature, des océans auxaérosols, et passant par les organismes vivants.Les paires d’ions présentes dans les solutionsriches en ions y jouent un rôle crucial, notammentdans le déroulement des mécanismes réactionnelschimiques et biochimiques. En dépit de leurimportance, la caractérisation expérimentale despaires en solution reste problématique en raison dela coexistence de plusieurs types. Ainsi, le premierobjectif de ce travail est de développer uneapproche originale en phase gazeuse, pour l’étudedes paires d’ions modèles entre un groupementcarboxylate et un cation alcalin, illustrant le typed’appariement observé dans le milieu biologique.Ces premières études sont menées à l’aide d’uneapproche de spectroscopie IR et UV sélective enconformation, combinée à des calculs au niveauchimie quantique sur des modèles de formulegénérale (C6H5-(CH2)n-COO-, M+; M = Li, Na, K,Rb, Cs et n ≤ 4). L’appariement entre les ions a étéainsi caractérisé sur l’ensemble de ces systèmes, etune compétition entre les interactions cation-anionet cation-π a été observée pour les systèmes de plusgrande taille.Dans un second temps, une étude théorique estdéveloppée dans l’objectif de proposer un spectrethéorique pour chaque type de paires, et de leconfronter aux spectres expérimentaux en solutionde la littérature. L’approche repose sur le calcul dela signature vibrationnelle de paires (CH3-COO-,M+; M = Li, Na) et de l’anion libre, entouréssuccessivement de molécules d’eau explicitesdécrites au niveau chimie quantique, puis auniveau champ de force et enfin par un modèle desolvant continu.Cet apport original pour l’étude des paires d’ionsneutres ouvre la voie vers une meilleurecaractérisation de ces paires dans les solutions électrolytiques. / Ion pairs are ubiquitous in nature andwere documented in sea waters, aerosols andliving organisms, thus they play a crucial role inmany chemical and biochemical mechanisms.Although many experimental approaches aimedat identifying these ion pairs in solutions, theyfailed in characterizing their microscopicproperties, mainly due to the coexistence of manytypes of pairs in solution. This original study aimsto identify the structural properties of ion pairmodels in the gas phase that depicts theinteraction between carboxylate group and alkalication, largely present in biological media.Model systems (M+, C6H5(CH2)nCOO-, M = Li,Na, K, Rb, Cs and n ≤ 4) were the subject of thefirst studies conducted using gas phaseconformational selective IR and UV spectroscopycombined to quantum chemistry calculations.Among the identified structures, we found asecondary interaction between the cation andphenyl ring (cation-π interaction) for systems witha flexible carbon chain, which led us to study thecompetition between cation-anion and cation-πinteractions.The second study developed focused mainly oncharacterizing ion pairs (M+, CH3COO-; M = Li,Na) and free anion in solution, where the firstsolvation layer were described at the quantumlevel, followed by a solvent continuum. Thus thevibrationnal signatures proposed for theseaggregates were compared to solution spectra inlitterature, thus offering a reliable structuralassignement.This study on neutral ion pairs paves way to a betterunderstanding of ion pairing and offers a uniqueapproach to adress the structural characterization ofthese systems in solution.
39

Fusion de connaissances imparfaites pour l'appariement de données géographiques : proposition d'une approche s'appuyant sur la théorie des fonctions de croyance / Imperfect knowledge fusion for matching geographical data : approach based on belief theory

Olteanu, Ana-Maria 24 October 2008 (has links)
De nos jours, il existe de nombreuses bases de données géographiques (BDG) couvrant le même territoire. Les données géographiques sont modélisées différemment (par exemple une rivière peut être modélisée par une ligne ou bien par une surface), elles sont destinées à répondre à plusieurs applications (visualisation, analyse) et elles sont créées suivant des modes d’acquisition divers (sources, processus). Tous ces facteurs créent une indépendance entre les BDG, qui pose certains problèmes à la fois aux producteurs et aux utilisateurs. Ainsi, une solution est d’expliciter les relations entre les divers objets des bases de données, c'est-à-dire de mettre en correspondance des objets homologues représentant la même réalité. Ce processus est connu sous le nom d’appariement de données géographiques. La complexité du processus d’appariement fait que les approches existantes varient en fonction des besoins auxquels l'appariement répond, et dépendent des types de données à apparier (points, lignes ou surfaces) et du niveau de détail. Nous avons remarqué que la plupart des approches sont basées sur la géométrie et les relations topologiques des objets géographiques et très peu sont celles qui prennent en compte l’information descriptive des objets géographiques. De plus, pour la plupart des approches, les critères sont enchaînés et les connaissances sont à l’intérieur du processus. Suite à cette analyse, nous proposons une approche d’appariement de données qui est guidée par des connaissances et qui prend en compte tous les critères simultanément en exploitant à la fois la géométrie, l’information descriptive et les relations entre eux. Afin de formaliser les connaissances et de modéliser leurs imperfections (imprécision, incertitude et incomplétude), nous avons utilisé la théorie des fonctions de croyance [Shafer, 1976]. Notre approche d’appariement de données est composée de cinq étapes : après une sélection des candidats, nous initialisons les masses de croyance en analysant chaque candidat indépendamment des autres au moyen des différentes connaissances exprimées par divers critères d’appariement. Ensuite, nous fusionnons les critères d’appariement et les candidats. Enfin, une décision est prise. Nous avons testé notre approche sur des données réelles ayant des niveaux de détail différents représentant le relief (données ponctuelles) et les réseaux routiers (données linéaires) / Nowadays, there are many geographic databases, (GDB), covering the same reality. The geographical data are represented differently (for example a river can be represented by a line or a polygon), they are used in different applications (visualisation, analysis) and they are created using various modes of acquisition (sources, processes). All these factors create independence between GDB, which causes problems for both producers and users. Thus, a solution is to clarify the relationships between various database objects, i.e. to match homologous objects, which represent the same reality. This process is known as spatial data matching. Because of the complexity of the matching process, the existing approaches depend on the types of data (points, lines or polygons) and the level of detail of the GDB. We realised, that most of the approaches are based on the geometry and the topology of the geographical objects, and very few approaches take into account the descriptive information of geographical objects. Besides, for most approaches, the criteria are applied one after the other and knowledge is contained within the process. Following this analysis, we proposed a matching approach that is guided by knowledge and takes into account all criteria at the same time exploiting the geometry, descriptive information and relations between geographical objects. In order to formalise knowledge and model their imperfections (imprecision, uncertainty and incompleteness), we used the Belief Theory [Shafer, 1976]. Our approach of the data matching is composed of five steps. After a selection of candidates, the masses of beliefs are initialised by analysing each candidate separately from the others using different knowledge expressed by various matching criteria. Then, the matching criteria and candidates are fusioned. Finally, a decision is taken. Our approach has been tested on real data having different levels of detail and representing relief (data points) and road networks (linear data)
40

Learning from ranking data : theory and methods / Apprendre des données de classement : théorie et méthodes

Korba, Anna 25 October 2018 (has links)
Les données de classement, c.à. d. des listes ordonnées d'objets, apparaissent naturellement dans une grande variété de situations, notamment lorsque les données proviennent d’activités humaines (bulletins de vote d'élections, enquêtes d'opinion, résultats de compétitions) ou dans des applications modernes du traitement de données (moteurs de recherche, systèmes de recommendation). La conception d'algorithmes d'apprentissage automatique, adaptés à ces données, est donc cruciale. Cependant, en raison de l’absence de structure vectorielle de l’espace des classements et de sa cardinalité explosive lorsque le nombre d'objets augmente, la plupart des méthodes classiques issues des statistiques et de l’analyse multivariée ne peuvent être appliquées directement. Par conséquent, la grande majorité de la littérature repose sur des modèles paramétriques. Dans cette thèse, nous proposons une théorie et des méthodes non paramétriques pour traiter les données de classement. Notre analyse repose fortement sur deux astuces principales. La première est l’utilisation poussée de la distance du tau de Kendall, qui décompose les classements en comparaisons par paires. Cela nous permet d'analyser les distributions sur les classements à travers leurs marginales par paires et à travers une hypothèse spécifique appelée transitivité, qui empêche les cycles dans les préférences de se produire. La seconde est l'utilisation des fonctions de représentation adaptées aux données de classements, envoyant ces dernières dans un espace vectoriel. Trois problèmes différents, non supervisés et supervisés, ont été abordés dans ce contexte: l'agrégation de classement, la réduction de dimensionnalité et la prévision de classements avec variables explicatives.La première partie de cette thèse se concentre sur le problème de l'agrégation de classements, dont l'objectif est de résumer un ensemble de données de classement par un classement consensus. Parmi les méthodes existantes pour ce problème, la méthode d'agrégation de Kemeny se démarque. Ses solutions vérifient de nombreuses propriétés souhaitables, mais peuvent être NP-difficiles à calculer. Dans cette thèse, nous avons étudié la complexité de ce problème de deux manières. Premièrement, nous avons proposé une méthode pour borner la distance du tau de Kendall entre tout candidat pour le consensus (généralement le résultat d'une procédure efficace) et un consensus de Kemeny, sur tout ensemble de données. Nous avons ensuite inscrit le problème d'agrégation de classements dans un cadre statistique rigoureux en le reformulant en termes de distributions sur les classements, et en évaluant la capacité de généralisation de consensus de Kemeny empiriques.La deuxième partie de cette théorie est consacrée à des problèmes d'apprentissage automatique, qui se révèlent être étroitement liés à l'agrégation de classement. Le premier est la réduction de la dimensionnalité pour les données de classement, pour lequel nous proposons une approche de transport optimal, pour approximer une distribution sur les classements par une distribution montrant un certain type de parcimonie. Le second est le problème de la prévision des classements avec variables explicatives, pour lesquelles nous avons étudié plusieurs méthodes. Notre première proposition est d’adapter des méthodes constantes par morceaux à ce problème, qui partitionnent l'espace des variables explicatives en régions et assignent à chaque région un label (un consensus). Notre deuxième proposition est une approche de prédiction structurée, reposant sur des fonctions de représentations, aux avantages théoriques et computationnels, pour les données de classements. / Ranking data, i.e., ordered list of items, naturally appears in a wide variety of situations, especially when the data comes from human activities (ballots in political elections, survey answers, competition results) or in modern applications of data processing (search engines, recommendation systems). The design of machine-learning algorithms, tailored for these data, is thus crucial. However, due to the absence of any vectorial structure of the space of rankings, and its explosive cardinality when the number of items increases, most of the classical methods from statistics and multivariate analysis cannot be applied in a direct manner. Hence, a vast majority of the literature rely on parametric models. In this thesis, we propose a non-parametric theory and methods for ranking data. Our analysis heavily relies on two main tricks. The first one is the extensive use of the Kendall’s tau distance, which decomposes rankings into pairwise comparisons. This enables us to analyze distributions over rankings through their pairwise marginals and through a specific assumption called transitivity, which prevents cycles in the preferences from happening. The second one is the extensive use of embeddings tailored to ranking data, mapping rankings to a vector space. Three different problems, unsupervised and supervised, have been addressed in this context: ranking aggregation, dimensionality reduction and predicting rankings with features.The first part of this thesis focuses on the ranking aggregation problem, where the goal is to summarize a dataset of rankings by a consensus ranking. Among the many ways to state this problem stands out the Kemeny aggregation method, whose solutions have been shown to satisfy many desirable properties, but can be NP-hard to compute. In this work, we have investigated the hardness of this problem in two ways. Firstly, we proposed a method to upper bound the Kendall’s tau distance between any consensus candidate (typically the output of a tractable procedure) and a Kemeny consensus, on any dataset. Then, we have casted the ranking aggregation problem in a rigorous statistical framework, reformulating it in terms of ranking distributions, and assessed the generalization ability of empirical Kemeny consensus.The second part of this thesis is dedicated to machine learning problems which are shown to be closely related to ranking aggregation. The first one is dimensionality reduction for ranking data, for which we propose a mass-transportation approach to approximate any distribution on rankings by a distribution exhibiting a specific type of sparsity. The second one is the problem of predicting rankings with features, for which we investigated several methods. Our first proposal is to adapt piecewise constant methods to this problem, partitioning the feature space into regions and locally assigning as final label (a consensus ranking) to each region. Our second proposal is a structured prediction approach, relying on embedding maps for ranking data enjoying theoretical and computational advantages.

Page generated in 0.0747 seconds