• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 577
  • 287
  • 61
  • 4
  • 1
  • Tagged with
  • 884
  • 443
  • 155
  • 95
  • 94
  • 92
  • 85
  • 82
  • 79
  • 79
  • 78
  • 76
  • 72
  • 72
  • 62
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
141

L'ouverture sociale comme configuration : pratiques et processus de sélection et de socialisation des milieux populaires dans les établissements d'élite : une comparaison France-Angleterre / Widening participation and access in a figurational perspective : selection process and socialisation of working-class pupils in elite universities : a comparison between France and England

Allouch, Annabelle 05 December 2013 (has links)
À partir du cas des dispositifs d’ouverture sociale lancés en France et en Angleterre, cette thèse aborde la question des effets des institutions d’élite sur les processus de stratification sociale, dans un contexte d’internationalisation de l’enseignement supérieur. En nous concentrant sur la mise en œuvre de ces dispositifs, nous avons apporté trois éclairages sur ce débat : - Le travail d’ajustement des institutions repose sur leur capacité à instituer des liens d’interdépendance, qui assurent une cohésion autour de la lecture commune des inégalités sociales. Plus précisément, les institutions contribuent à affecter le fonctionnement des politiques éducatives en matière d’ouverture sociale, en promouvant des modes de coopération entre des « univers » qui s’ignoraient relativement auparavant. - Par ailleurs, le travail d’ajustement engendre des changements dans les processus de certification. Il conduit les institutions à promouvoir de nouvelles conventions de jugement comme le potentiel. - Enfin, le travail des institutions concerne aussi leur capacité à transmettre des normes scolairement légitimes dans le cadre d’espaces de socialisation anticipatrice, comme le tutorat. La comparaison des dispositifs entre les deux pays étudiés souligne la convergence dans le traitement et la temporalité des ajustements. Alors que la question de la diversification des élites apparaît comme spécifique à chaque espace national, l’analyse comparée souligne l’existence de traits communs entre les institutions et l’impact de l’internationalisation sur cette question.Cette thèse porte sur les cas de Sciences Po, de l’ESSEC et de l’Université d’Oxford. / Widening participation programmes have been launched simultaneously in both France and England in the 2000s. They stem from the idea that it is necessary for elite universities, despite their traditional mission of elite education, to get involved in the field of antidiscrimination and thus develop measures to increase equality of opportunity and diversify their student body. This thesis highlights the impact of these programmes on the way to address social inequalities in the educational sector. In fact, widening participation schemes contribute to the dissemination of a new interpretation of social mobility on the basis of a compensation targeting talented pupils (Pupils identified as “with potential”) rather than sustaining the most deprived of them. It is allowed by the current withdrawal of the traditional role of the Welfare state in education (in a context of financial crisis) which increases the pressure on universities (through financial incentives), in the name of their social responsibility towards society. This work is based on an ethnographic survey led in three French and English elite institutions, including the University of Oxford, Sciences Po and ESSEC.
142

Evaluation de la méthode des personas en intervention corrective, préventive et prospective / Evaluation of persona method during corrective, preventive and prospective interventions

Christophe, Corinne 21 March 2014 (has links)
Cette thèse s’inscrit dans le cadre des recherches menées sur la méthode des personas. Modèles d’utilisateurs, les personas restituent de manière personnalisée des comportements, des attitudes ou encore des contextes d’usage. A ce titre, ils sont utilisés dans le domaine de la conception de produits numériques. Nous proposons, plus largement, de les mobiliser au cours d’interventions axées sur la santé des salariés et la performance des systèmes. En effet, les personas sont considérés dans la littérature comme un outil puissant de génération et de sélection des idées. De plus, les travaux menés principalement en psychologie de la créativité permettent de penser que les personas sont effectivement susceptibles d’améliorer les performances créatives des acteurs impliqués dans un processus de transformation ou de conception. Néanmoins, très peu de recherches ont porté sur cet aspect. La question est donc d’établir la capacité des personas à générer des idées nouvelles et adaptées. Cinq études ont été conduites pour répondre à cette question. Elles montrent que les personas ne se distinguent pas des autres sources d’inspiration étudiées par le nombre d’idées générées. Leur apport fondamental se situe au niveau de la nature des idées produites et de leur capacité à instrumenter la sélection de ces idées. De plus, les personas soutiennent la construction de représentations communes, la simulation langagière et l’activité argumentative dans les groupes de travail. Ces résultats confirment l’utilité du recours aux personas dans un processus de transformation ou de conception. Ils ouvrent des perspectives sur un enrichissement de l’intervention / This thesis is part of the research on personas. As user models, personas restore in a personalized way, behaviors, attitudes or contexts of use. Thus, they are commonly used in the field of digital product design. We propose using them in a broader context i.e in interventions focused in occupational health and systems performance. In the literature on personas they are considered as a powerful tool for idea generation and idea selection. In addition, the research mainly in the domain of the psychology of creativity shows that personas are actually likely to improve creative performance. However, very few studies have focused on this aspect. The question is to establish whether the personas are able to generate new and relevant ideas. Five studies were carried out to answer this question. They indicate that personas do not generate more ideas than other sources of inspiration taken into consideration. Their fundamental contribution lies in the nature of the ideas generated and in their ability to orchestrate the selection of these ideas. Moreover, personas support the construction of common representations, the simulation activity and the discussion in the working groups. These results confirm the contribution of personas to a transformation or design process. They allow us to open up perspectives for an enrichment of the intervention
143

Prise en compte d’informations a priori en sélection génomique dans un dispositif d’hybrides de tournesol (Helianthus annuus L.) / Taking into account a priori information in genomic selection in a sunflower hybrid design

Bonnafous, Fanny 18 December 2017 (has links)
La sélection génomique (GS) est un outil puissant pour prédire les phénotypes ou les valeurs génétiques d'individus encore non observés, sur la base d'un panel à la fois phénotypé et génotypé. Les modèles mixtes GBLUP habituellement utilisés prennent en compte tous les marqueurs simultanément, en postulant que leurs effets suivent tous la même distribution gaussienne. Les connaissances des mécanismes biologiques sous-jacent à la variation phénotypique ne sont donc pas pris en compte dans une telle modélisation. Le but de cette thèse est d'intégrer dans des modèles GBLUP des connaissances a priori, comme des régions génomique impliquées dans la variation des caractères d'intérêt ou encore des réseaux de gènes, afin d'évaluer le potentiel d'amélioration de la précision de prédiction. Ces modèles ont été appliqués à l'espèce de tournesol Helianthus annuus L., sur trois caractères (la floraison, le rendement et la sénescence foliaire) dans 13 environnements différents. L'un des principaux défis des études sur les hybrides de tournesol est de modéliser la vigueur hybride, ou hétérosis. Différentes hypothèses, incluant la dominance, la superdominance et l'épistasie ont été proposées pour clarifier les mécanismes génétiques sous-jacents au phénomène de l'hétérosis, mais leur importance n'est pas clairement connue. Dans ce contexte, la première partie de cette étude a eu pour but de tester l'efficacité de la GS dans une population d'hybrides provenant du croisement de 36 lignées femelles avec 36 lignées mâles. Pour cela des modèles prenant en compte des effets non-additifs ont été expérimentés, et les résultats validés expérimentalement en champ sur deux années. La prédiction des valeurs génétiques des hybrides ayant été concluante, nous avons ensuite cherché des informations a priori à intégrer à ces modèles. Des SNPs impliqués dans la variation des trois caractères d'intérêt ont été recherchés à l'aide de plusieurs modèles de GWAS (additifs et non-additifs). De plus, dans la perspective de tester des modèles prenant en compte des interactions épistatiques, des SNPs localisés dans des réseaux de gènes connus ont été recherchés. La dernière partie de cette thèse a eu pour but d'intégrer aux modèles GBLUP ces régions génomiques impliquées dans la variation des caractères. Deux méthodes ont été utilisées pour cela, à savoir la modélisation des informations a priori dans la partie aléatoire (modèle MultiBLUP) ou dans la partie fixe des modèles. Ces méthodes ne montrent pas d'amélioration significative des précisions de prédiction par rapport aux modèles GBLUP sans information a priori. / Genomic selection is a powerful tool for predicting phenotypes or genetic values of non-observed individuals, based on a panel both phenotyped and genotyped. The mixed models GBLUP usually utilized take into account all markers simultaneously, assuming that all their effects all follow the same Gaussian distribution. Knowledge of the biological mechanisms underlying phenotypic variation is therefore not taken into account in such modeling. The aim of this thesis is to integrate in GBLUP models a priori knowledge, such as genomic regions involved in the variation of the traits of interest or networks of genes, in order to evaluate the potential for improvement of accuracies. These models were applied to the Helianthus annuus L. sunflower specie on three traits (flowering time, yield and leaf senescence) in 13 several environments. One of the main challenges of genetic studies on sunflower hybrids is to model hybrid vigor, or heterosis. Different hypotheses, including dominance, over-dominance and epistasis have been proposed to clarify the genetic mechanisms underlying the heterosis phenomenon, but their importance is not clearly known. In this context, the first part of this study aimed to test the efficiency of the GS in an hybrid population from the crossing of 36 female lines with 36 male lines. For this purpose, models taking into account non-additive effects were experimented, and the results validated experimentally in field over two years. The prediction of the genetic values of the hybrids was conclusive, so we looked for a priori information to integrate with these models. SNPs involved in the variation of the three traits of interest were searched using several models of GWAS (additive and non-additive). Moreover, in order to test models taking into account epistatic interactions, SNPs located in known gene networks have been sought. Finally the integration of the genomic regions involved in the variation of the traits, into the GBLUP models, was conducted. Two methods were implemented for this, namely the modeling of a priori information in the random part (MultiBLUP model) or in the fixed part of the models. These methods do not show significant improvement in accuracies compared to GBLUP models without a priori information.
144

Cultures multi-parallélisées en millifluidique digitale : diversité et sélection artificielle / Multi-parallelised cultures with digital millifluidic : diversity and artificial selection

Dupin, Jean-Baptiste 15 June 2018 (has links)
Le rôle des communautés de bactéries est essentiel dans les écosystèmes, mais aussi dans l’industrie, l’agriculture ou le secteur de la santé. La structure de ces communautés accroit leurs applications potentielles par rapport aux bactéries isolées. Si manipuler et faire évoluer une souche bactérienne est devenu courant, il n’existe pourtant pas de technologie permettant de cultiver, manipuler, sélectionner et en faire évoluer des communautés. Ce travail de thèse concerne la conception, le développement et la caractérisation d’un outil pouvant y aboutir en millifluidique digitale. Avec cet outil nous manipulons un millier de cultures de bactéries sous la forme de gouttes incubées et analysées en continu, et dont nous souhaiterions diriger l’évolution. La dérive génétique, les flux géniques, la diversification et la sélection sont les quatre agents de l’Évolution qui fixèrent les quatre axes de ce travail. La conservation des diversités spécifiques à une culture et entre elles conditionne la conception de notre outil. Son utilisation implique des échanges entre cultures que nous avons caractérisés. Nous avons créé un protocole permettant d’évaluer la diversité de ces cultures, et donc de les discriminer pour mieux les sélectionner. Nous avons finalement conçu un système permettant d’automatiser leur sélection artificielle : leur évolution dirigée est à portée de main. / The role of bacterial communities is essential in ecosystems, but also in the industry, agriculture and human health. Communities’ structure increases their potential applications unlike isolated bacteria. While the culture and engineering of a bacterial strain has become common, currently no technology exists to allow cultivation, handling, selection and evolution of bacterial communities. This work focuses on the design, development and characterization of a tool which can perform evolution of communities using digital millifluidics. With this tool, we handle one thousand cultures of bacteria in drops incubated and analyzed continuously, and the evolution of which we would like to manage. The genetic drift, the genic flows, the diversification and the selection are the four agents of the Evolution which fixes the four axes of this work. The preservation of the diversities, specific to a culture and between them, affect the design of our tool. Its use involves exchanges between cultures which we characterized. We created a protocol allowing to estimate the diversity of these cultures, and thus to discriminate them for robust selection. We finally conceived a system automating their artificial selection: their directed evolution is within easy reach.
145

Multi-scale characterization of flax stems and fibers : structure and mechanical performances / Caractérisation multi-échelle des tiges et fibres de lin : structure et performances mécaniques

Goudenhooft, Camille 19 September 2018 (has links)
Le lin (Linum usitatissimum L.) est une plante aux intérêts multiples. Sa tige est source de fibres, depuis longtemps utilisées dans le domaine du textile. Ce potentiel économique justifie la sélection variétale du lin en vue de développer des variétés plus riches en fibres et offrant une meilleure résistance aux maladies et la verse. Plus récemment, les fibres de lin ont vu leur utilisation s’étendre au renfort de matériaux composites grâce à leurs étonnantes propriétés mécaniques et morphologiques. Ces propriétés singulières s’expliquent grâce à leur développement et à leurs fonctions dans la tige. Ainsi, ce travail de thèse propose une caractérisation multi-échelle du lin, de la tige jusqu’à la paroi cellulaire de la fibre, afin de comprendre le lien entre les paramètres de croissance de la plante, le développement des fibres et leurs propriétés. L’architecture générale d’une tige de lin est explorée, ainsi que les conséquences de la sélection variétale sur cette structure et sur les propriétés des fibres. De plus, l’évolution des propriétés mécaniques des parois de fibres au cours de la croissance de la plante et de la phase de rouissage est caractérisée. En complément, la contribution des fibres à la rigidité en flexion d’une tige est mise en évidence, de même que leur rôle dans la résistance des tiges au flambage. Enfin, l’influence des conditions de culture sur les architectures des tiges et propriétés des fibres est étudiée par le biais de cultures en serre ou encore en simulant un phénomène de verse. Cette approche originale met en valeur les caractéristiques remarquables du lin qui en font un modèle de bioinspiration pour les matériaux composites de demain / Flax (Linum usitatissimum L.) is a plant with multiple interests. Its stem provides fibers, which have long been used in the textile industry. The economic potential of flax explains its varietal selection, aiming at developing varieties exhibiting higher fiber yields as well as greater resistance toward diseases and lodging. More recently, flax fibers have been dedicated to the reinforcement of composite materials due to their outstanding mechanical and morphological properties. These singular characteristics are related to fiber development and functions within the stem. Thus, the present work offers a multi-scale characterization of flax, from the stem to the fiber cell wall, in order to understand the link between plant growth parameters, the development of its fibers and their properties. The general architecture of a flax stem is investigated, as well as the impact of the varietal selection on this structure and on fiber performances. Moreover, changes in mechanical properties of fiber cell walls over plant growth and retting process are characterized. In addition, the fiber contribution to the stem stiffness is highlighted, as well as the fiber role in the resistance of the stem to buckling. The influence of culture conditions on stem architecture and fiber features is also studied through cultivations in greenhouse and by simulating a lodging event. This original approach emphasizes the uncommon characteristics of flax, which make this plant an instructive model toward future bioinspired composite materials.
146

Apprentissage Ensembliste, Étude comparative et Améliorations via Sélection Dynamique / Ensemble Learning, Comparative Analysis and Further Improvements with Dynamic Ensemble Selection

Narassiguin, Anil 04 May 2018 (has links)
Les méthodes ensemblistes constituent un sujet de recherche très populaire au cours de la dernière décennie. Leur succès découle en grande partie de leurs solutions attrayantes pour résoudre différents problèmes d'apprentissage intéressants parmi lesquels l'amélioration de l'exactitude d'une prédiction, la sélection de variables, l'apprentissage de métrique, le passage à l'échelle d'algorithmes inductifs, l'apprentissage de multiples jeux de données physiques distribués, l'apprentissage de flux de données soumis à une dérive conceptuelle, etc... Dans cette thèse nous allons dans un premier temps présenter une comparaison empirique approfondie de 19 algorithmes ensemblistes d'apprentissage supervisé proposé dans la littérature sur différents jeux de données de référence. Non seulement nous allons comparer leurs performances selon des métriques standards de performances (Exactitude, AUC, RMS) mais également nous analyserons leur diagrammes kappa-erreur, la calibration et les propriétés biais-variance. Nous allons aborder ensuite la problématique d'amélioration des ensembles de modèles par la sélection dynamique d'ensembles (dynamic ensemble selection, DES). La sélection dynamique est un sous-domaine de l'apprentissage ensembliste où pour une donnée d'entrée x, le meilleur sous-ensemble en terme de taux de réussite est sélectionné dynamiquement. L'idée derrière les approches DES est que différents modèles ont différentes zones de compétence dans l'espace des instances. La plupart des méthodes proposées estime l'importance individuelle de chaque classifieur faible au sein d'une zone de compétence habituellement déterminée par les plus proches voisins dans un espace euclidien. Nous proposons et étudions dans cette thèse deux nouvelles approches DES. La première nommée ST-DES est conçue pour les ensembles de modèles à base d'arbres de décision. Cette méthode sélectionne via une métrique supervisée interne à l'arbre, idée motivée par le problème de la malédiction de la dimensionnalité : pour les jeux de données avec un grand nombre de variables, les métriques usuelles telle la distance euclidienne sont moins pertinentes. La seconde approche, PCC-DES, formule la problématique DES en une tâche d'apprentissage multi-label avec une fonction coût spécifique. Ici chaque label correspond à un classifieur et une base multi-label d'entraînement est constituée sur l'habilité de chaque classifieur de classer chaque instance du jeu de données d'origine. Cela nous permet d'exploiter des récentes avancées dans le domaine de l'apprentissage multi-label. PCC-DES peut être utilisé pour les approches ensemblistes homogènes et également hétérogènes. Son avantage est de prendre en compte explicitement les corrélations entre les prédictions des classifieurs. Ces algorithmes sont testés sur un éventail de jeux de données de référence et les résultats démontrent leur efficacité faces aux dernières alternatives de l'état de l'art / Ensemble methods has been a very popular research topic during the last decade. Their success arises largely from the fact that they offer an appealing solution to several interesting learning problems, such as improving prediction accuracy, feature selection, metric learning, scaling inductive algorithms to large databases, learning from multiple physically distributed data sets, learning from concept-drifting data streams etc. In this thesis, we first present an extensive empirical comparison between nineteen prototypical supervised ensemble learning algorithms, that have been proposed in the literature, on various benchmark data sets. We not only compare their performance in terms of standard performance metrics (Accuracy, AUC, RMS) but we also analyze their kappa-error diagrams, calibration and bias-variance properties. We then address the problem of improving the performances of ensemble learning approaches with dynamic ensemble selection (DES). Dynamic pruning is the problem of finding given an input x, a subset of models among the ensemble that achieves the best possible prediction accuracy. The idea behind DES approaches is that different models have different areas of expertise in the instance space. Most methods proposed for this purpose estimate the individual relevance of the base classifiers within a local region of competence usually given by the nearest neighbours in the euclidean space. We propose and discuss two novel DES approaches. The first, called ST-DES, is designed for decision tree based ensemble models. This method prunes the trees using an internal supervised tree-based metric; it is motivated by the fact that in high dimensional data sets, usual metrics like euclidean distance suffer from the curse of dimensionality. The second approach, called PCC-DES, formulates the DES problem as a multi-label learning task with a specific loss function. Labels correspond to the base classifiers and multi-label training examples are formed based on the ability of each classifier to correctly classify each original training example. This allows us to take advantage of recent advances in the area of multi-label learning. PCC-DES works on homogeneous and heterogeneous ensembles as well. Its advantage is to explicitly capture the dependencies between the classifiers predictions. These algorithms are tested on a variety of benchmark data sets and the results demonstrate their effectiveness against competitive state-of-the-art alternatives
147

Algorithmes métaheuristiques hybrides pour la sélection de gènes et la classification de données de biopuces

Hernandez Hernandez, José Crispin 14 November 2008 (has links) (PDF)
Les biopuces permettent de mesurer simultanément l'activité d'un grand nombre de gènes au sein d'échantillons biologiques et de réaliser un diagnostic (reconnaissance tissu sain/tissu cancéreux ou distinction entre différents types de cancer) à partir de ces données. Pour cette tâche de classification, on dispose d'un faible nombre d'échantillons alors que chaque échantillon est décrit par un très grand nombre de gènes. Dans cette thèse, nous nous intéressons à la sélection de gènes qui permet de proposer un sous-ensemble de gènes pertinents afin de construire un classifieur prédisant le type de tumeur qui caractérise un échantillon cellulaire. Le problème de la sélection de gènes est un problème très difficile et les algorithmes métaheuristiques à base de voisinage (méthodes de recherche locale) et à base de populations (algorithmes génétiques et algorithmes mémétiques) semblent bien appropriés pour traiter ce problème. Dans cette thèse, nous proposons plusieurs méthodes de sélection dites intégrées, combinant des algorithmes métaheuristiques avec un séparateur à vaste marge linéaire (SVM). Dans ces algorithmes, la qualité d'un sous-ensemble de gènes sélectionnés est évaluée grâce au classifieur SVM. De plus, nos algorithmes exploitent l'information de pertinence fournie par le classifieur SVM sur les différents gènes pour guider les mécanismes de recherche locale ou pour proposer des opérateurs génétiques spécialisés. Des expérimentations ont été réalisées sur les différents jeux de données disponibles dans la littérature et nos méthodes se révèlent très compétitives par rapport aux travaux existants.
148

Algorithme de Chemin de Régularisation pour l'apprentissage Statistique

Karina, Zapien 09 July 2009 (has links) (PDF)
La sélection d'un modèle approprié est l'une des tâches essentielles de l'apprentissage statistique. En général, pour une tâche d'apprentissage donnée, on considère plusieurs classes de modèles ordonnées selon un certain ordre de "complexité". Dans ce cadre, le processus de sélection de modèle revient à trouver la "complexité" optimale, permettant d'estimer un modèle assurant une bonne généralisation. Ce problème de sélection de modèle se résume à l'estimation d'un ou plusieurs hyperparamètres définissant la complexité du modèle, par opposition aux paramètres qui permettent de spécifier le modèle dans la classe de complexité choisie.<br>L'approche habituelle pour déterminer ces hyperparamètres consiste à utiliser une "grille". On se donne un ensemble de valeurs possibles et on estime, pour chacune de ces valeurs, l'erreur de généralisation du meilleur modèle. On s'intéresse, dans cette thèse, à une approche alternative consistant à calculer l'ensemble des solutions possibles pour toutes les valeurs des hyperparamètres. C'est ce qu'on appelle le chemin de régularisation. Il se trouve que pour les problèmes d'apprentissage qui nous intéressent, des programmes quadratiques paramétriques, on montre que le chemin de régularisation associé à certains hyperparamètres est linéaire par morceaux et que son calcul a une complexité numérique de l'ordre d'un multiple entier de la complexité de calcul d'un modèle avec un seul jeu hyper-paramètres.<br>La thèse est organisée en trois parties. La première donne le cadre général des problèmes d'apprentissage de type SVM (Séparateurs à Vaste Marge ou Support Vector Machines) ainsi que les outils théoriques et algorithmiques permettant d'appréhender ce problème. La deuxième partie traite du problème d'apprentissage supervisé pour la classification et l'ordonnancement dans le cadre des SVM. On montre que le chemin de régularisation de ces problèmes est linéaire par morceaux. Ce résultat nous permet de développer des algorithmes originaux de discrimination et d'ordonnancement. La troisième partie aborde successivement les problèmes d'apprentissage semi supervisé et non supervisé. Pour l'apprentissage semi supervisé, nous introduisons un critère de parcimonie et proposons l'algorithme de chemin de régularisation associé. En ce qui concerne l'apprentissage non supervisé nous utilisons une approche de type "réduction de dimension". Contrairement aux méthodes à base de graphes de similarité qui utilisent un nombre fixe de voisins, nous introduisons une nouvelle méthode permettant un choix adaptatif et approprié du nombre de voisins.
149

Quelques questions de sélection de variables autour de l'estimateur LASSO

Hebiri, Mohamed 30 June 2009 (has links) (PDF)
Le problème général étudié dans cette thèse est celui de la régression linéaire en grande dimension. On s'intéresse particulièrement aux méthodes d'estimation qui capturent la sparsité du paramètre cible, même dans le cas où la dimension est supérieure au nombre d'observations. Une méthode populaire pour estimer le paramètre inconnu de la régression dans ce contexte est l'estimateur des moindres carrés pénalisés par la norme ℓ1 des coefficients, connu sous le nom de LASSO. Les contributions de la thèse portent sur l'étude de variantes de l'estimateur LASSO pour prendre en compte soit des informations supplémentaires sur les variables d'entrée, soit des modes semi-supervisés d'acquisition des données. Plus précisément, les questions abordées dans ce travail sont : i) l'estimation du paramètre inconnu lorsque l'espace des variables explicatives a une structure bien déterminée (présence de corrélations, structure d'ordre sur les variables ou regroupements entre variables) ; ii) la construction d'estimateurs adaptés au cadre transductif, pour lequel les nouvelles observations non étiquetées sont prises en considération. Ces adaptations sont en partie déduites par une modification de la pénalité dans la définition de l'estimateur LASSO. Les procédures introduites sont essentiellement analysées d'un point de vue non-asymptotique ; nous prouvons notamment que les estimateurs construits vérifient des Inégalités de Sparsité Oracles. Ces inégalités ont pour particularité de dépendre du nombre de composantes non-nulles du paramètre cible. Un contrôle sur la probabilité d'erreur d'estimation du support du paramètre de régression est également établi. Les performances pratiques des méthodes étudiées sont par ailleurs illustrées à travers des résultats de simulation.
150

Sur l'utilisation active de la diversité dans la construction d'ensembles de classifieurs. Application à la détection de fumées nocives sur site industriel

Gacquer, David 05 December 2008 (has links) (PDF)
L'influence de la diversité lors de la construction d'ensembles de classifieurs a soulevé de nombreuses discussions au sein de la communauté de l'Apprentissage Automatique ces dernières années. <br> Une manière particulière de construire un ensemble de classifieurs consiste à sélectionner individuellement les membres de l'ensemble à partir d'un pool de classifieurs en se basant sur des critères prédéfinis. <br> La littérature fait référence à cette méthode sous le terme de paradigme Surproduction et Sélection, également appelé élagage d'ensemble de classifieurs.<br> <br> Les travaux présentés dans cette thèse ont pour objectif d'étudier le compromis entre la précision et la diversité existant dans les ensembles de classifieurs. Nous apportons également certains éléments de réponse sur le comportement insaisissable de la diversité lorsqu'elle est utilisée de manière explicite lors de la construction d'un ensemble de classifieurs.<br> <br> Nous commençons par étudier différents algorithmes d'apprentissage de la littérature. Nous présentons également les algorithmes ensemblistes les plus fréquemment utilisés. Nous définissons ensuite le concept de diversité dans les ensembles de classifieurs ainsi que les différentes méthodes permettant de l'utiliser directement lors de la création de l'ensemble.<br> <br> Nous proposons un algorithme génétique permettant de construire un ensemble de classifieurs en contrôlant le compromis entre précision et diversité lors de la sélection des membres de l'ensemble. Nous comparons notre algorithme avec différentes heuristiques de sélection proposées dans la littérature pour construire un ensemble de classifieurs selon le paradigme Surproduction et Sélection.<br> <br> Les différentes conclusions que nous tirons des résultats obtenus pour différents jeux de données de l'UCI Repository nous conduisent à la proposition de conditions spécifiques pour lesquelles l'utilisation de la diversité peut amener à une amélioration des performances de l'ensemble de classifieurs. Nous montrons également que l'efficacité de l'approche Surproduction et Sélection repose en grande partie sur la stabilité inhérente au problème posé.<br> <br> Nous appliquons finalement nos travaux de recherche au développement d'un système de classification supervisée pour le contrôle de la pollution atmosphérique survenant sur des sites industriels. Ce système est basé sur l'analyse par traitement d'image de scènes à risque enregistrées à l'aide de caméras. Son principal objectif principal est de détecter les rejets de fumées dangereux émis par des usines sidérurgiques et pétro-chimiques.

Page generated in 0.0986 seconds