Global ETD Search

111	Adaptive Learning and Mining for Data Streams and Frequent Patterns Bifet Figuerol, Albert Carles 24 April 2009 (has links) Aquesta tesi està dedicada al disseny d'algorismes de mineria de dades per fluxos de dades que evolucionen en el temps i per l'extracció d'arbres freqüents tancats. Primer ens ocupem de cadascuna d'aquestes tasques per separat i, a continuació, ens ocupem d'elles conjuntament, desenvolupant mètodes de classificació de fluxos de dades que contenen elements que són arbres. En el model de flux de dades, les dades arriben a gran velocitat, i els algorismes que els han de processar tenen limitacions estrictes de temps i espai. En la primera part d'aquesta tesi proposem i mostrem un marc per desenvolupar algorismes que aprenen de forma adaptativa dels fluxos de dades que canvien en el temps. Els nostres mètodes es basen en l'ús de mòduls detectors de canvi i estimadors en els llocs correctes. Proposem ADWIN, un algorisme de finestra lliscant adaptativa, per la detecció de canvi i manteniment d'estadístiques actualitzades, i proposem utilitzar-lo com a caixa negra substituint els comptadors en algorismes inicialment no dissenyats per a dades que varien en el temps. Com ADWIN té garanties teòriques de funcionament, això obre la possibilitat d'ampliar aquestes garanties als algorismes d'aprenentatge i de mineria de dades que l'usin. Provem la nostre metodologia amb diversos mètodes d'aprenentatge com el Naïve Bayes, partició, arbres de decisió i conjunt de classificadors. Construïm un marc experimental per fer mineria amb fluxos de dades que varien en el temps, basat en el programari MOA, similar al programari WEKA, de manera que sigui fàcil pels investigadors de realitzar-hi proves experimentals. Els arbres són grafs acíclics connectats i són estudiats com vincles en molts casos. En la segona part d'aquesta tesi, descrivim un estudi formal dels arbres des del punt de vista de mineria de dades basada en tancats. A més, presentem algorismes eficients per fer tests de subarbres i per fer mineria d'arbres freqüents tancats ordenats i no ordenats. S'inclou una anàlisi de l'extracció de regles d'associació de confiança plena dels conjunts d'arbres tancats, on hem trobat un fenomen interessant: les regles que la seva contrapart proposicional és no trivial, són sempre certes en els arbres a causa de la seva peculiar combinatòria. I finalment, usant aquests resultats en fluxos de dades evolutius i la mineria d'arbres tancats freqüents, hem presentat algorismes d'alt rendiment per fer mineria d'arbres freqüents tancats de manera adaptativa en fluxos de dades que evolucionen en el temps. Introduïm una metodologia general per identificar patrons tancats en un flux de dades, utilitzant la Teoria de Reticles de Galois. Usant aquesta metodologia, desenvolupem un algorisme incremental, un basat en finestra lliscant, i finalment un que troba arbres freqüents tancats de manera adaptativa en fluxos de dades. Finalment usem aquests mètodes per a desenvolupar mètodes de classificació per a fluxos de dades d'arbres. / This thesis is devoted to the design of data mining algorithms for evolving data streams and for the extraction of closed frequent trees. First, we deal with each of these tasks separately, and then we deal with them together, developing classification methods for data streams containing items that are trees. In the data stream model, data arrive at high speed, and the algorithms that must process them have very strict constraints of space and time. In the first part of this thesis we propose and illustrate a framework for developing algorithms that can adaptively learn from data streams that change over time. Our methods are based on using change detectors and estimator modules at the right places. We propose an adaptive sliding window algorithm ADWIN for detecting change and keeping updated statistics from a data stream, and use it as a black-box in place or counters or accumulators in algorithms initially not designed for drifting data. Since ADWIN has rigorous performance guarantees, this opens the possibility of extending such guarantees to learning and mining algorithms. We test our methodology with several learning methods as Naïve Bayes, clustering, decision trees and ensemble methods. We build an experimental framework for data stream mining with concept drift, based on the MOA framework, similar to WEKA, so that it will be easy for researchers to run experimental data stream benchmarks. Trees are connected acyclic graphs and they are studied as link-based structures in many cases. In the second part of this thesis, we describe a rather formal study of trees from the point of view of closure-based mining. Moreover, we present efficient algorithms for subtree testing and for mining ordered and unordered frequent closed trees. We include an analysis of the extraction of association rules of full confidence out of the closed sets of trees, and we have found there an interesting phenomenon: rules whose propositional counterpart is nontrivial are, however, always implicitly true in trees due to the peculiar combinatorics of the structures. And finally, using these results on evolving data streams mining and closed frequent tree mining, we present high performance algorithms for mining closed unlabeled rooted trees adaptively from data streams that change over time. We introduce a general methodology to identify closed patterns in a data stream, using Galois Lattice Theory. Using this methodology, we then develop an incremental one, a sliding-window based one, and finally one that mines closed trees adaptively from data streams. We use these methods to develop classification methods for tree data streams. Mineria de dades Fluxe de dades Dades estructurades Canvi de concepte Arbres Metodes adaptatius 004
112	Arbres, excursions et processus de Lévy complètement asymétriques Lambert, Amaury 12 January 2001 (has links) (PDF) Dans le premier chapitre, nous étudions le conditionnement d'un processus de Lévy complètement asymétrique à demeurer dans un intervalle fini. <br /><br />Les deux suivants sont consacrés aux processus de branchement à espace d'états continu, qui sont des processus de Lévy sans saut négatif changés de temps : généalogie (deuxième chapitre), dont nous dérivons des théorèmes de type Ray-Knight, et conditionnement à ne jamais s'éteindre (troisième chapitre). <br /><br />Enfin, le dernier chapitre traite de théorie du renouvellement multivariée dans deux cas naturels d'ensembles aléatoires emboîtés. [MATH] Mathematics
113	Urban vegetation detection and function evaluation for air quality assessment / Wania, Annett Weber, Christiane. January 2008 (has links) (PDF) Thèse doctorat : Géographie : Strasbourg 1 : 2007. / Thèse soutenue sur un ensemble de travaux. Titre provenant de l'écran-titre. Bibliogr. p. 195-215.
114	Abundance and growth of shrub and tree species in the balsam fir-yellow birch domain, under varying levels of landscape spatial heterogeneity Markgraf, Rudiger 09 1900 (has links) (PDF) Traditionnellement, les décisions en écologie sont prises en présumant que la structure spatiale de peuplements forestiers est homogène. Or, dans la sapinière à bouleau jaune, la mortalité individuelle des arbres et les perturbations qui génèrent des trouées, telles les épidémies de la tordeuse des bourgeons de l'épinette ou les coupes partielles, changent continuellement la structure spatiale interne des peuplements. Nous posons comme hypothèse que l'hétérogénéité spatiale joue un rôle important sur la dynamique des peuplements en modifiant la distribution spatio-temporelle de la lumière, ce qui a pour effet d'accentuer ou non l'abondance et la croissance d'arbustes qui peuvent intervenir sur la succession des arbres. Nous avons utilisé un indice d'hétérogénéité spatiale pour identifier 12 paysages de 1 km2 présentant différents niveaux d'hétérogénéité (hétérogène, modéré et homogène). Dans ces paysages, des données d'abondance et de croissance d'espèces d'arbustes et de la régénération d'espèces d'arbres ont été prises dans des trouées de différentes tailles et sous couvert forestier. Nos résultats indiquent que le noisetier à long bec est deux fois plus abondant dans les paysages hétérogènes et que le bouleau jaune est trois fois plus abondant dans les paysages d'hétérogénéité modérée que dans les paysages fortement hétérogènes. Notre recherche indique que les forêts hétérogènes contiennent significativement moins d'arbres et plus d'arbustes en régénération que les paysages moins hétérogènes. Cependant, ni la compétition par les arbustes et ni la croissance de la régénération des arbres ne diffèrent entre les paysages avec différents niveaux d'hétérogénéité, suggérant que les mécanismes de dispersion et d'établissement seraient successibles d'être à la base des patrons observés. ______________________________________________________________________________ Abondance (Écologie) Arbuste Compétition végétale Croissance des arbres Dynamique forestière Hétérogénéité écologique Régénération forestière Sapinière
115	Etude asymptotique de grands objets combinatoires aléatoires Curien, Nicolas 10 June 2011 (has links) (PDF) Dans ce travail, nous nous sommes intéressés à l'étude asymptotique d'objets combinatoires aléatoires. Deux thèmes ont particulièrement retenu notre attention : les cartes planaires aléatoires et les modèles combinatoires liés à la théorie des fragmentations. La théorie mathématique des cartes planaires aléatoires est née à l'aube de notre millénaire avec les travaux pionniers de Benjamini & Schramm, Angel & Schramm et Chassaing & Schaeffer. Elle a ensuite beaucoup progressé, mais à l'heure où ces lignes sont écrites, de nombreux problèmes fondamentaux restent ouverts. Résumons en quelques mots clés nos principales contributions dans le domaine : l'introduction et l'étude du cactus brownien (avec J.F. Le Gall et G. Miermont), l'étude de la quadrangulation infinie uniforme vue de l'infini (avec L. Ménard et G. Miermont), ainsi que des travaux plus théoriques sur les graphes aléatoires stationnaires d'une part et les graphes empilables dans $\R^d$ d'autre part (avec I. Benjamini). La théorie des fragmentations est beaucoup plus ancienne et remonte à des travaux de Kolmogorov (1941) et de Filippov (1961). Elle est maintenant bien développée (voir par exemple l'excellent livre de J. Bertoin), et nous ne nous sommes pas focalisés sur cette théorie mais plutôt sur ses applications à des modèles combinatoires. Elle s'avère en effet très utile pour étudier différents modèles de triangulations récursives du disque (travail effectué avec J.F. Le Gall) et les recherches partielles dans les quadtrees (travail effectué avec A. Joseph). [MATH] Mathematics [MATH] Mathématiques Théorie des fragmentations Cartes planaires aléatoires Arbres aléatoires empilement de cercles Laminations
116	Arbres et Cartes aléatoires Curien, Nicolas 06 December 2013 (has links) (PDF) Ce manuscrit est un document de synthèse et de présentation d'une majorité des travaux que j'ai effectués entre septembre 2008 et septembre 2013 (voir la liste des publications ci-dessous1). Les publications [P1-6] sont issues de la thèse ainsi qu'une grande partie de [P11]. Afin de présenter un document concis et cohérent nous avons choisi de ne pas traiter les publications [P3], [P5], [P9] et [P10]. Que mes co-auteurs m'excusent. Le document est construit autour de deux parties principales : les arbres aléatoires d'une part et les cartes planaires aléatoires d'autre part. Les contributions originales sont signalées par des théorèmes encadrés et sont numérotés 1, 2, 3, . . .. [MATH:MATH_PR] Mathematics/Probability arbres aléatoires cartes planaires aléatoires
117	On building and comparing trees <br />Application to supertrees in phylogenetics Berry, Vincent 08 December 2008 (has links) (PDF) The research work presented in this manuscript is of algorithmic kind: it is mainly composed of polynomial, fixed parameter and approximation algorithms, while hardness results are also mentioned.<br /> <br />This work is about building and comparing labelled trees. These objects find application in different areas, but notoriously in phylogenetics, where they represent evolutionary relationships of organisms or sequences.<br /><br />Most of this work can be considered as investigating solutions to so-called \emph{supertree} problems. Supertrees are large trees built by a dynamic programming approach from smaller trees. For instance, the latter are gene trees from which a comprehensive tree on many living species is to be built, such as the \emph{Tree of Life}. <br /><br />First definitions are introduced, then a part of the manuscript is dedicated to quartet tree building methods. The next part details tree comparison methods, mainly variants of the maximum agreement subtree method. Next follows a part on supertree problems in all generality. <br />The manuscript ends with a report of the research plan for the next few years. <br /><br />Several journal papers illustrating the material described in this manuscript are adjoined in appendix. [INFO] Computer Science [INFO] Informatique algorithmes formalismes combinatoires arbres bioinformatique phylogénie preuves
118	Une approche probabiliste pour le classement d'objets incomplètement connus dans un arbre de décision Hawarah, Lamis 22 October 2008 (has links) (PDF) Nous présentons dans cette thèse une approche probabiliste pour déterminer les valeurs manquantes des objets incomplets pendant leur classement dans les arbres de décision. Cette approche est dérivée de la méthode d'apprentissage supervisé appelée Arbres d'Attributs Ordonnées (AAO) proposée par Lobo et Numao en 2000, qui construit un arbre de décision pour chacun des attributs, selon un ordre croissant en fonction de l'Information Mutuelle entre chaque attribut et la classe. Notre approche étend la méthode de Lobo et Numao, d'une part en prenant en compte les dépendances entre les attributs pour la construction des arbres d'attributs, et d'autre part en fournissant un résultat de classement d'un objet incomplet sous la forme d'une distribution de probabilités (au lieu de la classe la plus probable). <br />Nous expliquons notre méthode et nous la testons sur des bases de données réelles. Nous comparons nos résultats avec ceux donnés par la méthode C4.5 et AAO. <br /><br />Nous proposons également un algorithme basé sur la méthode des k plus proches voisins qui calcule pour chaque objet de la base de test sa fréquence dans la base d'apprentissage. Nous comparons ces fréquences avec les résultats de classement données par notre approche, C4.5 et AAO. Finalement, nous calculons la complexité de construction des arbres d'attributs ainsi que la complexité de classement d'un objet incomplet en utilisant notre approche, C4.5 et AAO. [INFO] Computer Science [INFO] Informatique Fouille de Données Arbres de Décision Valeurs Manquantes Information Mutuelle Classement Probabiliste
119	Exploitation de données tridimensionnelles pour la cartographie et l'exploration autonome d'environnements urbains / Fournier, Jonathan. January 2007 (has links) (PDF) Thèse (M.Sc.)--Université Laval, 2007. / Bibliogr.: f. [110]-113. Publié aussi en version électronique dans la Collection Mémoires et thèses électroniques.
120	Structure et croissance d'un peuplement d'épinette noire (Picea mariana) issu d'une coupe d'une vingtaine d'années dans la région du Saguenay-Lac-Saint-Jean / Fournier, Mylaine, January 1997 (has links) Mémoire (M.Ress.Renouv.)--Université du Québec à Chicoutimi, 1997. / Document électronique également accessible en format PDF. CaQCU

Search results