• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 669
  • 188
  • 90
  • 90
  • 55
  • 29
  • 18
  • 18
  • 18
  • 16
  • 9
  • 9
  • 9
  • 9
  • 9
  • Tagged with
  • 1421
  • 369
  • 207
  • 166
  • 160
  • 144
  • 130
  • 125
  • 115
  • 105
  • 100
  • 92
  • 88
  • 74
  • 73
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
841

Evaluation of Supervised Machine Learning for Classifying Video Traffic

Taylor, Farrell R. 01 January 2016 (has links)
Operational deployment of machine learning based classifiers in real-world networks has become an important area of research to support automated real-time quality of service decisions by Internet service providers (ISPs) and more generally, network administrators. As the Internet has evolved, multimedia applications, such as voice over Internet protocol (VoIP), gaming, and video streaming, have become commonplace. These traffic types are sensitive to network perturbations, e.g. jitter and delay. Automated quality of service (QoS) capabilities offer a degree of relief by prioritizing network traffic without human intervention; however, they rely on the integration of real-time traffic classification to identify applications. Accordingly, researchers have begun to explore various techniques to incorporate into real-world networks. One method that shows promise is the use of machine learning techniques trained on sub-flows – a small number of consecutive packets selected from different phases of the full application flow. Generally, research on machine learning classifiers was based on statistics derived from full traffic flows, which can limit their effectiveness (recall and precision) if partial data captures are encountered by the classifier. In real-world networks, partial data captures can be caused by unscheduled restarts/reboots of the classifier or data capture capabilities, network interruptions, or application errors. Research on the use of machine learning algorithms trained on sub-flows to classify VoIP and gaming traffic has shown promise, even when partial data captures are encountered. This research extends that work by applying machine learning algorithms trained on multiple sub-flows to classification of video streaming traffic. Results from this research indicate that sub-flow classifiers have much higher and more consistent recall and precision than full flow classifiers when applied to video traffic. Moreover, the application of ensemble methods, specifically Bagging and adaptive boosting (AdaBoost) further improves recall and precision for sub-flow classifiers. Findings indicate sub-flow classifiers based on AdaBoost in combination with the C4.5 algorithm exhibited the best performance with the most consistent results for classification of video streaming traffic.
842

Collective dynamics of solid-state spin chains and ensembles in quantum information processing

Ping, Yuting January 2012 (has links)
This thesis is concerned with the collective dynamics in different spin chains and spin ensembles in solid-state materials. The focus is on the manipulation of electron spins, through spin-spin and spin-photon couplings controlled by voltage potentials or electromagnetic fields. A brief review of various systems is provided to describe the possible physical implementation of the ideas, and also outlines the basis of the adopted effective interaction models. The first two ideas presented explore the collective behaviour of non-interacting spin chains with external couplings. One focuses on mapping the identical state of spin-singlet pairs in two currents onto two distant, static spins downstream, creating distributed entanglement that may be accessed. The other studies a quantum memory consisting of an array of non-interacting, static spins, which may encode and decode multiple flying spins. Both chains could effectively `enhance' weak couplings in a cumulative fashion, and neither scheme requires active quantum control. Moreover, the distributed entanglement generated can offer larger separation between the qubits than more conventional protocols that only exploit the tunnelling effects between quantum dots. The quantum memory can also `smooth' the statistical fluctuations in the effects of local errors when the stored information is spread. Next, an interacting chain of static spins with nearest-neighbour interactions is introduced to connect distant end spins. Previously, it has been shown that this approach provides a cubic speed-up when compared with the direct coupling between the target spins. The practicality of this scheme is investigated by analysing realistic error effects via numerical simulations, and from that perspective relaxation of the nearest-neighbour assumption is proposed. Finally, a non-interacting electron spin ensemble is reviewed as a quantum memory to store single photons from an on-chip stripline cavity. It is then promoted to a full quantum processor, with major error effects analysed.
843

A Performance Guide to Latin-American Guitar Quartets: The Quartets of Ernesto Cordero, Leo Brouwer, and Sérgio Assad

Puerta, José Luis, Puerta, José Luis January 2016 (has links)
Latin-American guitarist-composers Ernesto Cordero, Leo Brouwer, and Sergio Assad are three of the most influential figures in the contemporary world of classical guitar. In addition to their important compositions for solo guitar, their compositions for guitar ensemble represent significant contributions to the concert repertory. These three guitarist-composers share a knowledge of popular, folkloric and classical music and demonstrate a commitment to bridging these realms in their compositions in the classical tradition. This study reviews the history of the guitar quartet. It then examines the different cultural influences in selected compositions for classical guitar quartet by each composer, exploring the significance of these choices for the performer and for the medium. The document also offers a performer’s guide for accurate and stylistic performance. When performed well, these quartets represent the vitality of contemporary Latin American composition and confirm the stature of the guitar quartet as a compelling medium for the concert artist.
844

Visions de libération du ‘dogmatisme’ musulman pour une meilleure gestion de la pluralité morale et religieuse en Occident : analyse comparative de la pensée de Muhammad Arkoun et de Tariq Ramadan sur les rapports entre tradition et modernité

Ouferdi, Abdelaziz 07 1900 (has links)
Suite aux grands changements politiques, économiques et sociaux que l’Occident a connus depuis plus d’un siècle, de nombreux problèmes ont émergé, de nouveaux défis ont été lancés et plusieurs approches et solutions ont été avancées. L’avènement de la démocratie, un exploit humain inestimable, a plus ou moins règlementé la pluralité idéologique, pour permettre un exercice politique organisé. Aujourd’hui, dans le nouvel ordre mondial, c’est la pluralité morale et religieuse qui a besoin d’être gérée; un défi pour les institutions démocratiques et pour la société civile, afin de réaliser un mieux vivre-ensemble dans le dialogue, la compréhension et le compromis. Or, beaucoup de travail est encore à faire : dans un premier temps, à l’intérieur de chaque tradition religieuse; dans un deuxième temps, entre les différentes traditions; et dans un troisième temps, entre ces traditions et la modernité. Le ‘dogmatisme’ est au cœur de ces débats, qu’il soit d’ordre traditionnel ou moderne, il entrave la raison dans son processus de libération et d’émancipation. La problématique de ce mémoire concerne la gestion de la pluralité morale et religieuse en Occident. Dans ce travail, nous allons essayer de démontrer comment la libération du dogmatisme en général et la libération du ‘dogmatisme’ musulman, en particulier, peuvent contribuer à la réalisation d’un mieux vivre-ensemble en Occident. Pour ce faire, nous analyserons les projets de deux penseurs musulmans contemporains : Muhammad Arkoun et Tariq Ramadan. Notre recherche va essentiellement se pencher sur leurs attitudes vis-à-vis de la tradition et de la modernité, car, nous pensons que l’enjeu du ‘dogmatisme’ est lié aux rapports des musulmans à leur tradition et à la modernité. Selon nos deux penseurs, la libération du ‘dogmatisme’ musulman n’est possible qu’à condition de pouvoir changer à la fois notre rapport à la tradition et à la modernité. Arkoun pense que ce changement doit suivre le modèle de la libération occidentale, au moyen d’une critique subversive de la tradition islamique. Cependant, Ramadan opte pour une réforme radicale de la pensée islamique qui vise une critique globale de la tradition, mais, qui épargne les fondements de la foi : le ‘sacré’. / Following the major political, economic and social changes that occurred in the West for over a century, many problems have emerged, new challenges have surfaced, and several approaches and solutions have been proposed. The advent of democracy, an invaluable human achievement, more or less regulated ideological plurality, and allowed the evolution of an organized political exercise. Today, in the new world order, it is the moral and religious diversity that need to be managed. The challenge remains for democratic institutions and civil society to create a better harmonious community through dialogue, understanding and compromise. However, much work is still to be done : first, within each religious tradition, second, between different traditions and third, between tradition and modernity. Dogmatism is at the heart of these debates. An order, whether traditional or modern hampers objectives reasoning in the process of liberation and emancipation. The issue of this paper concerns the management of the moral and religious plurality in the West. In this work, we will try to demonstrate how the relinquishing of ‘dogmatism’ in general and the relinquishing of Muslim ‘dogmatism’ in particular, can contribute to the achievement of a harmonious in a pluralistic West. This will be achieved by shedding light on the projects of two contemporary Muslim thinkers : Muhammad Arkoun and Tariq Ramadan. Our research is mainly to reflect on their attitudes towards tradition versus modernity, as we believe that the issue of dogmatism is linked to Muslims’ attitude towards tradition and modernity. According to these two thinkers, the release of muslims’ ‘dogmatism’ is only possible by changing both our relationship to tradition and modernity. Arkoun thinks this change should follow the model of Western release through a subversive critique of the Islamic tradition. However, Ramadan opts for a radical reform of Islamic thought through a comprehensive critique of the tradition, in order to save the foundation of faith : The ‘sacred’.
845

Généralisation de l'approche d'ensemble à la prévision hydrologique dans les bassins versants non jaugés / Quantification of uncertainty in hydrological modeling in ungauged basins

Randrianasolo, Rindra Annie 19 December 2012 (has links)
La prévision des crues est un exercice hydrologique complexe : les incertitudes y sont nombreuses, aussi bien dans le processus de modélisation hydrologique, dans la détermination de l'état initial du bassin versant avant le lancement de la prévision, que dans l'évolution des conditions météorologiques futures. Dans le cas des bassins versants non jaugés, où les observations de débits sont lacunaires voire absentes, ces incertitudes sont encore plus importantes, et le besoin de les réduire devient incontournable. Cette thèse s'intéresse à des méthodes simples et robustes qui peuvent apporter de l'information pertinente pour quantifier les incertitudes de prévision dans les bassins versants non jaugés. Le but est d'étudier la meilleure stratégie pour chercher l'information dans les bassins jaugés "donneurs", et pour la transférer vers le site non jaugé. Nous étudions les besoins pour mettre en place un modèle de simulation pluie-débit et pour effectuer une mise à jour du modèle de prévision en temps réel. Ces deux composantes de la prévision sont ainsi découplées dans notre approche. Cette thèse s'appuie sur une large base de données constituée d'environ 1000 bassins versants français, dont un jeu clé de 211 bassins versants qui permet la validation des approches développées. Elle s'appuie également sur une archive d'environ 4,5 années de prévisions d'ensemble de pluies, utilisées en forçage à la modélisation hydrologique journalière. La démarche adoptée consiste à intégrer les scenarios de transfert de l'information régionale disponible et les scenarios de la prévision météorologique d'ensemble dans un système de prévision orienté vers les bassins versants non jaugés. L'approche de prévision d'ensemble est ainsi généralisée à ce cas particulier de la prévision hydrologique. A travers plusieurs scénarios de débits futurs, nous cherchons à quantifier les incertitudes de prévisions dans les sites cibles non jaugés. Pour évaluer les différents scénarios des prévisions hydrologiques émis, un cadre de diagnostic d'évaluation des principales qualités d'un système de prévision d'ensemble, comprenant plusieurs critères numériques et graphiques, a été mis en place. Dans cette thèse, une attention particulière est prêtée aux attributs "fiabilité" et "précision" des prévisions. Nous proposons ainsi un nouveau critère graphique, nommé diagramme de précision d'ensemble. Ce critère permet notamment de mettre en valeur la qualité des prévisions qui ne sont pas forcément fiables, mais qui sont précises. Les résultats obtenus ont mis en évidence que la fiabilité des prévisions peut être améliorée sur un bassin versant non jaugé par l'utilisation de plusieurs jeux de paramètres issus des bassins versants voisins. Si la variabilité apportée par le voisinage géographique influe sur la dispersion des membres, et augmente ainsi la fiabilité des prévisions, la prise en compte des caractéristiques physiques, principalement de la surface des bassins versants, est apparue comme une alternative intéressante, influençant positivement aussi l'attribut précision des prévisions sur le site cible. De plus, il a été montré que la précision des prévisions d'ensemble sur le site non jaugé est améliorée par l'intermédiaire du transfert des bassins versants jaugés vers le site cible des corrections faites lors de la mise à jour sur les bassins voisins (mise à jour caractérisée ici par l'assimilation de la dernière observation de débit dans le modèle hydrologique, avant l'instant de prévision). Les différentes mesures de performance ont montré que la meilleure option pour améliorer la précision des prévisions serait de considérer les corrections effectuées sur le bassin le plus proche à chaque pas de temps de prévision. Le krigeage a également donné des résultats satisfaisants, marqués en plus par l'influence positive sur l'attribut fiabilité des prévisions. / Flood forecasting is a complex hydrological task: there are numerous uncertainties in the hydrological modelling process, in the determination of the initial catchment conditions before launching the forecast, and in the evolution of future weather conditions. In ungauged catchments, where streamflow observations are incomplete or absent, these uncertainties are even greater, and the need to reduce them becomes essential.This thesis focuses on simple and robust methods that can provide relevant information to quantify the uncertainty in ungauged catchments. The aim is to study the best strategy to search for information in gauged "donors" basins and to transfer it to the ungauged site. We investigate what information is needed to set up a rainfall-runoff model and to perform forecast updating in real time. These two components of a flood forecasting system are thus decoupled in our approach.This thesis is based on a large database of about 1000 French catchments, which includes a key set of 211 catchments that are used to validate the developed approaches. It also relies on an archive of about 4.5 years of ensemble forecasts of rainfall, which are used for hydrological modelling on a daily time step. The methodology adopted here integrates the scenarios of regional transfer of information and the scenarios of weather forecasting together in a forecasting system for ungauged basins. The approach of ensemble forecasting is thus generalised to this particular case of hydrological forecasting. Using several scenarios of future flows, we seek to quantify the predictive uncertainty in ungauged sites.To evaluate the flow forecast scenarios of the hydrological ensemble prediction system, a diagnostic framework with several numerical and graphical criteria is developed. Special attention is paid to the attributes of "reliability" and "accuracy" of the forecasts. We propose a new graphic criterion, named "diagram of ensemble accuracy". This criterion allows to highlight the quality of forecasts that are not necessarily reliable, but are accurate.The results show that forecast reliability in ungauged sites can be improved by using several sets of parameters from neighbour catchments. If on the one hand the variability brought by the information from the geographical proximity influences the spread of the ensemble forecasts, and thus improves forecast reliability, on the other hand taking into account the physical characteristics of the catchments, especially the surface, emerged as an interesting alternative, as it positively influences also the accuracy of the forecasts at the ungauged site.It is also shown that the accuracy of ensemble forecasts at ungauged sites can be improved with the transfer of updating information from gauged neighbour catchments (forecasting updating is here characterized by the assimilation of the last discharge observation in the hydrological model before the time of forecast). The updating information transferred to the ungauged site is the correction applied to the routing reservoir of the hydrological model. Different measures of forecast performance showed that the best option to improve forecast accuracy is to consider the corrections made at the closest gauged site. Kriging also gave satisfactory results, with additionally a positive impact also on the reliability of the ensemble flow forecasts.
846

Clusterisation et conservation d’énergie dans les réseaux ad hoc hybrides à grande échelle

Jemili, Imen 13 July 2009 (has links)
Dans le cadre des réseaux ad hoc à grande envergure, le concept de clusterisation peut être mis à profit afin de faire face aux problèmes de passage à l'échelle et d'accroître les performances du système. Tout d’abord, cette thèse présente notre algorithme de clusterisation TBCA ‘Tiered based Clustering algorithm’, ayant pour objectif d’organiser le processus de clusterisation en couches et de réduire au maximum le trafic de contrôle associé à la phase d’établissement et de maintenance de l’infrastructure virtuelle générée. La formation et la maintenance d’une infrastructure virtuelle ne sont pas une fin en soi. Dans cet axe, on a exploité les apports de notre mécanisme de clusterisation conjointement avec le mode veille, à travers la proposition de l’approche de conservation d’énergie baptisée CPPCM ‘Cluster based Prioritized Power Conservation Mechanism’ avec deux variantes. Notre objectif principal est de réduire la consommation d’énergie tout en assurant l’acheminement des paquets de données sans endurer des temps d’attente importants aux niveaux des files d’attente des nœuds impliqués dans le transfert. Nous avons proposé aussi un algorithme de routage LCR ‘Layered Cluster based Routing’ se basant sur l’existence d’une infrastructure virtuelle. L’exploitation des apports de notre mécanisme TBCA et la limitation des tâches de routage additionnelles à un sous ensemble de nœuds sont des atouts pour assurer le passage à l’échelle de notre algorithme. / Relying on a virtual infrastructure seems a promising approach to overcome the scalability problem in large scale ad hoc networks. First, we propose a clustering mechanism, TBCA ‘Tiered based Clustering algorithm’, operating in a layered manner and exploiting the eventual collision to accelerate the clustering process. Our mechanism does not necessitate any type of neighbourhood knowledge, trying to alleviate the network from some control messages exchanged during the clustering and maintenance process. Since the energy consumption is still a critical issue, we combining a clustering technique and the power saving mode in order to conserve energy without affecting network performance. The main contribution of our power saving approach lies on the differentiation among packets based on the amount of network resources they have been so far consumed. Besides, the proposed structure of the beacon interval can be adjusted dynamically and locally by each node according to its own specific requirements. We propose also a routing algorithm, LCR ‘Layered Cluster based Routing’. The basic idea consists on assigning additional tasks to a limited set of dominating nodes, satisfying specific requirements while exploiting the benefits of our clustering algorithm TBCA.
847

Automates cellulaires : dynamique directionnelle et asymptotique typique

Delacourt, Martin 05 December 2011 (has links)
Les automates cellulaires sont à la fois un modèle de calcul parallèle, un système complexe et un système dynamique. Ils fonctionnent de manière synchrone et en temps discret, leur particularité est que les fonctions qu'ils définissent sont issues de l'application simultanée, en tout point de l'espace, d'une règle d'évolution locale. L'ensemble limite est un objet classique des systèmes dynamiques, c'est l'ensemble des états que le système peut atteindre arbitrairement tard. Il a été très étudié dans le cadre des automates cellulaires, et les résultats sont nombreux. Parmi ces résultats, un théorème de Rice démontré par Jarkko Kari dit que toute propriété des ensembles limites est indécidable. Dans ce mémoire, on ne s'intéresse plus à l'ensemble limite traditionnel, mais à une variante pour laquelle on utilise une mesure sur l'espace des entrées, sélectionnant ainsi les comportements susceptibles d'apparaître arbitrairement tard et souvent. Ce nouvel ensemble, que l'on nomme ensemble mu-limite, a été introduit en 2000 par Petr Kurka et Alejandro Maass. La plupart des résultats sur les ensembles limites ne se transposent pas naturellement. On étudie la famille des ensembles mu-limites d'automates cellulaires. On montre que sous certaines contraintes sur la dynamique, l'ensemble mu-limite peut être entièrement décrit. On classe ainsi les automates en fonction de ces contraintes. Dans le cas général, on montre l'existence d'automates cellulaires ayant comme ensembles mu-limites un grand nombre d'ensembles complexes. On finit par montrer un théorème de Rice pour les ensembles mu-limites d'automates cellulaires: tout propriété non triviale de ces ensembles est indécidable. / Cellular automata are simultaneously a model of parallel computation, a complex system and a dynamical system. They are synchronous and time is discrete. The functions defined by their application is the result of the synchronous application of the same local rule everywhere. The limit set is a classical tool of dynamical systems theory, it is the set of states the system can reach arbitrarily late. It has been studied often in the particular case of cellular automata and there are numerous results. Amongst them, a Rice's theorem proved by Jarkko Kari states that any non-trivial property of limit sets of cellular automata is undecidable. In this thesis, we do not consider the classical limit set, as we add a measure on the space of states of the system. Thus, we get a set which contains behaviors that appear arbitrarily far and often. This set is named mu-limit set and was introduced in 2000 by Petr Kurka and Alejandro Maass. Most of the results on limit sets cannot be directly adapted for mu-limit sets. We study the family of all mu-limit sets of cellular automata. We show that under some constraints on the dynamics, the mu-limit set can be entirely described. We then produce a classification of cellular automata according to these constraints. In the general case, we prove the existence of cellular automata whose mu-limit sets are among a large set of complex sets. We finally prove Rice's theorem for mu-limit sets: any non-trivial property is undecidable.
848

Etude de certains ensembles singuliers associés à une application polynomiale / Some singular sets associated to a polynomial maps

Nguyen thi bich, Thuy 30 September 2013 (has links)
Ce travail comporte deux parties dont la première concerne l'ensemble asymptotique $S_F$ d'une application polynomiale $F: C^n to C^n$. Dans les année 90s, Jelonek a montré que cet ensemble est une variété algébrique complexe singulière de dimension (complexe) $n-1$. Nous donnons une méthode, appelée {it méthode des fa{c c}ons}, pour stratifier cet ensemble. Nous obtenons une stratification de Thom-Mather. Par ailleurs, il existe une stratification de Whitney de $S_F$ telle que l'ensemble des fa{c c}ons possibles soit constant sur chaque strate. En utilisant les fa{c c}ons, nous donnons un algorithme pour expliciter l'ensemble asymptotique d'une application quadratique dominante en trois variables. Nous obtenons aussi une liste des ensembles asymptotiques possibles dans ce cas. La deuxième partie concerne l'ensemble $V_F$ : En 2010, Anna et Guillaume Valette ont construit une pseudo-variété réelle $V_F subset R^{2n + p}$, où $p > 0$, associée à une application polynomiale $F: C^n to C^n$. Dans le cas $n = 2$, ils ont prouvé que si $F$ est une application polynomiale de déterminant jacobien partout non nul, alors $F$ n'est pas propre si et seulement si l'homologie d'intersection de $V_F$ n'est pas triviale en dimension 2. Nous donnons une généralisation de ce résultat, dans le cas d'une application polynomiale $F : C^n to C^n$ de jacobien partout non nul. Nous donnons aussi une méthode pour stratifier l'ensemble $V_F$. Comme applications, nous obtenons des stratifications de l'ensemble des valeurs critiques asymptotiques de $F$ et de l'ensemble des points de bifurcation de $F$. / There are two parts in the present work. The first part concerns the asymptotic set of a polynomial mapping $F: C^n to C^n$. In the 90s, Zbigniew Jelonek showed that this set is a $(n-1)$ - (complex) dimensional singular variety. We give a method, called {it m'ethode des fa{c c}ons}, for stratifying this set. We obtain a Thom-Mather stratification. Moreover, there exists a Whitney stratification such that the set of possible fa{c c}ons is constant on every stratum. By using the fa{c c}ons, we give an algorithm for expliciting the asymptotic sets of a dominant quadratic polynomial mapping in three variables. As a result, we have a complete list of the asymptotic sets in this case. The second part concerns the set called Valette set $V_F$. In 2010, Anna and Guillaume Valette constructed a real pseudomanifold $V_F subset R^{2n + p}$, where $p > 0$, associated to a polynomial mapping $F: C^n to C^n$. In the case $n = 2$, they proved that if $F$ is a polynomial mapping with nowhere vanishing Jacobian, then $F$ is not proper if and only if the homology (or intersection homology) of $V_F$ is not trivial in dimension 2. We give a generalization of this result, in the case of a polynomial mapping $F : C^n to C^n$ with nowhere vanishing Jacobian. We give also a method for stratifying the set $V_F$. As applications, we have the stratifications of the set of asymptotic critical values of $F$ and the set of bifurcation points of $F$.
849

An approach for online learning in the presence of concept changes / Une approche pour l'apprentissage en-ligne en présence de changements de concept.

Jaber, Ghazal 18 October 2013 (has links)
De nombreuses applications de flux de données ont vu le jour au cours des dernières années. Lorsque l'environnement évolue, il est nécessaire de s'appuyer sur un apprentissage en ligne pouvant s'adapter aux conditions changeantes, alias dérives de concept. L'adaptation aux dérives de concept implique d'oublier une partie ou la totalité des connaissances acquises lorsque le concept change, tout en accumulant des connaissances sur le concept sous-jacent supposé stationnaire. Ce compromis est appelé le dilemme stabilité-plasticité.Les méthodes d'ensemble ont été parmi les approches les plus réussies. Cependant, la gestion de l'ensemble qui détermine les informations à oublier n'a pas été complètement étudiée jusqu'ici. Notre travail montre l'importance de la stratégie de l'oubli en comparant plusieurs approches. Les résultats ainsi obtenus nous amènent à proposer une nouvelle méthode d'ensemble avec une stratégie d'oubli conçue pour s'adapter aux dérives de concept. Des évaluations empiriques montrent que notre méthode se compare favorablement aux systèmes adaptatifs de l'état de l'art.Les majorité des anciens travaux réalisés se sont focalisés sur la détection des changements de concept, ainsi que les méthodes permettant d'adapter le système d'apprentissage aux changements. Dans ce travail, nous allons plus loin en introduisant un mécanisme d'anticipation capable de détecter des états pertinents de l'environnement, de reconnaître les contextes récurrents et d'anticiper les changements de concept susceptibles.Par conséquent, la méthode que nous proposons traite à la fois le défi d'optimiser le dilemme stabilité-plasticité, l'anticipation et la reconnaissance des futurs concepts. Ceci est accompli grâce à une méthode d'ensemble qui contrôle un comité d'apprenants. D'une part, la gestion de l'ensemble permet de s'adapter naturellement à la dynamique des changements de concept avec peu de paramètres à régler. D'autre part, un mécanisme d'apprentissage surveillant les changements dans l'ensemble fournit des moyens pour anticiper la modification sous-jacente du contexte. / Learning from data streams is emerging as an important application area. When the environment changes, it is necessary to rely on on-line learning with the capability to adapt to changing conditions a.k.a. concept drifts. Adapting to concept drifts entails forgetting some or all of the old acquired knowledge when the concept changes while accumulating knowledge regarding the supposedly stationary underlying concept. This tradeoff is called the stability-plasticity dilemma. Ensemble methods have been among the most successful approaches. However, the management of the ensemble which ultimately controls how past data is forgotten has not been thoroughly investigated so far. Our work shows the importance of the forgetting strategy by comparing several approaches. The results thus obtained lead us to propose a new ensemble method with an enhanced forgetting strategy to adapt to concept drifts. Experimental comparisons show that our method compares favorably with the well-known state-of-the-art systems. The majority of previous works focused only on means to detect changes and to adapt to them. In our work, we go one step further by introducing a meta-learning mechanism that is able to detect relevant states of the environment, to recognize recurring contexts and to anticipate likely concepts changes. Hence, the method we suggest, deals with both the challenge of optimizing the stability-plasticity dilemma and with the anticipation and recognition of incoming concepts. This is accomplished through an ensemble method that controls a ensemble of incremental learners. The management of the ensemble of learners enables one to naturally adapt to the dynamics of the concept changes with very few parameters to set, while a learning mechanism managing the changes in the ensemble provides means for the anticipation of, and the quick adaptation to, the underlying modification of the context.
850

Ensemble multi-label learning in supervised and semi-supervised settings / Apprentissage multi-label ensembliste dans le context supervisé et semi-supervisé

Gharroudi, Ouadie 21 December 2017 (has links)
L'apprentissage multi-label est un problème d'apprentissage supervisé où chaque instance peut être associée à plusieurs labels cibles simultanément. Il est omniprésent dans l'apprentissage automatique et apparaît naturellement dans de nombreuses applications du monde réel telles que la classification de documents, l'étiquetage automatique de musique et l'annotation d'images. Nous discutons d'abord pourquoi les algorithmes multi-label de l'etat-de-l'art utilisant un comité de modèle souffrent de certains inconvénients pratiques. Nous proposons ensuite une nouvelle stratégie pour construire et agréger les modèles ensemblistes multi-label basés sur k-labels. Nous analysons ensuite en profondeur l'effet de l'étape d'agrégation au sein des approches ensemblistes multi-label et étudions comment cette agrégation influece les performances de prédictive du modèle enfocntion de la nature de fonction cout à optimiser. Nous abordons ensuite le problème spécifique de la selection de variables dans le contexte multi-label en se basant sur le paradigme ensembliste. Trois méthodes de sélection de caractéristiques multi-label basées sur le paradigme des forêts aléatoires sont proposées. Ces méthodes diffèrent dans la façon dont elles considèrent la dépendance entre les labels dans le processus de sélection des varibales. Enfin, nous étendons les problèmes de classification et de sélection de variables au cadre d'apprentissage semi-supervisé. Nous proposons une nouvelle approche de sélection de variables multi-label semi-supervisée basée sur le paradigme de l'ensemble. Le modèle proposé associe des principes issues de la co-training en conjonction avec une métrique interne d'évaluation d'importnance des varaibles basée sur les out-of-bag. Testés de manière satisfaisante sur plusieurs données de référence, les approches développées dans cette thèse sont prometteuses pour une variété d'ap-plications dans l'apprentissage multi-label supervisé et semi-supervisé. Testés de manière satisfaisante sur plusieurs jeux de données de référence, les approches développées dans cette thèse affichent des résultats prometteurs pour une variété domaine d'applications de l'apprentissage multi-label supervisé et semi-supervisé / Multi-label learning is a specific supervised learning problem where each instance can be associated with multiple target labels simultaneously. Multi-label learning is ubiquitous in machine learning and arises naturally in many real-world applications such as document classification, automatic music tagging and image annotation. In this thesis, we formulate the multi-label learning as an ensemble learning problem in order to provide satisfactory solutions for both the multi-label classification and the feature selection tasks, while being consistent with respect to any type of objective loss function. We first discuss why the state-of-the art single multi-label algorithms using an effective committee of multi-label models suffer from certain practical drawbacks. We then propose a novel strategy to build and aggregate k-labelsets based committee in the context of ensemble multi-label classification. We then analyze the effect of the aggregation step within ensemble multi-label approaches in depth and investigate how this aggregation impacts the prediction performances with respect to the objective multi-label loss metric. We then address the specific problem of identifying relevant subsets of features - among potentially irrelevant and redundant features - in the multi-label context based on the ensemble paradigm. Three wrapper multi-label feature selection methods based on the Random Forest paradigm are proposed. These methods differ in the way they consider label dependence within the feature selection process. Finally, we extend the multi-label classification and feature selection problems to the semi-supervised setting and consider the situation where only few labelled instances are available. We propose a new semi-supervised multi-label feature selection approach based on the ensemble paradigm. The proposed model combines ideas from co-training and multi-label k-labelsets committee construction in tandem with an inner out-of-bag label feature importance evaluation. Satisfactorily tested on several benchmark data, the approaches developed in this thesis show promise for a variety of applications in supervised and semi-supervised multi-label learning

Page generated in 0.0758 seconds