101 |
Motion planning of multi-robot system for airplane stripping / Plannification des trajectoires s’un système multi-robot pour faire le décapage des avionsKalawoun, Rawan 26 April 2019 (has links)
Cette thèse est une partie d’un projet français qui s’appelle AEROSTRIP, un partenariat entre l’Institut Pascal, Sigma, SAPPI et Air-France industries, il est financé par le gouvernement français par le programme FUI (20 eme appel). Le projet AEROSTRIP consiste à développer le premier système automatique qui nettoie écologiquement les surfaces des avions et les pièces de rechange en utilisant un abrasif écologique projeté à grande vitesse sur la surface des avions (maïs). Ma thèse consiste à optimiser les trajectoires du système robotique total de telle façon que le décapage de l’avion soit optimal. Le déplacement des robots est nécessaire pour assurer une couverture totale de la surface à décaper parce que ces surfaces sont trop grandes et elles ne peuvent pas être décapées d’une seule position. Le but de mon travail est de trouver le nombre optimal de robots avec leur positions optimales pour décaper totalement l’avion. Une fois ce nombre est déterminé, on cherche les trajectoires des robots entre ces différentes positions. Alors, pour atteindre ce but, j’ai défini un cadre général composant de quatre étapes essentiels: l’étape pre-processing, l’étape optimization algorithm, l’étape generation of the end-effector trajectories et l’étape robot scheduling, assignment and control.Dans ma thèse, j’ai deux contributions dans deux différentes étapes du cadre général: l’étape pre-processing et l’étape optimization algorithm. Le calcul de l’espace de travail du robot est nécessairedans l’étape pre-processing: on a proposé l’Analyse par Intervalles pour trouver cet espace de travail parce qu’il garantie le fait de trouver des solutions dans un temps de calcul raisonnable. Alors, ma première contribution est une nouvelle fonction d’inclusion qui réduit le pessimisme, la surestimation des solutions qui est le principal inconvénient de l’Analyse par Intervalles. La nouvelle fonction d’inclusion est évaluée sur des problèmes de satisfaction de contraintes et des problèmes d’optimisation des contraintes. En plus, on a proposé un algorithme d’optimisation hybride pour trouver le nombre optimal de robots avec leur positions optimales: c’est notre deuxième contribution qui est dans l’étape optimization algorithm. Pour évaluer l’algorithme d’optimisation, on a testé cet algorithme sur des surfaces régulières, comme un cylindre et un hémisphère, et sur un surface complexe: une voiture. / This PHD is a part of a French project named AEROSTRIP, (a partnership between Pascal Institute,Sigma, SAPPI, and Air-France industries), it is funded by the French Government through the FUIProgram (20th call). The AEROSTRIP project aims at developing the first automated system thatecologically cleans the airplanes surfaces using a process of soft projection of ecological media onthe surface (corn). My PHD aims at optimizing the trajectory of the whole robotic systems in orderto optimally strip the airplane. Since a large surface can not be totally covered by a single robot base placement, repositioning of the robots is necessary to ensure a complete stripping of the surface. The goal in this work is to find the optimal number of robots with their optimal positions required to totally strip the air-plane. Once found, we search for the trajectories of the robots of the multi-robot system between those poses. Hence, we define a general framework to solve this problem having four main steps: the pre-processing step, the optimization algorithm step, the generation of the end-effector trajectories step and the robot scheduling, assignment and control step.In my thesis, I present two contributions in two different steps of the general framework: the pre-processing step, the optimization algorithm step. The computation of the robot workspace is required in the pre-processing step: we proposed Interval Analysis to find this workspace since it guarantees finding solutions in a reasonable computation time. Though, our first contribution is a new inclusion function that reduces the pessimism, the overestimation of the solution, which is the main disadvantage of Interval Analysis. The proposed inclusion function is assessed on some Constraints Satisfaction Problems and Constraints Optimization problems. Furthermore, we propose an hybrid optimization algorithm in order to find the optimal number of robots with their optimal poses: it is our second contribution in the optimization algorithm step. To assess our hybrid optimization algorithm, we test the algorithm on regular surfaces, such as a cylinder and a hemisphere, and on a complex surface: a car.
|
102 |
Modèle informatique du coapprentissage des ganglions de la base et du cortex : l'apprentissage par renforcement et le développement de représentationsRivest, François 12 1900 (has links)
Tout au long de la vie, le cerveau développe des représentations de son environnement permettant à l’individu d’en tirer meilleur profit. Comment ces représentations se développent-elles pendant la quête de récompenses demeure un mystère. Il est raisonnable de penser que le cortex est le siège de ces représentations et que les ganglions de la base jouent un rôle important dans la maximisation des récompenses. En particulier, les neurones dopaminergiques semblent coder un signal d’erreur de prédiction de récompense. Cette thèse étudie le problème en construisant, à l’aide de l’apprentissage machine, un modèle informatique intégrant de nombreuses évidences neurologiques.
Après une introduction au cadre mathématique et à quelques algorithmes de l’apprentissage machine, un survol de l’apprentissage en psychologie et en neuroscience et une revue des modèles de l’apprentissage dans les ganglions de la base, la thèse comporte trois articles. Le premier montre qu’il est possible d’apprendre à maximiser ses récompenses tout en développant de meilleures représentations des entrées. Le second article porte sur l'important problème toujours non résolu de la représentation du temps. Il démontre qu’une représentation du temps peut être acquise automatiquement dans un réseau de neurones artificiels faisant office de mémoire de travail. La représentation développée par le modèle ressemble beaucoup à l’activité de neurones corticaux dans des tâches similaires. De plus, le modèle montre que l’utilisation du signal d’erreur de récompense peut accélérer la construction de ces représentations temporelles. Finalement, il montre qu’une telle représentation acquise automatiquement dans le cortex peut fournir l’information nécessaire aux ganglions de la base pour expliquer le signal dopaminergique. Enfin, le troisième article évalue le pouvoir explicatif et prédictif du modèle sur différentes situations comme la présence ou l’absence d’un stimulus (conditionnement classique ou de trace) pendant l’attente de la récompense. En plus de faire des prédictions très intéressantes en lien avec la littérature sur les intervalles de temps, l’article révèle certaines lacunes du modèle qui devront être améliorées.
Bref, cette thèse étend les modèles actuels de l’apprentissage des ganglions de la base et du système dopaminergique au développement concurrent de représentations temporelles dans le cortex et aux interactions de ces deux structures. / Throughout lifetime, the brain develops abstract representations of its environment that allow the individual to maximize his benefits. How these representations are developed while trying to acquire rewards remains a mystery. It is reasonable to assume that these representations arise in the cortex and that the basal ganglia are playing an important role in reward maximization. In particular, dopaminergic neurons appear to code a reward prediction error signal. This thesis studies the problem by constructing, using machine learning tools, a computational model that incorporates a number of relevant neurophysiological findings.
After an introduction to the machine learning framework and to some of its algorithms, an overview of learning in psychology and neuroscience, and a review of models of learning in the basal ganglia, the thesis comprises three papers. The first article shows that it is possible to learn a better representation of the inputs while learning to maximize reward. The second paper addresses the important and still unresolved problem of the representation of time in the brain. The paper shows that a time representation can be acquired automatically in an artificial neural network acting like a working memory. The representation learned by the model closely resembles the activity of cortical neurons in similar tasks. Moreover, the model shows that the reward prediction error signal could accelerate the development of the temporal representation. Finally, it shows that if such a learned representation exists in the cortex, it could provide the necessary information to the basal ganglia to explain the dopaminergic signal. The third article evaluates the explanatory and predictive power of the model on the effects of differences in task conditions such as the presence or absence of a stimulus (classical versus trace conditioning) while waiting for the reward. Beyond making interesting predictions relevant to the timing literature, the paper reveals some shortcomings of the model that will need to be resolved.
In summary, this thesis extends current models of reinforcement learning of the basal ganglia and the dopaminergic system to the concurrent development of representation in the cortex and to the interactions between these two regions.
|
103 |
Complexité de l'exploration par agent mobile des graphes dynamiquesWade, Ahmed 31 January 2014 (has links) (PDF)
Cette thèse porte sur l'étude de la complexité de l'exploration de graphes dynamiques par agent mobile. Une entité mobile (appelée agent) se déplaçant dans un graphe dynamique doit traverser/visiter au moins une fois chacun de ses sommets. (Le temps de traversée d'une arête est unitaire.) Ce problème fondamental en algorithmique par agents mobiles a été très étudié dans les graphes statiques depuis l'article originel de Claude Shannon. Concernant les graphes dynamiques, seul le cas des graphes dynamiques périodiques a été étudié. Nous étudions ce problème dans deux familles de graphes dynamiques, les graphes dynamiques périodiquement variables (PV-graphes) et les graphes dynamiques T-intervalle-connexes. Les résultats obtenus dans cette thèse améliorent des résultats existants et donnent des bornes optimales sur le problème étudié. Un PV-graphe est défini par un ensemble de transporteurs suivant infiniment leur route respective le long des stations du réseau. En 2013, Flocchini, Mans et Santoro ont étudié le problème de l'exploration des PV-graphes en considérant que l'agent doit toujours rester sur les transporteurs. Cette thèse montre l'impact de la capacité d'attendre sur les stations. Nous prouvons que l'attente sur les stations permet à l'agent d'atteindre de meilleures complexités en pire cas : le nombre de mouvements est réduit d'un facteur multiplicatif d'au moins $\Theta(p)$, et la complexité en temps passe de $\Theta(kp^2)$ à $\Theta(np)$, où $n$ est le nombre de stations, $k$ le nombre de transporteurs, et $p$ la période maximale ($n\leq kp$ dans tout PV-graphe connexe). Par ailleurs, l'algorithme que nous proposons pour prouver les bornes supérieures permet de réaliser la cartographie du PV-graphe, en plus de l'explorer. Dans la deuxième partie de cette thèse, nous considérons le même problème (l'exploration) dans les graphes dynamiques T-intervalle-connexes. Un graphe dynamique est $T$-intervalle-connexe ($T \geq 1$) si pour chaque fenêtre de $T$ unités de temps, il existe un sous-graphe couvrant connexe stable. Nous considérons dans un premier temps les graphes dynamiques T-intervalle-connexes qui ont un anneau de taille $n$ comme graphe sous-jacent et nous montrons que la complexité en temps en pire cas de leurs exploration est de $2n-T-\Theta(1)$ unités de temps si l'agent connaît la dynamique du graphe, et $n+ \frac{n}{\max\{1,T-1\}} (\delta-1) \pm\Theta(\delta)$ unités de temps sinon, où $\delta$ est le temps maximum entre deux apparitions successives d'une arête. Nous généralisons ensuite ces résultats en considérant une autre famille de graphes sous-jacents, les cactus à $n$ sommets. Un cactus est un graphe connexe dans lequel deux cycles ont au plus un sommet en commun. Nous donnons un algorithme qui permet d'explorer ces graphes dynamiques en au plus $2^{O(\sqrt{log n})} n$ unités de temps, et nous montrons que la borne inférieure de notre algorithme est $2^{\Omega(\sqrt{log n})} n$.
|
104 |
Prédiction du risque de DMLA : identification de nouveaux biomarqueurs et modélisation du risque / AMD risk prediction : identification of new biomarkers and risk modelingAjana, Soufiane 04 November 2019 (has links)
La dégénérescence maculaire liée à l’âge (DMLA) est la première cause de cécité dans les pays industrialisés. C’est une maladie complexe et multifactorielle ayant des conséquences majeures sur la qualité de vie des personnes atteintes. De nombreux facteurs de risque, génétiques et non génétiques, jouent un rôle important dans la pathogénèse des stades avancés de la DMLA. Les modèles de prédiction développés à ce jour reposent sur un nombre limité de ces facteurs, et sont encore peu utilisés dans la pratique clinique.Ce travail de thèse avait pour premier objectif d’identifier de nouveaux biomarqueurs circulants du risque de DMLA. Ainsi, à partir d’une étude post-mortem basée sur une approche de lipidomique, nous avons identifié les composés lipidiques sanguins les plus prédictifs des concentrations rétiniennes en acides gras polyinsaturés omégas 3 (AGPI w-3). Nous avons développé un modèle de prédiction basé sur 7 espèces de lipides des esters de cholestérol. Ce modèle, obtenu en combinant pénalisation et réduction de la dimension, a ensuite été validé dans des études cas-témoins de DMLA et dans un essai clinique randomisé de supplémentation en AGPI w-3. Ces biomarqueurs pourraient être utiles pour l’identification des personnes à haut risque de DMLA, qui pourraient ainsi bénéficier d’une supplémentation en AGPI w-3.Le deuxième objectif de cette thèse était de développer un modèle de prédiction du risque de progression vers une DMLA avancée à partir de facteurs de risque génétiques, phénotypiques et environnementaux. Une originalité de notre travail a été d’utiliser une méthode de régression pénalisée – un algorithme d’apprentissage automatique – dans un cadre de survie afin de tenir compte de la multicollinéarité entre les facteurs de risque. Nous avons également pris en compte la censure par intervalle et le risque compétitif du décès via un modèle à 3 états sain-malade-mort. Nous avons ensuite validé ce modèle sur une étude indépendante en population générale.Il serait intéressant de valider ce modèle de prédiction dans d’autres études indépendantes en y incluant les biomarqueurs circulants identifiés à partir de l’étude de lipidomique effectuée dans le cadre de cette thèse. Le but final serait d’intégrer cet outil prédictif dans la pratique clinique afin de rendre la médecine de précision une réalité pour les patients atteints de DMLA dans le futur proche. / Age-related macular degeneration (AMD) is the leading cause of blindness in industrialized countries. AMD is a complex and multifactorial disease with major consequences on the quality of life. Numerous genetic and non-genetic risk factors play an important role in the pathogenesis of the advanced stages of AMD. Existing prediction models rely on a restricted set of risk factors and are still not widely used in the clinical routine.The first objective of this work was to identify new circulating biomarkers of AMD’s risk using a lipidomics approach. Based on a post-mortem study, we identified the most predictive circulating lipids of retinal content in omega-3 polyunsaturated fatty acids (w-3 PUFAs). We combined penalization and dimension reduction to establish a prediction model based on plasma concentration of 7 cholesteryl ester species. We further validated this model on case-control and interventional studies. These biomarkers could help identify individuals at high risk of AMD who could be supplemented with w-3 PUFAs.The second objective of this thesis was to develop a prediction model for advanced AMD. This model incorporated a wide set of phenotypic, genotypic and lifestyle risk factors. An originality of our work was to use a penalized regression method – a machine learning algorithm – in a survival framework to handle multicollinearities among the risk factors. We also accounted for interval censoring and the competing risk of death by using an illness-death model. Our model was then validated on an independent population-based cohort.It would be interesting to integrate the circulating biomarkers identified in the lipidomics study to our prediction model and to further validate it on other external cohorts. This prediction model can be used for patient selection in clinical trials to increase their efficiency and paves the way towards making precision medicine for AMD patients a reality in the near future.
|
105 |
Sur les familles des lois de fonction de hasard unimodale : applications en fiabilité et analyse de survieSaaidia, Noureddine 24 June 2013 (has links)
En fiabilité et en analyse de survie, les distributions qui ont une fonction de hasard unimodale ne sont pas nombreuses, qu'on peut citer: Gaussienne inverse ,log-normale, log-logistique, de Birnbaum-Saunders, de Weibull exponentielle et de Weibullgénéralisée. Dans cette thèse, nous développons les tests modifiés du Chi-deux pour ces distributions tout en comparant la distribution Gaussienne inverse avec les autres. Ensuite nousconstruisons le modèle AFT basé sur la distribution Gaussienne inverse et les systèmes redondants basés sur les distributions de fonction de hasard unimodale. / In reliability and survival analysis, distributions that have a unimodalor $\cap-$shape hazard rate function are not too many, they include: the inverse Gaussian,log-normal, log-logistic, Birnbaum-Saunders, exponential Weibull and power generalized Weibulldistributions. In this thesis, we develop the modified Chi-squared tests for these distributions,and we give a comparative study between the inverse Gaussian distribution and the otherdistributions, then we realize simulations. We also construct the AFT model based on the inverseGaussian distribution and redundant systems based on distributions having a unimodal hazard ratefunction.
|
Page generated in 0.0883 seconds