• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 92413
  • 58247
  • 33330
  • 15513
  • 5695
  • 3705
  • 1283
  • 1215
  • 1101
  • 1089
  • 1031
  • 967
  • 893
  • 710
  • Tagged with
  • 8973
  • 7954
  • 7348
  • 7104
  • 6420
  • 6143
  • 5758
  • 5194
  • 5036
  • 4587
  • 4492
  • 4392
  • 4209
  • 3533
  • 3482
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
221

Exploitation des statistiques structurelles d'une image pour la prédiction de la saillance visuelle et de la qualité perçue / Use of image structural statistics for prediction of visual saliency and perceived quality

Nauge, Michaël 11 December 2012 (has links)
Dans le domaine de la vision par ordinateur l'utilisation de points d'intérêt (PI) est récurrente pour les problématiques de reconnaissance et de suivi d'objets. Plusieurs études ont prouvé l'utilité de ces techniques, associant robustesse et un temps de calcul pouvant être compatible avec le temps réel. Cette thèse propose d'étudier et d'exploiter ces descripteurs de statistiques de l'image sous un tout autre regard. Ainsi, nous avons menée une étude sur le lien entre les PI et la saillance visuelle humaine. De cette étude nous avons pu développer une méthode de prédiction de carte de saillance exploitant la rapidité d'exécution de ces détecteurs. Nous avons également exploité le pouvoir descriptif de ces PI afin de développer de nouvelles métriques de qualité d'images. Grâce à des résultats encourageant en terme de prédiction de qualité perçue et la faible quantité d'information utilisée, nous avons pu intégrer notre métrique "QIP" dans une chaîne de transmission d'images sur réseau sans fil de type MIMO. L'ajout de cette métrique permet d'augmenter la qualité d'expérience en garantissant la meilleure qualité malgré les erreurs introduites par la transmission sans fil. Nous avons étendu cette étude, par l'analyse fine des statistiques structurelles de l'image et des migrations d'attributs afin de proposer un modèle générique de prédiction des dégradations. Enfin, nous avons été amenés à conduire diverses expériences psychovisuelles, pour valider les approches proposées ou dans le cadre de la normalisation de nouveaux standards du comité JPEG. Ce qui a mené à développer une application web dédiée à l'utilisation et la comparaison des métriques de qualité d'images. / In the field of computer vision, the use of interest points (IP) is very frequent for objects tracking and recognition. Several studies have demonstrated the usefulness of these techniques, combining robustness and complexity that can be compatible with the real time. This thesis proposes to explore and exploit these image statistical descriptors under a different angle. Thus, we conducted a study on the relationship between IP and human visual saliency. In this study, we developed a method for predicting saliency maps relying on the efficiency of the descriptors. We also used the descriptive power of the PI to develop new metrics for image quality. With encouraging results in terms of prediction of perceived quality and the reduced amount of used information, we were able to integrate our metric "QIP" in an image transmission framework over a MIMO wireless network. The inclusion of this metric can improve the quality of experience by ensuring the best visual quality despite the errors introduced by the wireless transmission. We have extended this study by deeply analyzing structural statistics of the image and migration attributes to provide a generic model for predicting impairments. Finally, we conducted various psychovisual experiments to validate the proposed approaches or to contribute to JPEG standard committee. This led to develop a web application dedicated to the benchmark of image quality metrics.
222

Modélisation statistique et probabiliste du temps inter-véhiculaire aux différents niveaux de trafic / Statistic and probabilistic modeling of time headway variable in different traffic levels

Ha, Duy Hung 11 May 2011 (has links)
Temps Inter-véhiculaire (TIV) est une variable microscopique fondamentale dans la théorie du trafic, et a été étudié depuis le début du développement de cette théorie, vers 1930. La distribution de probabilité du TIV décrit la répartition des arrivées des véhicules en un point donné et reflète dans une certaine mesure le comportement de conduite. Beaucoup d'applications en ingénierie du trafic viennent de la connaissance fine de cette variable. La thèse a pour but d'approfondir cette connaissance en modélisant la distribution du TIV dans différents contextes selon différents points de vue. Tout d'abord, deux méthodes d'échantillonnage, la méthode de groupement et la méthode de raffinement sont considérées. L'application numérique concerne deux bases de données, celle de la route nationale RN118 et celle de l'autoroute A6. Ensuite, trois types de modèles probabilistes sont analysés et classifiés. Une comparaison exhaustive des modèles et des méthodes d'estimation est réalisée ce qui conduit à considérer que le modèle gamma-GQM est supérieur aux autres modèles en matière de performance statistique et en efficacité de calcul. Différentes procédures d'estimation sont testées, celle qui est proposée et retenue favorise la stabilité des paramètres estimés. Six nouveaux modèles de TIV sont proposés, calibrés, analysés. Mis à part deux modèles de performance inférieure aux autres et au modèle gamma-GQM, quatre modèles sont équivalents voire meilleurs que le modèle gamma-GQM. Pour une raison pratique, le modèle Double Gamma est choisi à côté du modèle gamma-GQM, comme modèle de comparaison, dans toute la modélisation des TIV. Le calibrage des modèles et l'analyse des paramètres des modèles sont menés, à partir des données réelles, en considérant trois dimensions d'étude du trafic: les échelles macroscopique, mésoscopique et microscopique. Une quatrième dimension d'étude des TIV est constituée des facteurs exogènes au trafic. La prise en compte de ces facteurs exogènes, à chaque échelle macroscopique entraîne la distinction de deux types de facteur exogène : « empêchant » et « impulsant». Finalement, différentes approches de validation sont testées. L'approche proposée par « enveloppe des distributions » semble prometteuse pour le futur / Time Headway (TH) is a microscopic variable in traffic flow theories that has been studied since the 1930s. Distribution of this fundamental variable describes the arrival pattern of vehicles in traffic flow, so probabilistic modeling is the main approach to study TH and represent driving behaviour. The applications of the variable in traffic engineering are varied; include capacity calculation, microscopic simulation, traffic safety analysis, etc. This dissertation aims at modeling the TH distribution in different contexts. Firstly, the short-time sampling method and long-time sampling method are applied to obtain TH samples from the two data bases (the RN118 national roadway and the A6 motorway). Then, three probabilistic TH model types are analyzed and classified. An exhaustive comparison between the existing models and between the corresponding estimation methods lead to consider that the gamma-GQM is the best TH model in the literature. An estimation process is also proposed in order to obtain good and stable estimated results of the parameters. After that, the TH probabilistic modeling is developed by six new models. Except for the two ones which are worse, the four other models are statistically equivalent and/or better than the gamma-GQM. For practical reason, the Double Gamma model is selected, as a comparison model, with the gamma-GQM to calibrate all TH samples. Three traffic levels are considered: macroscopic, mesoscopic and microscopic. The effects of exogenous factors are also examined. Examining this factor in each macroscopic variable level leads to distinguish two following factor types: impeding factor and propulsive factor. Finally, different approaches for TH validation are tested. The proposed approach of “envelope of distributions” seems to be promising for future applications
223

Random and periodic operators in dimension 1 : Decorrelation estimates in spectal statistics and resonances / Opérateurs aléatoires et périodiques en dimension 1 : les estimées de décorrélation et résonances

Trinh, Tuan Phong 15 September 2015 (has links)
Cette thèse comporte deux parties qui correspondent à deux domaines distincts : les opérateurs aléatoires et les opérateurs périodiques en dimension 1. Dans la première partie, nous prouvons une estimée de décorrélation pour un opérateur aléatoire avec désordre hors diagonal en dimension 1. En se servant de cette estimée, nous déduisons l'indépendance asymptotique des statistiques locales des valeurs propres près d'énergies distinctes positives dans le régime localisé. Finalement, nous donnons une démonstration alternative de l'estimée de décorrélation pour le modèle d'Anderson discret unidimensionnel. La deuxième partie de cette thèse est liée à un problème de résonances pour l'opérateur de Schrödinger discret en dimension 1 avec potentiel périodique tronqué [...]. / This thesis consists of two parts : te random and periodic operators in dimension 1. In this part, we prove the decorrelation estimate for a 1D lattice Hamiltonian with off-diagonal disorder. Consequently, we deduce the asymptotic independance of the local level statistics near distinct positive energies in the localized regime. Finally, we revisit a known result on the decorrelation estimate for the 1D discret Anderson model. The second part on my thesis adresses questions on resonances for a 1D Schrödinger operators with truncated periodic potential [...].
224

La statistique d’État en Égypte à l’ère coloniale : Finances, espace public et représentation (1875-1922) / Numbers, colonialism and the public sphere : A history of statistics in Egypt (1875 –1922)

Labib, Malak 23 March 2015 (has links)
Ce travail porte sur l’histoire de la statistique d’État en Égypte au cours de la période 1875-1922 et s’intéresse au rapport entre le développement d'un système cognitif d'information statistique et les transformations marquant la rationalité gouvernementale à l’ère coloniale. Il cherche par ce biais à « endogénéiser la construction de l’outil statistique », par rapport à l’analyse du fonctionnement de l’État égyptien au cours de cette période. / My dissertation deals with the emergence and development of statistics, as a field of knowledge and practice in Egypt during the colonial era (1875-1922). It attempts to explore the complex relationship between knowledge production and colonization by analyzing how the emergence of new forms of enumeration and classification contributed to the making of the colonial State in Egypt.
225

Les facteurs influençant la réussite des activités collaboratives médiées par les TICE dans une situation de formation universitaire à la statistique / Factors influencing the success of collaborative activities mediated by ICT in university education situation in statistics

Diaz, Diane 27 April 2016 (has links)
Il ne fait aucun doute que notre société produit de plus en plus de données qui doivent être synthétisées et analysées. Leur traitement statistique est de plus en plus présent et l’usage de la statistique, déjà largement répandue, ne fait que s’accroître. Il paraît donc indispensable d’enseigner au grand nombre les rudiments de la statistique. Or, dans les cursus universitaires de sciences humaines et sociales (SHS), son enseignement est confronté à la difficulté de transmettre une discipline dont les étudiants sont peu familiarisés. De plus, la statistique s’adresse à un public hétérogène qui ne perçoit mal son degré d’intérêt et/ou son niveau d’utilité. Ces freins observés ont donné lieu à de nombreuses recherches permettant de dresser une typologie des obstacles les plus cités. Il s’agit couramment de difficultés de perception, de compréhension, d’application, d’appréciation, d’interprétation et de manipulation numérique. Notre thèse étudie quelques conditions qui semblent favorables à la réussite des étudiants dans leur apprentissage de la statistique et de ses applications. De nos lectures nous avons extrait les trois leviers les plus fréquemment cités : l’activité de l’apprenant, la collaboration en petits groupes et l’utilisation du numérique. Nous faisons nôtre l’essentiel des conclusions et des préconisations de ces modèles. Dans cette perspective, nous avons observé une situation de formation simultanément active, collaborative et médiée par un logiciel de traitement de données afin de réunir des conditions propices à la réussite des étudiants. Cependant, même dans une situation favorable où les étudiants suivent une formation dans un cadre institutionnel analogue, selon un contexte didactique et pédagogique identique, certains étudiants réussissent mieux que d’autres. C’est pourquoi, à eux seuls, le cadre institutionnel et le contexte ne peuvent expliquer ces dissemblances. Ce constat nous a engagée dans la recherche de caractéristiques préexistantes inhérentes aux étudiants qui pourraient contribuer à leur réussite. Notre présupposé théorique repose sur un modèle compréhensif qui concilie plusieurs facteurs que nous considérons comme déterminants dans le contexte étudié. Aussi distinguons-nous trois axes fondamentaux ; ceux liés à l’histoire des étudiants, à leur formation antérieure et culturelle que nous nommons biographiques, ceux correspondant à l’affectivité, à l’émotion et à la compétence perçue nommés psychologiques et ceux qui s’attachent aux connaissances déclaratives et aux compétences pré-acquises traduisant des fonctions cognitives dénommés cognitifs. Une meilleure connaissance de ces facteurs et de leur organisation pourrait enrichir la réflexion et les pratiques didactiques et pédagogiques dans une perspective d’amélioration constante des processus d’enseignement et d’apprentissage de la statistique. / There is no doubt that society produces ever more data which must be correlated and analysed. Statistical processing is increasingly prevalent and the use of this science continues to grow. It, therefore, seems essential to teach the largest number of people its elements. However, in the university curricula of Humanities and Social Sciences, this teaching is confronted with the difficulty of transmitting a discipline to which students are not accustomed. Moreover, statistics are addressed to a diverse public who do not always appreciate their relevance or application. These problems have resulted in extensive research to develop a classification of the difficulties most often cited. We often found problems associated with perception, comprehension, application, appraisal, interpretation andcomputer skills.Our thesis examines the conditions favourable to students' success. From our studies we have identified the three advantageous practices most often cited : practical experience for the student, collaboration in small groups and the use of digital technology. We have reached our viewpoint largely from the conclusions and recommendations of these models. From this perspective, we observed a training situation which was both active and collaborative, mediated by a data programme bringing together the conditions necessary for student success.However, even in a favourable situation where students are trained in a similar institutional framework, in the same pedagogical climate, some students are more successful than others. Therefore, the institutional framework and context alone cannot explain these dissimilarities.This observation has led us to search for some inherent characteristics of students which might influence their success. Our theory is based on a comprehensive model that comprises several factors that we consider crucial in the context studied. From this model we have identified three fundamental issues : those related to the history of the student named « biographical factors », those corresponding to the emotions and perceived difficulties called « psychological factors », and those concerning verbal and cognitive skills named « cognitive factors ». A better understanding of these factors and their organization could enrich the theory and practical application of both the teaching and study of statistics with a view to constant amelioration of the process.
226

Statistics of dislocations at low temperature in pure metals with body centered cubic symmetry / Statistiques du glissement des dislocations à basse température dans les métaux de symétrie cubique centrée

Choudhury, Anshuman 11 December 2018 (has links)
Les observations de microscopie électronique in situ effectuées par Daniel Caillard (CEMES, Toulouse) au cours de la déformation de cristaux de symétrie cubique centrée ont montré que les dislocations vis effectuaient des sauts de plusieurs distances inter-atomiques alors que la théorie standard de Peierls prédit des sauts de une seul distance inter-atomique. Nous avons étudié par simulation atomique le glissement d'une dislocation vis dans un cristal de fer pure. Nous montrons que la propagation de décrochement le long de la dislocation induit un échauffement local qui favorise la nucléation de décrochements supplémentaires. L'accumulation de ces décrochements permet à la dislocation de parcourir plusieurs distances inter-atomiques. Ces simulations nous permettent de proposer une théorie pour l'explication des observations de D. Caillard. / In situ straining tests in high purity α-Fe thin-foils at low temperatures have demonstrated that crystalline defects, called dislocations, have a jerky type of motion made of intermittent long jumps of several nanometers. Such an observation is in conflict with the standard Peierls mechanism for plastic deformation in bcc crystals, where the screw dislocation jumps are limited by inter-reticular distances, i.e. of a few Angstroms. Employing atomic-scale simulations, we show that although the short jumps are initially more favorable, their realization requires the propagation of a kinked profile along the dislocation line which yields coherent atomic vibrations acting as traveling thermal spikes. Such local heat bursts favor the thermally assisted nucleation of new kinks in the wake of primary ones. The accumulation of new kinks leads to long dislocation jumps like those observed experimentally. Our study constitutes an important step toward predictive atomic-scale theory for materials deformation.
227

Extreme value statistics of strongly correlated systems : fermions, random matrices and random walks / Statistique d'extrême de systèmes fortement corrélés : fermions, matrices aléatoires et marches aléatoires

Lacroix-A-Chez-Toine, Bertrand 04 June 2019 (has links)
La prévision d'événements extrêmes est une question cruciale dans des domaines divers allant de la météorologie à la finance. Trois classes d'universalité (Gumbel, Fréchet et Weibull) ont été identifiées pour des variables aléatoires indépendantes et de distribution identique (i.i.d.).La modélisation par des variables aléatoires i.i.d., notamment avec le modèle d'énergie aléatoire de Derrida, a permis d'améliorer la compréhension des systèmes désordonnés. Cette hypothèse n'est toutefois pas valide pour de nombreux systèmes physiques qui présentent de fortes corrélations. Dans cette thèse, nous étudions trois modèles physiques de variables aléatoires fortement corrélées : des fermions piégés,des matrices aléatoires et des marches aléatoires. Dans la première partie, nous montrons plusieurs correspondances exactes entre l'état fondamental d'un gaz de Fermi piégé et des ensembles de matrices aléatoires. Le gaz Fermi est inhomogène dans le potentiel de piégeage et sa densité présente un bord fini au-delà duquel elle devient essentiellement nulle. Nous développons une description précise des statistiques spatiales à proximité de ce bord, qui va au-delà des approximations semi-classiques standards (telle que l'approximation de la densité locale). Nous appliquons ces résultats afin de calculer les statistiques de la position du fermion le plus éloigné du centre du piège, le nombre de fermions dans un domaine donné (statistiques de comptage) et l'entropie d'intrication correspondante. Notre analyse fournit également des solutions à des problèmes ouverts de valeurs extrêmes dans la théorie des matrices aléatoires. Nous obtenons par exemple une description complète des fluctuations de la plus grande valeur propre de l'ensemble complexe de Ginibre.Dans la deuxième partie de la thèse, nous étudions les questions de valeurs extrêmes pour des marches aléatoires. Nous considérons les statistiques d'écarts entre positions maximales consécutives (gaps), ce qui nécessite de prendre en compte explicitement le caractère discret du processus. Cette question ne peut être résolue en utilisant la convergence du processus avec son pendant continu, le mouvement Brownien. Nous obtenons des résultats analytiques explicites pour ces statistiques de gaps lorsque la distribution de sauts est donnée par la loi de Laplace et réalisons des simulations numériques suggérant l'universalité de ces résultats. / Predicting the occurrence of extreme events is a crucial issue in many contexts, ranging from meteorology to finance. For independent and identically distributed (i.i.d.) random variables, three universality classes were identified (Gumbel, Fréchet and Weibull) for the distribution of the maximum. While modelling disordered systems by i.i.d. random variables has been successful with Derrida's random energy model, this hypothesis fail for many physical systems which display strong correlations. In this thesis, we study three physically relevant models of strongly correlated random variables: trapped fermions, random matrices and random walks.In the first part, we show several exact mappings between the ground state of a trapped Fermi gas and ensembles of random matrix theory. The Fermi gas is inhomogeneous in the trapping potential and in particular there is a finite edge beyond which its density vanishes. Going beyond standard semi-classical techniques (such as local density approximation), we develop a precise description of the spatial statistics close to the edge. This description holds for a large universality class of hard edge potentials. We apply these results to compute the statistics of the position of the fermion the farthest away from the centre of the trap, the number of fermions in a given domain (full counting statistics) and the related bipartite entanglement entropy. Our analysis also provides solutions to open problems of extreme value statistics in random matrix theory. We obtain for instance a complete description of the fluctuations of the largest eigenvalue in the complex Ginibre ensemble.In the second part of the thesis, we study extreme value questions for random walks. We consider the gap statistics, which requires to take explicitly into account the discreteness of the process. This question cannot be solved using the convergence of the process to its continuous counterpart, the Brownian motion. We obtain explicit analytical results for the gap statistics of the walk with a Laplace distribution of jumps and provide numerical evidence suggesting the universality of these results.
228

statistiques jointes des figures de speckle transmises et réfléchies : des corrélations mésoscopiques à la théorie de l'information / joint-statistics between reflected and transmitted speckle patterns : from mesoscopic correlations to information theory

Fayard, Nikos 02 November 2017 (has links)
Les nuages, le lait, le papier, les tissus biologiques appartiennent tous à une même classe de milieux que l'on nomme diffusants de part leur habilité à transformer une onde incidente collimatée en un faisceau diffus. L'imagerie, ou le transfert d'information à travers ces milieux est a priori plus difficile qu'en milieu homogène, et les méthodes actuelles nécessitent une caméra en transmission du milieu complexe considéré. La présence de cette caméra est souvent considérée comme une faille de ces méthodes car la transmission de ces milieux est souvent hors d'atteinte par l'opérateur. Dans cette thèse nous posons la question du lien qui existe entre la lumière réfléchie et la lumière transmise en milieux fortement diffusant. Nous traitons ce problème de manière statistique et nous intéressons à la dépendance statistique qui existe entre la lumière réfléchie et la lumière transmise. Nous verrons que ce lien statistique persiste même pour des milieux fortement diffusants. Ce lien statistique peut être a la base de nouvelles méthodes de contrôle du front d'onde en milieux diffusant n'utilisant que des informations réfléchies par le milieu, permettant l'imagerie, le dépôt d'énergie ou d'informations à travers des milieux fortement diffusants. / Clouds, milk, paper or biological tissues are called scattering media for light. Indeed when a plane wave encounters one a these media, the light is scattered and looses its preferential direction. Consequently, imaging through these media is more difficult than in homogeneous media. The existing methods rely on a CCD camera measuring the transmitted light. Nonetheless, the transmitted side of the sample is most of the time out of reach of the operator. In this thesis we interest ourselves to the link that exists between the reflected light and the transmitted light for thick scattering media. From a statistical point of view, this link is equivalent to the statistical dependency between the reflected light and the transmitted light. We show that the statistical dependency persists even for very thick media allowing us to propose new imaging modalities based on it. This statistical dependency between the reflected and the transmitted light is a very rich function of the parameters of the system, and may allow us to control the transmitted light using reflected information only.
229

Bayesian statistics and modeling for the prediction of radiotherapy outcomes : an application to glioblastoma treatment / Utilisation des statistiques bayésiennes et de la modélisation pour la prédiction des effets de la radiothérapie : application au traitement du glioblastome

Zambrano Ramirez, Oscar Daniel 18 December 2018 (has links)
Un cadre statistique bayésien a été créé dans le cadre de cette thèse pour le développement de modèles cliniques basés sur une approche d’apprentissage continu dans laquelle de nouvelles données peuvent être ajoutées. L’objectif des modèles est de prévoir les effets de la radiothérapie à partir de preuves cliniques. Des concepts d’apprentissage machine ont été utilisés pour résoudre le cadre bayésien. Les modèles développés concernent un cancer du cerveau agressif appelé glioblastome. Les données médicales comprennent une base de données d’environ 90 patients souffrant de glioblastome ; la base de données contient des images médicales et des entrées de données telles que l’âge, le sexe, etc. Des modèles de prévision neurologique ont été construits pour illustrer le type de modèles qui sont obtenus avec la méthodologie. Des modèles de récidive du glioblastome, sous la forme de modèles linéaires généralisés (GLM) et de modèles d’arbres de décision, ont été développés pour explorer la possibilité de prédire l’emplacement de la récidive à l’aide de l’imagerie préradiothérapie. Faute d’une prédiction suffisamment forte obtenue par les modèles arborescents, nous avons décidé de développer des outils de représentation visuelle. Ces outils permettent d’observer directement les valeurs d’intensité des images médicales concernant les lieux de récidive et de non-récurrence. Dans l’ensemble, le cadre élaboré pour la modélisation des données cliniques en radiothérapie fournit une base solide pour l’élaboration de modèles plus complexes. / A Bayesian statistics framework was created in this thesis work for developing clinical based models in a continuous learning approach in which new data can be added. The objective of the models is to forecast radiation therapy effects based on clinical evidence. Machine learning concepts were used for solving the Bayesian framework. The models developed concern an aggressive brain cancer called glioblastoma. The medical data comprises a database of about 90 patients suffering glioblastoma; the database contains medical images and data entries such as age, gender, etc. Neurologic grade predictions models were constructed for illustrating the type of models that can be build with the methodology. Glioblastoma recurrence models, in the form of Generalized Linear Models (GLM) and decision tree models, were developed to explore the possibility of predicting the recurrence location using pre-radiation treatment imaging. Following, due to the lack of a sufficiently strong prediction obtained by the tree models, we decided to develop visual representation tools to directly observe the medical image intensity values concerning the recurrence and non-recurrence locations. Overall, the framework developed for modeling of radiation therapy clinical data provides a solid foundation for more complex models to be developed.
230

The Statistical Fate of Genomic DNA : Modelling Match Statistics in Different Evolutionary Scenarios / Le devenir statistique de l'ADN génomique : Modélisation des statistiques d'appariement dans différents scénarios évolutifs

Massip, Florian 02 October 2015 (has links)
Le but de cette thèse est d'étudier la distribution des tailles des répétitions au sein d'un même génome, ainsi que la distribution des tailles des appariements obtenus en comparant différents génomes. Ces distributions présentent d'importantes déviations par rapport aux prédictions des modèles probabilistes existants. Étonnamment, les déviations observées sont distribuées selon une loi de puissance. Afin d'étudier ce phénomène, nous avons développé des modèles mathématiques prenant en compte des mécanismes évolutifs plus complexes, et qui expliquent les distributions observées. Nous avons aussi implémenté des modèles d'évolution de séquences in silico générant des séquences ayant les mêmes propriétés que les génomes étudiés. Enfin, nous avons montré que nos modèles permettent de tester la qualité des génomes récemment séquencés, et de mettre en évidence la prévalence de certains mécanismes évolutifs dans les génomes eucaryotes. / In this thesis, we study the length distribution of maximal exact matches within and between eukaryotic genomes. These distributions strongly deviate from what one could expect from simple probabilistic models and, surprisingly, present a power-law behavior. To analyze these deviations, we develop mathematical frameworks taking into account complex mechanisms and that reproduce the observed deviations. We also implemented in silico sequence evolution models that reproduce these behaviors. Finally, we show that we can use our framework to assess the quality of sequences of recently sequenced genomes and to highlight the importance of unexpected biological mechanisms in eukaryotic genomes.

Page generated in 0.1966 seconds