101 |
Restauration d'images de noyaux cellulaires en microscopie 3D par l'introduction de connaissance a priori / Denoising 3D microscopy images of cell nuclei using shape priorsBouyrie, Mathieu 29 November 2016 (has links)
Cette thèse aborde la problématique de la restauration d’images 3D de noyaux cellulaires fluorescents issues de la microscopie 2-photons à balayage laser d’animaux observés in vivo et in toto au cours de leur développement embryonnaire. La dégradation originale de ces images provient des limitations des systèmes optiques, du bruit intrinsèque des systèmes de détection ansi que de l’absorption et la diffusion de la lumière dans la profondeur des tissus. A la différence des propositions de “débruitage” de l’état de l’art, nous proposons ici une méthode qui prend en compte les particularités des données biologiques. Cette méthode, adaptation à la troisième dimension d’un algorithme utilisé dans l’analyse d’image astronomique, tire parti de connaissances a priori sur les images étudiées. Les hypothèses émises portent à la fois sur la détérioration du signal par un bruit supposé Mixe Poisson Gaussien (MPG) et sur la nature des objets observés. Nous traitons ici le cas de noyaux de cellules embryonnaires que nous supposons quasi sphériques.L’implémentation en 3D doit prendre en compte les dimensions de la grille d’échantillonnage de l’image. En effet ces dimensions ne sont pas identiques dans les trois directions de l’espace et un objet sphérique échantillonné sur cette grille perd cette caractéristique. Pour adapter notre méthode à une telle grille, nous avons ré-interprété le processus de filtrage, au coeur de la théorie originale, comme un processus physique de diffusion. / In this this document, we present a method to denoise 3D images acquired by 2-photon microscopy and displaying cell nuclei of animal embryos. The specimens are observed in toto and in vivo during their early development. Image deterioration can be explained by the microscope optical flaws, the acquisition system limitations, and light absorption and diffusion through the tissue depth.The proposed method is a 3D adaptation of a 2D method so far applied to astronomical images and it also differs from state-of the of-the-art methods by the introduction of priors on the biological data. Our hypotheses include assuming that noise statistics are Mixed Poisson Gaussian (MPG) and that cell nuclei are quasi spherical.To implement our method in 3D, we had to take into account the sampling grid dimensions which are different in the x, y or z directions. A spherical object imaged on this grid loses this property. To deal with such a grid, we had to interpret the filtering process, which is a core element of the original theory, as a diffusion process.
|
102 |
Analyses bioinformatiques de la régulation des éléments transposables chez les mammifères / Bioinformatics analysis of transposable elements regulation in mammalsTeissandier, Aurélie 05 October 2018 (has links)
Les éléments transposables sont des séquences d'ADN qui ont la capacité de se déplacer dans le génome. Ils peuvent modifier l’architecture et la régulation du génome, et sont ainsi impliqués dans de nombreux désordres pathologiques, congénitaux ou acquis. L’analyse bioinformatique des éléments transposables dans les données de séquençage est la méthode de choix pour comprendre leur biologie. Mon travail de thèse a été dédié à cette question en utilisant des données réelles et simulées. Dans un premier axe, en utilisant un système cellulaire modulant le niveau de méthylation, nous avons révélé que différentes modifications chromatiniennes répressives assurent la mise sous silence des éléments transposables lorsque la méthylation de l’ADN est perdue. Dans un second axe, à l'aide d'une stratégie de mutagenèse aléatoire, nous avons découvert une nouvelle ADN méthyltransférase, spécialisée dans la méthylation des transposons jeunes au cours de la spermatogenèse. De par la nature répétée des éléments transposables, l'analyse des transposons dans les données de séquençage reste cependant un véritable défi. Finalement, dans un troisième temps, j’ai eu recours à une stratégie de simulation pour comparer les différentes méthodes d’alignement et de quantification dans les génomes murin et humain. J'ai ainsi pu élaborer des recommandations pour l'étude des éléments transposables et révéler les limites de détection de certaines familles de transposons. / Transposable elements are DNA sequences that have the ability to move in the genome. They can modify the architecture and the regulation of the genome, and be implicated in different pathological, congenital or acquired disorders. The transposon analysis with sequencing data is the first choice method to understand their biology. My thesis work was dedicated to this question using real and simulated data. In a first research axis, using a cellular system to modulate DNA methylation levels, we revealed that different repressive chromatin modifications ensure the silencing of transposable elements when DNA methylation is lost. In a second axis, using a random mutagenesis strategy, we discovered a new DNA methyltransferase, specialized in the methylation of young transposons during spermatogenesis. However, the analysis of transposons in sequencing datasets is a bioinformatic challenge because of the repeated nature of transposable elements. Eventually, in a third axis, using a simulation strategy applied to the mouse and the human genomes, I systematically compared different alignment and quantification tools. I was able to draw recommendations for the analysis of transposons and to reveal the limits in detecting specific transposons families.
|
103 |
Multi-dimensional probing for RNA secondary structure(s) prediction / Analyse différentielle de données de sondage pour la prédiction des structures d'acides ribonucléiquesSaaidi, Afaf 01 October 2018 (has links)
En bioinformatique structurale, la prédiction de la (des) structure(s) secondaire(s) des acides ribonucléiques (ARNs) constitue une direction de recherche majeure pour comprendre les mécanismes cellulaires. Une approche classique pour la prédiction de la structure postule qu'à l'équilibre thermodynamique, l'ARN adopte plusieurs conformations, caractérisées par leur énergie libre, dans l’ensemble de Boltzmann. Les approches modernes privilégient donc une considération des conformations dominantes. Ces approches voient leur précision limitées par l'imprécision des modèles d'énergie et les restrictions topologiques pesant sur les espaces de conformations.Les données expérimentales peuvent être utilisées pour pallier aux lacunes des méthodes de prédiction. Différents protocoles permettent ainsi la révélation d'informations structurales partielles via une exposition à un réactif chimique/enzymatique, dont l'effet dépend, et est donc révélateur, de la (les) structure(s) adoptée(s). Les données de sondage mono-réactif sont utilisées pour valider et complémenter les modèles d’énergie libre, permettant ainsi d’améliorer la précision des prédictions. En pratique, cependant, les praticiens basent leur modélisation sur des données de sondage produites dans diverses conditions expérimentales, utilisant différents réactifs ou associées à une collection de séquences mutées. Une telle approche intégrative est répandue mais reste manuelle, onéreuse et subjective. Au cours de cette thèse, nous avons développé des méthodes in silico pour une modélisation automatisée de la structure à partir de plusieurs sources de données de sondage.En premier lieu, nous avons établi des pipelines d’analyse automatisés pour l'acquisition de profils de réactivité à partir de données brutes produites à travers une série de protocoles. Nous avons ensuite conçu et implémenté une nouvelle méthode qui permet l'intégration simultanée de plusieurs profils de sondage. Basée sur une combinaison d'échantillonnage de l'ensemble de Boltzmann et de clustering structurel, notre méthode produit des conformations dominantes, stables et compatible avec les données de sondage. En favorisant les structures récurrentes, notre méthode permet d’exploiter la complémentarité entre plusieurs données de sondage. Ses performances dans le cas mono-sondage sont comparables ou meilleures que celles des méthodes prédictives de pointe.Cette méthode a permis de proposer des modèles pour les régions structurées des virus. En collaboration avec des expérimentalistes, nous avons suggéré une structure raffinée de l'IRES du VIH-1 Gag, compatible avec les données de sondage chimiques et enzymatiques, qui nous a permis d’identifier des sites d'interactions putatifs avec le ribosome. Nous avons également modélisé la structure des régions non traduites d'Ebola. Cohérents avec les données de sondage SHAPE et les données de covariation, nos modèles montrent l’existence d'une tige-boucle conservée et stable à l'extrémité 5', une structure typiquement présente dans les génomes viraux pour protéger l'ARN de la dégradation par les nucléases.L’extension de notre méthode pour l’analyse simultanée de variants, appliquée dans un premier temps sur des mutants produits par le protocole Mutate-and-Map et sondés par le DMS, a permis d'enregistrer une amélioration en précision de prédiction. Pour éviter la production systématique de mutants ponctuels et exploiter le protocole récent SHAPEMap, nous avons conçu un protocole expérimental basé sur une mutagenèse non dirigé et le séquençage, où plusieurs ARN mutés sont produits et simultanément sondés. Nous avons traité l’affectation des reads aux mutants de références à l'aide d'une instance de l'algorithme "Expectation-Maximization" dont les résultats préliminaires, sur un échantillon de reads réduit/simulé, ont montré un faible taux d’erreurs d'assignation par rapport à une affectation classique des reads aux séquences d'ARN de référence. / In structural bioinformatics, predicting the secondary structure(s) of ribonucleic acids (RNAs) represents a major direction of research to understand cellular mechanisms. A classic approach for structure postulates that, at the thermodynamic equilibrium, RNA adopts its various conformations according to a Boltzmann distribution based on its free energy. Modern approaches, therefore, favor the consideration of the dominant conformations. Such approaches are limited in accuracy due to the imprecision of the energy model and the structure topology restrictions.Experimental data can be used to circumvent the shortcomings of predictive computational methods. RNA probing encompasses a wide array of experimental protocols dedicated to revealing partial structural information through exposure to a chemical or enzymatic reagent, whose effect depends on, and thus reveals, features of its adopted structure(s). Accordingly, single-reagent probing data is used to supplement free-energy models within computational methods, leading to significant gains in prediction accuracy. In practice, however, structural biologists integrate probing data produced in various experimental conditions, using different reagents or over a collection of mutated sequences, to model RNA structure(s). This integrative approach remains manual, time-consuming and arguably subjective in its modeling principles. In this Ph.D., we contributed in silico methods for an automated modeling of RNA structure(s) from multiple sources of probing data.We have first established automated pipelines for the acquisition of reactivity profiles from primary data produced through a variety of protocols (SHAPE, DMS using Capillary Electrophoresis, SHAPE-Map/Ion Torrent). We have designed and implemented a new, versatile, method that simultaneously integrates multiple probing profiles. Based on a combination of Boltzmann sampling and structural clustering, it produces alternative stable conformations jointly supported by a set of probing experiments. As it favors recurrent structures, our method allows exploiting the complementarity of several probing assays. The quality of predictions produced using our method compared favorably against state-of-the-art computational predictive methods on single-probing assays.Our method was used to identify models for structured regions in RNA viruses. In collaboration with experimental partners, we suggested a refined structure of the HIV-1 Gag IRES, showing a good compatibility with chemical and enzymatic probing data. The predicted structure allowed us to build hypotheses on binding sites that are functionally relevant to the translation. We also proposed conserved structures in Ebola Untranslated regions, showing a high consistency with both SHAPE probing and evolutionary data. Our modeling allows us to detect conserved and stable stem-loop at the 5’end of each UTR, a typical structure found in viral genomes to protect the RNA from being degraded by nucleases.Our method was extended to the analysis of sequence variants. We analyzed a collection of DMS probed mutants, produced by the Mutate-and-Map protocol, leading to better structural models for the GIR1 lariat-capping ribozyme than from the sole wild-type sequence. To avoid systematic production of point-wise mutants, and exploit the recent SHAPEMap protocol, we designed an experimental protocol based on undirected mutagenesis and sequencing, where several mutated RNAs are produced and simultaneously probed. Produced reads must then be re-assigned to mutants to establish their reactivity profiles used later for structure modeling. The assignment problem was modeled as a likelihood maximization joint inference of mutational profiles and assignments, and solved using an instance of the "Expectation-Maximization" algorithm. Preliminary results on a reduced/simulated sample of reads showed a remarkable decrease of the reads assignment errors compared to a classic algorithm.
|
104 |
Comparing stochastic discrete and deterministic continuum models of cell migrationYates, Christian January 2011 (has links)
Multiscale mathematical modelling is one of the major driving forces behind the systems biology revolution. The inherently interdisciplinary nature of its study and the multiple spatial and temporal scales which characterise its dynamics make cell migration an ideal candidate for a systems biology approach. Due to its ease of analysis and its compatibility with the type of data available, phenomenological continuum modelling has long been the default framework adopted by the cell migration modelling community. However, in recent years, with increased computational power, complex, discrete, cell-level models, able to capture the detailed dynamics of experimental systems, have become more prevalent. These two modelling paradigms have complementary advantages and disadvantages. The challenge now is to combine these two seemingly disparate modelling regimes in order to exploit the benefits offered by each in a comprehensive, multiscale equivalence framework for modelling cell migration. The main aim of this thesis is to begin with an on-lattice, individual-based model and derive a continuum, population-based model which is equivalent to it in certain limits. For simple models this is relatively easy to achieve: beginning with a one-dimensional, discrete model of cell migration on a regular lattice we derive a partial differential equation for the evolution of cell density on the same domain. We are also able to simply incorporate various signal sensing dynamics into our fledgling equivalence framework. However, as we begin to incorporate more complex model attributes such as cell proliferation/death, signalling dynamics and domain growth we find that deriving an equivalent continuum model requires some innovative mathematics. The same is true when considering a non-uniform domain discretisation in the one-dimensional model and when determining appropriate domain discretisations in higher dimensions. Higher-dimensional simulations of individual-based models bring with them their own computational challenges. Increased lattice sites in order to maintain spatial resolution and increased cell numbers in order to maintain consistent densities lead to dramatic reductions in simulation speeds. We consider a variety of methods to increase the efficiency of our simulations and derive novel acceleration techniques which can be applied to general reaction systems but are especially useful for our spatially extended cell migration algorithms. The incorporation of domain growth in higher dimensions is the final hurdle we clear on our way to constructing a complex discrete-continuum modelling framework capable of representing signal-mediated cell migration on growing (possibly non-standard) domains in multiple dimensions.
|
105 |
Recherche automatisée de motifs dans les arbres phylogénétiques / Automatic phylogenetic tree pattern matchingBigot, Thomas 05 June 2013 (has links)
La phylogénie permet de reconstituer l'histoire évolutive de séquences ainsi que des espèces qui les portent. Les récents progrès des méthodes de séquençage ont permis une inflation du nombre de séquences disponibles et donc du nombre d'arbres de gènes qu'il est possible de construire. La question qui se pose est alors d'optimiser la recherche d'informations dans ces arbres. Cette recherche doit être à la fois exhaustive et efficace. Pour ce faire, mon travail de thèse a consisté en l'écriture puis en l'utilisation d'un ensemble de programmes capables de parcourir et d'annoter les arbres phylogénétiques. Cet ensemble de programmes porte le nom de TPMS (Tree Pattern Matching Suite). Le premier de ces programmes (tpms_query) permet d'effectuer l'interrogation de collections à l'aide d'un formalisme dédie. Les possibilités qu'il offre sont : La détection de transferts horizontaux : Si un arbre de gènes présente une espèce branchée dans un arbre au milieu d'un groupe monophylétique d'espèces avec lesquelles elle n'est pas apparentée, on peut supposer qu'il s'agit d'un transfert horizontal, si ces organismes sont des procaryotes ou des eucaryotes unicellulaires. La détection d'orthologie : Si une partie d'un arbre de gènes correspond exactement à l'arbre des espèces, on peut alors supposer que ces gènes sont un ensemble de gènes d'orthologues. La validation de phylogénies connues : Quand l'arbre des espèces donne lieu à des débats, il peut est possible d'interroger une large collection d'arbres de gènes pour voir combien de familles de gènes correspondent à chaque hypothèse. Un autre programme, tpms_computations, permet d'effectuer des opérations en parallèle sur tous les arbres, et propose notamment l'enracinement automatique des arbres via différents critères, ainsi que l'extraction de sous arbres d'orthologues (séquence unique par espèce). Il propose aussi une méthode de détection automatique d'incongruences. La thèse présente le contexte, les différents algorithmes à la base de ces programmes, ainsi que plusieurs utilisations qui en ont été faites / Phylogeny allows to reconstruct evolutionnary history of sequences and species that carry them. Recent progress in sequencing methods produced a growing number of available sequences, and so of number of gene trees that one can build. One of the consecutive issues is to optimise the extraction of information from the trees. Such an extraction should be complete and efficient. To address this, my thesis consisted in writing and then using a suite of programs which aim to browse and annotate phylogenic trees. This program suite is named TPMS (Tree Pattern Matching Suite). It browses and annotates trees with several algorithms. The first of them, tpms_query consists in querying collections using a dedicated formalism. This allows to: Detect horizontal transfers If, in a gene tree, a species is nested in a monophyletic group of unrelated species, one can infer this is a horizontal transfer, if this organisms are prokaryotic (also concerning some unicellular eukaryotes). Orthology detection: if a part of a gene tree exactly matches to the species tree, one can suppose these genes are set of orthologues. Validating known phylogenies: when controversy exists concerning the species tree, it is possible to query a lange collection of gene trees to perform a count of families matching to each hypothesis. Another program allows to perform parallel operations on all the trees, such as automating rooting of trees via different criterions. It also allows an automatic detection of incongruencies. The thesis introduces the context, different algorithms which the programs are based on, and several using performed with it
|
106 |
Étude de l'évolution réductive des génomes bactériens par expériences d'évolution in silico et analyses bioinformatiques / Study of reductive genome evolution by in silico evolution experiments and bioinformatics analysisBatut, Bérénice 21 November 2014 (has links)
Selon une vision populaire, l’évolution serait un processus de « progrès » qui s’accompagnerait d’un accroissement de la complexité moléculaire des êtres vivants. Cependant, les programmes de séquençage des génomes ont révélé l’existence d’espèces dont les lignées ont, au contraire, subi une réduction massive de leur génome. Ainsi, chez les cyanobactéries Prochlorococcus et Pelagibacter ubique, certaines lignées ont subi une réduction de 30% de leur génome. Une telle évolution « à rebours », dite évolution réductive, avait déjà été observée pour des bactéries endosymbiotiques, pour lesquelles la sélection naturelle n’est pas assez efficace pour éliminer les mutations délétères comme les pertes de gènes. Cela vient notamment du fait que ces bactéries endosymbiotiques subissent, à chaque reproduction de leur hôte, une réduction drastique de leur taille de population. Cette explication semble peu plausible pour des cyanobactéries marines comme Prochlorococcus et Pelagibacter, qui ont un mode de vie libre et qui font partie des bactéries les plus abondantes des océans. D’autres hypothèses ont ainsi été proposées pour expliquer l’évolution réductive comme l’adaptation à un environnement stable et pauvre en nutriments, des forts taux de mutation, mais aucun de ces hypothèses ne semble capable d’expliquer toutes les caractéristiques génomiques observées. Dans cette thèse, nous nous intéressons au cas de l’évolution réductive chez Prochlorococcus, pour laquelle de nombreuses séquences et données sont disponibles. Deux approches sont utilisées pour cette étude : une analyse phylogénétique des génomes de Prochlorococcus, et une approche théorique de simulation où nous testons différents scénarios évolutifs pouvant conduire à une évolution réductive. La combinaison de ces deux approches permet finalement de proposer un scénario plausible pour expliquer l'évolution réductive chez Prochlorococcus. / Given a popular view, evolution is an incremental process based on an increase of molecular complexity of organisms. However, some organisms have undergo massive genome reduction like the endosymbionts. In this case the reduction can be explained by the Muller’s ratchet due to the endosymbiont lifestyle with small population and lack of recombination. However, in some marine bacteria, like Prochlorococcus et Pelagibacter, lineage have undergo up to 30% of genome reduction. Their lifestyle is almost the opposite to the one of the endosymbionts and reductive genome evolution can not be easily explicable by the Muller’s ratchet. Some other hypothesis has been proposed but none can explain all the observed genomic characteristics. In the thesis, I am interested in the reductive evolution of Prochlorococcus. I used two approaches: a theoretical one using simulation where different scenarios are tested and an analysis of Prochlorococcus genomes in a phylogenetic framework to determine the causes and characteristics of genome reduction. The combination of these two approaches allows to propose an hypothetical evolutive history for the reductive genome evolution of Prochlorococcus.
|
107 |
Modélisation des réponses calciques de réseaux d'astrocytes : Relations entre topologie et dynamiques / Modeling calcium responses in astrocyte networks : Relationships between topology and dynamicsLallouette, Jules 04 December 2014 (has links)
Pendant les 20 dernières années, les astrocytes, un type de cellules cérébrales ayant été jusque là relativement ignoré des neuroscientifiques, ont peu à peu gagné en notoriété grâce à de multiples découvertes. Contrairement aux neurones, ces cellules ne transmettent pas de signaux électriques mais communiquent par des changements intracellulaires de leurs concentrations en calcium. Des découvertes récentes semblent indiquer que, loin d'agir en autarcie, les astrocytes répondent à l'activité neuronale et sembleraient, bien que cela soit plus débattu, moduler la transmission synaptique par le relargage de molécules spécifiques appelées `gliotransmetteurs' (en référence aux neurotransmetteurs). Comme les neurones, les astrocytes forment des réseaux et communiquent leur activité calcique par diffusion d'un astrocyte à l'autre, formant ainsi de véritables vagues de calcium intercellulaires. Deux réseaux, de neuronnes et d'astrocytes, cohabitent ainsi dans le cerveau ; mais, alors que les réseaux de neuronnes ont fait l'objet de recherches expérimentales et théoriques, les réseaux d'astrocytes restent encore mal connus. Ainsi, il n'a été découvert que très récement que la topologie de ces réseaux pourrait s'averer plus complexe que la vision qui dominait jusqu'alors : celle d'un syncitium astrocytaire dépourvu de spécificités topologiques. Les travaux présentés dans cette thèse portent principalement sur l'effet que ces différentes topologies pourraient avoir sur la signalisation calcique astrocytaire. En effet, autant au niveau subcellulaire qu'inter-cellulaire, les mécanismes gouvernant l'activité calcique des astrocytes restent mals connus. Même dans le cas le plus documenté de la réponse somatique des astrocytes à une stimulation neuronale, les caractéristiques précises que la stimulation doit avoir pour évoquer une réponse des astrocytes sont inconnues. Il en est de même pour la transmission de vagues de calcium dans des réseaux d'astrocytes : on ignore encore les possibles effets de la complexité récemment documentée des réseaux d'astrocytes sur la propagation de ces vagues. Enfin, au niveau subcelulaire, les astrocytes possèdent une morphologie ramifiée extrèmement complexe qui possède elle-même une activité calcique. Les travaux présentés dans cette thèse utilisent des outils de modélisation et de simulation afin de déterminer les répercussions que l'organisation en réseaux des astrocytes pourrait avoir sur leurs dynamiques calciques. En résumé, nous proposons que la topologie des réseaux d'astrocytes a (1) des répercussion au niveau cellulaire, modulant la réponse des astrocytes à des stimulations neuronales ; (2) contrôle la propagation de vagues de calcium inter-astrocytaire en la favorisant lorsque les réseau sont peu couplés ; (3) joue un rôle important dans l’apparition de phénomènes de résonance stochastique. / Over the last 20 years, astrocytes, a hitherto under-investigated type of brain cells, have gradually rose to prominence owing to multiple experimental discoveries. In contrast with neurons, these cells do not propagate electrical signals but communicate instead through changes in their intracellular calcium concentration. Recent discoveries indicate that, far from being isolated cells, astrocytes respond to neuronal activity and, although this is still controversial, seem to modulate synaptic transmission through the release of `gliotransmitter' molecules (in reference to neurotransmitters). Like neurons, astrocyte are organized in networks and communicate their calcium activity by intercellular diffusion of second messengers, forming intercellular calcium waves. Two networks, one of neurons and the other of astrocytes, thus coexist in the brain; while neuronal networks have been the subject of intense experimental and theoretical investigations, astrocyte networks have been much less investigated. Notably, it was only discovered recently that astrocyte network topology could be more complex than what the hitherto dominant view held (astrocytes organized in a syncytium deprived of any topological specificities). The work presented in this thesis is mainly related to the effect that different network topologies could have on astrocyte calcium signaling. The mechanisms that drive calcium signaling in astrocytes are, at both subcellular and intercellular levels, still not completely understood. Even in the best documented case of astrocyte somatic response to neuronal stimulation, the precise characteristic required from the stimulation to elicit an astrocytic response are still unknown. Similarly, the mechanisms governing intercellular calcium wave propagation in astrocyte networks are not fully known; notably, the effects of the recently documented network heterogeneity on calcium wave propagation have not been investigated. Finally, at the subcellular level, astrocytes display an extremely ramified and complex morphology that also hosts calcium activity. The work presented in this thesis make use of modeling and simulation in order to determine the possible effects of astrocyte network organization on their calcium signaling. We propose that astrocyte network topology: (1) controls single-cell responses to neuronal stimulation; (2) drives the propagation of intercellular calcium waves by favoring it when networks are weakly coupled; (3) can determine the appearance of stochastic resonance phenomena; (4) can be modulated by neuronal activity.
|
108 |
Extraction et analyse du réseau acoustique d'oiseaux sociaux / Extraction and analysis of social birds' acoustic networkFernandez, Marie 09 April 2018 (has links)
Posséder des données fiables, à jour et précises sur les populations d’oiseaux peut se révéler central aux décisions de politique environnementale. La bioacoustique est un outil de suivi non invasif de populations animales et avantageux lorsque les méthodes d’observation ou les captures sont difficiles. De plus, il a été montré chez de nombreuses espèces que l'étude de la communication acoustique peut largement contribuer à comprendre la dynamique des interactions sociales au sein d'un groupe. Cependant, l'étude des interactions vocales peut se révéler difficile, notamment lorsque l'on souhaite s'intéresser à une échelle fine des échanges. C'est pourquoi la bioacoustique n’a que peu été utilisée pour la caractérisation de la structure sociale de populations. L'objectif de ce projet de thèse était le développement de techniques d’extraction de vocalisations individuelles au sein d'un groupe, ainsi que la modélisation de leur dynamique fine. Après avoir été développée, testée et validée, notre méthode a permis d'étudier le réseau acoustique chez une espèce d'oiseau social, le diamant mandarin, et d'explorer le lien entre réseau acoustique et réseau social. A travers plusieurs études, nous avons montré que la dynamique vocale d'un groupe dépend à la fois de la composition de ce groupe (sa taille, la présence de couples ou de juvéniles) et du contexte environnemental (sans perturbation, puis avec séparation visuelle ou présence d'un danger). Ainsi, avec le développement de méthodes d'extraction de réseau acoustique, ce projet contribue à la fois à la recherche fondamentale et appliquée dans ce domaine : en recherche fondamentale car l'étude de la dynamique des interactions vocales permet de mieux comprendre le réseau social, et en recherche appliquée pour le suivi de population.! / Bird populations represent a significant proportion of urban and rural biodiversity. For this purpose, the acquisition of reliable, updated and precise data on bird population can be a central factor for environmental decisions. The current classical techniques are difficult regarding human resources (banding, tracking, counting) and often invasive. Bioacoustics is a non-invasive tool for animal populations monitoring (density, migration paths...). Moreover, it has been shown in many species that the study of vocal exchanges can largely help to understand the social interactions occurring in a group. However, studying vocal exchanges can be difficult, especially when we want to assess fine scale interactions. For this reason bioacoustics have rarely been used to characterize groups’ social structure. The aim of this project was to develop techniques for the extraction of individual vocalizations in a group, and the modelling of their dynamics at a fine scale. After we developed, tested and validated our method, we used it to extract the acoustic network in a bird social species, the zebra finch, and investigate the link between acoustic and social network. Throughout different studies we showed that the group composition, more particularly its size, the presence of couples or the presence of juveniles can shape parts of the vocal dynamics. We also found that the environmental context (without any perturbation, then a context of separation for a couple, or predation in a group) can impact the vocal interactions dynamics. Thus, this project make contribution to both fundamental and applied research: in fundamental research by contributing to the study of vocal interactions dynamics to better understand the social network, and in applied research by contributing to define new standards for population monitoring.
|
109 |
Σχεδιασμός και υλοποίηση πολυκριτηριακής υβριδικής μεθόδου ταξινόμησης βιολογικών δεδομένων με χρήση εξελικτικών αλγορίθμων και νευρωνικών δικτύωνΣκρεπετός, Δημήτριος 09 October 2014 (has links)
Δύσκολα προβλήματα ταξινόμησης από τον χώρο της
Βιοπληροφορικής όπως η πρόβλεψη των microRNA γονιδιών και η πρόβλεψη των πρωτεϊνικών αλληλεπιδράσεων (Protein- Protein Interactions) απαιτούν ισχυρούς ταξινομητές οι οποίοι θα πρέπει να έχουν καλή ακρίβεια ταξινόμησης, να χειρίζονται ελλιπείς τιμές, να είναι ερμηνεύσιμοι, και να μην πάσχουν από το πρόβλημα ανισορροπίας κλάσεων. Ένας ευρέως χρησιμοποιούμενος ταξινομητής είναι τα νευρωνικά δίκτυα, τα οποία ωστόσο χρειάζονται προσδιορισμό της αρχιτεκτονικής τους και των λοιπών παραμέτρων τους, ενώ και οι αλγόριθμοι εκμάθησής τους συνήθως συγκλίνουν σε τοπικά ελάχιστα. Για τους λόγους αυτούς, προτείνεται μία πολυκριτηριακή εξελικτική μέθοδος η οποία βασίζεται στους εξελικτικούς αλγορίθμους ώστε να βελτιστοποιήσει πολλά από τα προαναφερθέντα κριτήρια απόδοσης των νευρωνικών δικτύων, να βρει επίσης την βέλτιση αρχιτεκτονική καθώς και ένα ολικό ελάχιστο για τα συναπτικά τους βάρη. Στην συνέχεια, από τον πληθυσμό που προκύπτει χρησιμοποιούμε το σύνολό του ώστε να επιτύχουμε την ταξινόμηση. / Hard classification problems of the area of Bioinformatics, like microRNA prediction and PPI prediction, demand powerful classifiers which must have good prediction accuracy, handle missing values, be interpretable, and not suffer from the class imbalance problem. One wide used classifier is neural networks, which need definition of their architecture and their other parameters, while their training algorithms usually converge to local minima. For those reasons, we suggest a multi-objective evolutionary method, which is based to evolutionary algorithms in order to optimise many of the aforementioned criteria of the performance of a neural network, and also find the optimised architecture and a global minimum for its weights. Then, from the ensuing population, we use it as an ensemble classifier in order to perform the classification.
|
110 |
Αλγόριθμοι διαχείρισης και ανάλυσης ακολουθιών βιολογικών δεδομένων με εφαρμογή σε προβλήματα βιοπληροφορικής / Algorithms for the analysis of biological sequences with application on bioinformatics problemsΠερδικούρη, Αικατερίνη 26 February 2009 (has links)
Αντικείμενο της παρούσας διδακτορικής διατριβής είναι η μελέτη και η σχεδίαση αποδοτικών αλγορίθμων για τη διαχείριση και ανάλυση ακολουθιών βιολογικών δεδομένων. Οι αλγόριθμοι που θα περιγράψουμε εφαρμόζονται σε προβλήματα Βιοπληροφορικής, όπως η αναγνώριση γνωστών ή άγνωστων μοτίβων του DNA και RNA, που εμπλέκονται σε ποικίλες βιολογικές διεργασίες καθώς και η ανακάλυψη περιοδικοτήτων.
Ειδικότερα οι αλγόριθμοι που θα παρουσιάσουμε χρησιμοποιούνται για την ανάλυση Βιολογικών Ακολουθιών με “αδιάφορους χαρακτήρες” και Βιολογικών Ακολουθιών με Βάρη. Οι Βιολογικές Ακολουθίες με “αδιάφορους χαρακτήρες” αναπαριστούν συνήθως οικογένειες πρωτεϊνών ενώ οι Βιολογικές Ακολουθίες με βάρη αναπαριστούν συναρμολογούμένες ακολουθίες γονιδιωμάτων που έχουν πρόσφατα αλληλουχηθεί.
Στις Βιολογικές Ακολουθίες με αδιάφορους χαρακτήρες παρουσιάζουμε δυο αποδοτικούς αλγορίθμους γραμμικού χρόνου για τον υπολογισμό της περιόδου και τον υπολογισμό του καλύμματος. Ο δεύτερος αλγόριθμος εφαρμόζεται και σε κυκλικά (circular DNAs).
Στις Βιολογικές Ακολουθίες με βάρη παρουσιάζουμε δυο αλγορίθμους για τον υπολογισμό των βασικών περιοδικοτήτων: της περιόδου και του καλύμματος ενώ επιλύουμε και το πρόβλημα της εύρεσης προτύπου. Η ανάγκη για αποδοτική διαχείριση βιολογικών ακολουθιών με βάρη μας ώθησε να εισάγουμε μια νέα αποδοτική δομή η οποία επιλύει αποδοτικά τα 2 προηγούμενα προβλήματα. Η δομή αυτή ονομάζεται Δέντρο Επιθεμάτων με Βάρη. Χρησιμοποιώντας το Δέντρο Επιθεμάτων με Βάρη επιλύουμε διάφορες παραλλαγές του προβλήματος εξαγωγής μοτίβων από Βιολογικές Ακολουθίες με Βάρη.
Τέλος αποφασίσαμε να μελετήσουμε τη χρήση των Γενετικών Αλγορίθμων και του Εξελικτικού Προγραμματισμού στην ανάλυση ακολουθιών βιολογικών δεδομένων. Αποτέλεσμα αυτής της μελέτης είναι η περιγραφή ενός γενετικού αλγορίθμου που υπολογίζει τις επαναλήψεις σε μια βιολογική ακολουθία. / The object of this doctoral thesis is the study and the design of efficient algorithms for the analysis of sequences of biological data. The algorithms that we describe have application on Bioinformatics problems, such as the recognition of known or unknown patterns in DNA and RNA that are involved in various biological activities, as well as the discovery of periodicities.
More specifically the algorithms that we present are used for the analysis of Biological Sequences with “don't care characters”' and Weighted Biological Sequences. Biological Sequences with “don't care characters”, usually represent protein families while Weighted Biological Sequences represent assembled sequences of genomes that they have been recently sequenced.
In Biological Sequences with “don't care characters”' we present two efficient algorithms of linear time for the computation of the period and the cover. The second algorithm is also applied in circular DNAs .
In Weighted Biological Sequences we present two algorithms for the computation of basic periodicities: the period and the cover, while we also solve the problem of pattern matching. The need for efficient management of biological sequences with weights prompted us to introduce a new efficient data structure which solves efficiently the two precedents problems. This structure is named Weighted Suffix Tree. Using the Weighted Suffix Tree we solve various instances of the motif discovery problem in Biological Weighted Sequences.
Finally we decided to study the use of Genetic Algorithms and Evolutionary Programming in the analysis of biological sequences. The result of this study is the description of a genetic algorithm that computes the repetitions in a biological sequence.
|
Page generated in 0.0394 seconds