Spelling suggestions: "subject:"conséquence génomique""
1 |
Utilisation des EST dans la génération d'une nouvelle ressource bioinformatique spécifique à la tolérance du blé au froidBelcaid, Mahdi January 2006 (has links) (PDF)
La bioinformatique constitue un outil de choix dans l'étude des plantes. Lorsqu'utilisées efficacement, la gestion ainsi que l'analyse informatique des données biologiques
permettent de réduire considérablement la durée des expériences ainsi que les coûts liés à la recherche tout en élargissant le spectre d'analyses pouvant être effectuées.
L'objectif de cette recherche est de définir un protocole efficace utilisant les outils actuels et mettant en oeuvre de nouvelles approches, dans le but de faire le prétraitement, le clustering et l'assemblage d'un ensemble d'EST. Ce mémoire traite des algorithmes et des techniques informatiques utilisés dans l'étude de l'expression différentielle à partir
des EST. Les particularités du projet de FGAS sont présentées et une attention particulière est portée sur la manière dont les résultats ont été analysés. À travers la classification en sous-groupes fonctionnels et de l'analyse différentielle digitale, l'identification des gènes potentiellement impliqués dans le phénomène d'acclimatation du blé au froid est effectuée. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Bioinformatique, Clustering, Assemblage, Expressed Sequence Tags, Tolérance au froid.
|
2 |
Identification et caractérisation de microARNs dans les ESTs du blé par des méthodes bioinformatiquesLeclercq, Mickaël 04 1900 (has links) (PDF)
Les microARNs sont de petits ARNs qui participent à la régulation de l'expression génique dans les organismes vivants. Depuis l'apparition des nouvelles techniques de séquençage à haut débit, leur identification et caractérisation dans les espèces animales et végétales font partie des défis actuels de la bioinformatique. Dans ce mémoire nous abordons ce problème en recherchant les microARNs exprimés chez le blé sous une dizaine de conditions environnementales différentes. Contrairement aux études antérieures similaires dans d'autres organismes, des difficultés additionnelles se sont ajoutées, associées à la partialité du génome du blé disponible, la multitude de conditions expérimentales et le peu de microARNs connus retrouvés par prédiction. Une nouvelle approche, employant une double validation par deux algorithmes de prédiction, a permis d'identifier plus de 3862 microARNs potentiels chez le blé ainsi que leurs gènes cibles. Parmi eux, 206 sont différentiellement exprimés entre les conditions expérimentales. Ces microARNs ont été répartis en 1222 familles en fonction des paramètres de leur similarité intra et intergroupe déduite des microARNs connus de mirBase. Pour minimiser le nombre de faux positifs, nous avons développé une méthode d'apprentissage machine (miRdup) pour valider la position des microARNs séquencés sur son pré-microARN en estimant plusieurs caractéristiques associées à ces petits ARNs. Ce dernier nous a permis d'établir 1016 microARNs avec un haut score de prédiction (502 familles). Pour chacun des microARNs prédits, en exploitant les données de leurs niveaux d'expression et l'identification des gènes ciblés, nous avons décrypté leurs rôles dans les différentes conditions expérimentales imposées au blé. Plusieurs microARNs sont en cours de validation expérimentale. Par ailleurs, pour faciliter l'implémentation de cette plateforme, nous avons intégré le pipeline de recherche conçu au cours de ce mémoire dans le logiciel Armadillo. Ce dernier permettra à l'avenir de faciliter la reproduction d'une telle étude chez d'autres plantes.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : microARNS, prédiction, séquençage haut débit, blé, apprentissage machine.
|
3 |
De l'intérêt des modèles grammaticaux pour la reconnaissance de motifs dans les séquences génomiques / Interest of grammatical models for pattern matching in genomic sequencesAntoine-Lorquin, Aymeric 01 December 2016 (has links)
Cette thèse en bioinformatique étudie l'intérêt de rechercher des motifs dans des séquences génomiques à l'aide de grammaires. Depuis les années 80, à l'initiative notamment de David Searls, des travaux ont montré qu'en théorie, des grammaires de haut niveau offrent suffisamment d'expressivité pour permettre la description de motifs biologiques complexes, notamment par le biais d'une nouvelle classe de grammaire dédiée à la biologie : les grammaires à variables de chaîne (SVG, String Variable Grammar). Ce formalisme a donné lieu à Logol, qui est un langage grammatical et un outil d'analyse développé dans l'équipe Dyliss où a lieu cette thèse. Logol est un langage conçu pour être suffisamment flexible pour se plier à une large gamme de motifs qu'il est possible de rencontrer en biologie. Le fait que les grammaires restent inutilisée pour la reconnaissance de motifs pose question. Le formalisme grammatical est-il vraiment pertinent pour modéliser des motifs biologiques ? Cette thèse tente de répondre à cette question à travers une démarche exploratoire. Ainsi, nous étudions la pertinence d'utiliser les modèles grammaticaux, via Logol, sur six applications différentes de reconnaissance de motifs sur des génomes. Au travers de la résolution concrète de problématiques biologiques, nous avons mis en évidence certaines caractéristiques des modèles grammaticaux. Une de leurs limites est que leur utilisation présente un coût en termes de performance. Un de leurs atouts est que leur expressivité couvre un large spectre des motifs biologiques, contrairement aux méthodes alternatives, et d'ailleurs certains motifs modélisés par les grammaires n'ont pas d'autres alternatives existantes. Il s'avère en particulier que pour certains motifs complexes, tels que ceux alliant séquence et structure, l'approche grammaticale est la plus adaptée. Pour finir, l'une des conclusions de cette thèse est qu'il n'y a pas réellement de compétition entre les différentes approches, mais plutôt qu'il y a tout à gagner d'une coopération fructueuse. / This thesis studies the interest to look for patterns in genomic sequences using grammars. Since the 80s, work has shown that, in theory, high level grammars offer enough expressivity to allow the description of complex biological patterns. In particular David Searls has proposed a new grammar dedicated to biology: string variable grammar (SVG). This formalism has resulted in Logol, a grammatical language and an analysis tool developed by Dyliss team where this thesis is taking place. Logol is a language designed to be flexible enough to express a wide range of biological patterns. The fact that the grammars remain unknown to model biological patterns raises questions. Is the grammatical formalism really relevant to the recognition of biological patterns? This thesis attempts to answer this question through an exploratory approach. We study the relevance of using the grammatical patterns, by using Logol on six different applications of genomic pattern matching. Through the practical resolution of biological problems, we have highlighted some features of grammatical patterns. First, the use of grammatical models presents a cost in terms of performance. Second the expressiveness of grammatical models covers a broad spectrum of biological patterns, unlike the others alternatives, and some patterns modeled by grammars have no other alternative solutions. It also turns out that for some complex patterns, such as those combining sequence and structure, the grammatical approach is the most suitable. Finally, a thesis conclusion is that there was no real competition between different approaches, but rather everything to gain from successful cooperation.
|
Page generated in 0.0779 seconds