Return to search

Contribution bioinformatique à l' analyse du transcriptome humain

Dans la première partie j'ai analysé des jeux de données de RNA-seq de transcriptome de petits ARNs disponibles dans les bases de données publiques. J'y ai observé 2 points intrigants : - une grande partie des lectures (bien que courtes) ne peux pas être alignée sur le génome de référence sans discordance et cette fraction non-alignable est parfois majoritaire. - de nombreuses lectures ont des tailles autours de 15-18nt qui ne correspondent à aucun type de petits ARNs connues, cette fraction est également majoritaires dans certains cas. Ces expériences sont souvent conçues pour la détection des miRNAs et l'analyse bioinformatique de ces données passent toujours par un alignement sur le génome de référence ou sur des séquences connues pour donner des petits ARNs. J'ai donc simplement éliminé la contrainte d'alignement dans l'analyse de ces données et effectué un regroupement des lectures par similarité (à la manière des ESTs). Ce regroupement donne une vision différente des données dans laquelle la notion de position génomique n'est plus centrale et ouvre la possibilité d'y découvrir des phénomènes non-standard. La deuxième partie est tirée d'une collaboration avec le laboratoire U675 INSERM. J'ai fait l'analyse bioinformatique des gènes dérégulés par la répression par RNAi du gène REST dans une lignée de neuroblastome de souris (N18). Ce gène est un facteur de transcription qui réprime les gènes neuronaux dans les cellules non neuronales. Ce répertoire de gènes dérégulés est potentiellement constitué de gènes clefs dans la biologie des neurones. / In first part of this thesis I have analysed small RNA-seq transcriptome data. I have noticed : - a large fraction of reads can't be aligned perfectly on reference genome - lot of reads are very short (15-18 nt) and don't match on previously known functionnal small RNAs. These experiments are designed for miRNA discovery and bioinformatics analysis of these data use alignments on genome or on known small RNA precursors sequences. I have eliminated the alignment and I have clustered these sequences. This clustering let me to observe these data with a new view in wich the genomic location is not central and open the gate to discover unconventional events. The second part is the analysis of deregulate genes by the silencing of the gene REST/NRSF in mouse N18 cell line. This gene is a transcription factor and it works as a repressor of neuronal genes in non neuronal cells. This deregulate genes repertoire potentially contains key genes in neuron biology. We found in this repertoire a network of genes centered on SWI/SNF complex including SMARCA2. This gene was associated to schizophrenia (SZ) in association studies and structural variation studies. In this network we found another genes associated to SZ. We show that these genes exhibit positive evolution in primate compare to rodents.

Identiferoai:union.ndltd.org:theses.fr/2012AIXM4002
Date25 January 2012
CreatorsLoe-mie, Yann
ContributorsAix-Marseille, Claverie, Jean-Michel
Source SetsDépôt national des thèses électroniques françaises
LanguageFrench, English
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.003 seconds