Global ETD Search

1	Intégration de données hétérogènes complexes à partir de tableaux de tailles déséquilibrées / Integrating heterogeneous complex data from unbalanced datasets Imbert, Alyssa 19 October 2018 (has links) Les avancées des nouvelles technologies de séquençage ont permis aux études cliniques de produire des données volumineuses et complexes. Cette complexité se décline selon diverses modalités, notamment la grande dimension, l’hétérogénéité des données au niveau biologique (acquises à différents niveaux de l’échelle du vivant et à divers moments de l’expérience), l’hétérogénéité du type de données, le bruit (hétérogénéité biologique ou données entachées d’erreurs) dans les données et la présence de données manquantes (au niveau d’une valeur ou d’un individu entier). L’intégration de différentes données est donc un défi important pour la biologie computationnelle. Cette thèse s’inscrit dans un projet de recherche clinique sur l’obésité, DiOGenes, pour lequel nous avons fait des propositions méthodologiques pour l’analyse et l’intégration de données. Ce projet est basé sur une intervention nutritionnelle menée dans huit pays européens et vise à analyser les effets de différents régimes sur le maintien pondéral et sur certains marqueurs de risque cardio-vasculaire et de diabète, chez des individus obèses. Dans le cadre de ce projet, mes travaux ont porté sur l’analyse de données transcriptomiques (RNA-Seq) avec des individus manquants et sur l’intégration de données transcriptomiques (nouvelle technique QuantSeq) avec des données cliniques. La première partie de cette thèse est consacrée aux données manquantes et à l’inférence de réseaux à partir de données d’expression RNA-Seq. Lors d’études longitudinales transcriptomiques, il arrive que certains individus ne soient pas observés à certains pas de temps, pour des raisons expérimentales. Nous proposons une méthode d’imputation multiple hot-deck (hd-MI) qui permet d’intégrer de l’information externe mesurée sur les mêmes individus et d’autres individus. hd-MI permet d’améliorer la qualité de l’inférence de réseau. La seconde partie porte sur une étude intégrative de données cliniques et transcriptomiques (mesurées par QuantSeq) basée sur une approche réseau. Nous y montrons l’intérêt de cette nouvelle technique pour l’acquisition de données transcriptomiques et l’analysons par une approche d’inférence de réseau en lien avec des données cliniques d’intérêt. / The development of high-throughput sequencing technologies has lead to a massive acquisition of high dimensional and complex datasets. Different features make these datasets hard to analyze : high dimensionality, heterogeneity at the biological level or at the data type level, the noise in data (due to biological heterogeneity or to errors in data) and the presence of missing data (for given values or for an entire individual). The integration of various data is thus an important challenge for computational biology. This thesis is part of a large clinical research project on obesity, DiOGenes, in which we have developed methods for data analysis and integration. The project is based on a dietary intervention that was led in eight Europeans centers. This study investigated the effect of macronutrient composition on weight-loss maintenance and metabolic and cardiovascular risk factors after a phase of calorie restriction in obese individuals. My work have mainly focused on transcriptomic data analysis (RNA-Seq) with missing individuals and data integration of transcriptomic (new QuantSeq protocol) and clinic datasets. The first part is focused on missing data and network inference from RNA-Seq datasets. During longitudinal study, some observations are missing for some time step. In order to take advantage of external information measured simultaneously to RNA-Seq data, we propose an imputation method, hot-deck multiple imputation (hd-MI), that improves the reliability of network inference. The second part deals with an integrative study of clinical data and transcriptomic data, measured by QuantSeq, based on a network approach. The new protocol is shown efficient for transcriptome measurement. We proposed an analysis based on network inference that is linked to clinical variables of interest. Analyse de données transcriptomiques Imputation multiple hot-deck
2	Bioinformatics tools for the systems biology of dysferlin deficiency / Outils de bioinformatique pour la biologie des systèmes de la déficience en dysferline Malatras, Apostolos 13 December 2017 (has links) Le but de mon projet est de créer et d’appliquer des outils pour l’analyse de la biologie des systèmes musculaires en utilisant différentes données OMICS. Ce projet s’intéresse plus particulièrement à la dysferlinopathie due la déficience d’une protéine appelée dysferline qui est exprimée principalement dans les muscles squelettiques et cardiaque. La perte du dysferline due à la mutation (autosomique-récessive) du gène DYSF entraîne une dystrophie musculaire progressive (LGMD2B, MM, DMAT). Nous avons déjà développé des outils bio-informatiques qui peuvent être utilisés pour l’analyse fonctionnelle de données OMICS, relative à la dyspherlinopathie. Ces derniers incluent le test dit «gene set enrichment analysis», test comparant les profils OMICS d’intérêts aux données OMICS musculaires préalablement publiées ; et l’analyse des réseaux impliquant les diffèrent(e)s protéines et transcrits entre eux/elles. Ainsi, nous avons analysé des centaines de données omiques publiées provenant d’archives publiques. Les outils informatiques que nous avons développés sont CellWhere et MyoMiner. CellWhere est un outil facile à utiliser, permettant de visualiser sur un graphe interactif à la fois les interactions protéine-protéine et la localisation subcellulaire des protéines. Myominer est une base de données spécialisée dans le tissu et les cellules musculaires, et qui fournit une analyse de co-expression, aussi bien dans les tissus sains que pathologiques. Ces outils seront utilisés dans l'analyse et l'interprétation de données transcriptomiques pour les dyspherlinopathies mais également les autres pathologies neuromusculaires. / The aim of this project was to build and apply tools for the analysis of muscle omics data, with a focus on Dysferlin deficiency. This protein is expressed mainly in skeletal and cardiac muscles, and its loss due to mutation (autosomal-recessive) of the DYSF gene, results in a progressive muscular dystrophy (Limb Girdle Muscular Dystrophy type 2B (LGMD2B), Miyoshi myopathy and distal myopathy with tibialis anterior onset (DMAT)). We have developed various tools and pipelines that can be applied towards a bioinformatics functional analysis of omics data in muscular dystrophies and neuromuscular disorders. These include: tests for enrichment of gene sets derived from previously published muscle microarray data and networking analysis of functional associations between altered transcripts/proteins. To accomplish this, we analyzed hundreds of published omics data from public repositories. The tools we developed are called CellWhere and MyoMiner. CellWhere is a user-friendly tool that combines protein-protein interactions and protein subcellular localizations on an interactive graphical display (https://cellwhere-myo.rhcloud.com). MyoMiner is a muscle cell- and tissue-specific database that provides co-expression analyses in both normal and pathological tissues. Many gene co-expression databases already exist and are used broadly by researchers, but MyoMiner is the first muscle-specific tool of its kind (https://myominer-myo.rhcloud.com). These tools will be used in the analysis and interpretation of transcriptomics data from dysferlinopathic muscle and other neuromuscular conditions and will be important to understand the molecular mechanisms underlying these pathologies. Bioinformatique Dyspherlinopathie Omics Co-expression Micropuces Transcriptomiques Transcriptomics Microarrays Bioinformatics 570.15
3	Développement d'outils statistiques pour l'analyse de données transcriptomiques par les réseaux de co-expression de gènes / A systemic approach to statistical analysis to transcriptomic data through co-expression network analysis Brunet, Anne-Claire 17 June 2016 (has links) Les nouvelles biotechnologies offrent aujourd'hui la possibilité de récolter une très grande variété et quantité de données biologiques (génomique, protéomique, métagénomique...), ouvrant ainsi de nouvelles perspectives de recherche pour la compréhension des processus biologiques. Dans cette thèse, nous nous sommes plus spécifiquement intéressés aux données transcriptomiques, celles-ci caractérisant l'activité ou le niveau d'expression de plusieurs dizaines de milliers de gènes dans une cellule donnée. L'objectif était alors de proposer des outils statistiques adaptés pour analyser ce type de données qui pose des problèmes de "grande dimension" (n<<p), car collectées sur des échantillons de tailles très limitées au regard du très grand nombre de variables (ici l'expression des gènes).La première partie de la thèse est consacrée à la présentation de méthodes d'apprentissage supervisé, telles que les forêts aléatoires de Breiman et les modèles de régressions pénalisées, utilisées dans le contexte de la grande dimension pour sélectionner les gènes (variables d'expression) qui sont les plus pertinents pour l'étude de la pathologie d'intérêt. Nous évoquons les limites de ces méthodes pour la sélection de gènes qui soient pertinents, non pas uniquement pour des considérations d'ordre statistique, mais qui le soient également sur le plan biologique, et notamment pour les sélections au sein des groupes de variables fortement corrélées, c'est à dire au sein des groupes de gènes co-exprimés. Les méthodes d'apprentissage classiques considèrent que chaque gène peut avoir une action isolée dans le modèle, ce qui est en pratique peu réaliste. Un caractère biologique observable est la résultante d'un ensemble de réactions au sein d'un système complexe faisant interagir les gènes les uns avec les autres, et les gènes impliqués dans une même fonction biologique ont tendance à être co-exprimés (expression corrélée). Ainsi, dans une deuxième partie, nous nous intéressons aux réseaux de co-expression de gènes sur lesquels deux gènes sont reliés si ils sont co-exprimés. Plus précisément, nous cherchons à mettre en évidence des communautés de gènes sur ces réseaux, c'est à dire des groupes de gènes co-exprimés, puis à sélectionner les communautés les plus pertinentes pour l'étude de la pathologie, ainsi que les "gènes clés" de ces communautés. Cela favorise les interprétations biologiques, car il est souvent possible d'associer une fonction biologique à une communauté de gènes. Nous proposons une approche originale et efficace permettant de traiter simultanément la problématique de la modélisation du réseau de co-expression de gènes et celle de la détection des communautés de gènes sur le réseau. Nous mettons en avant les performances de notre approche en la comparant à des méthodes existantes et populaires pour l'analyse des réseaux de co-expression de gènes (WGCNA et méthodes spectrales). Enfin, par l'analyse d'un jeu de données réelles, nous montrons dans la dernière partie de la thèse que l'approche que nous proposons permet d'obtenir des résultats convaincants sur le plan biologique, plus propices aux interprétations et plus robustes que ceux obtenus avec les méthodes d'apprentissage supervisé classiques. / Today's, new biotechnologies offer the opportunity to collect a large variety and volume of biological data (genomic, proteomic, metagenomic...), thus opening up new avenues for research into biological processes. In this thesis, what we are specifically interested is the transcriptomic data indicative of the activity or expression level of several thousands of genes in a given cell. The aim of this thesis was to propose proper statistical tools to analyse these high dimensional data (n<<p) collected from small samples with regard to the very large number of variables (gene expression variables). The first part of the thesis is devoted to a description of some supervised learning methods, such as random forest and penalized regression models. The following methods can be used for selecting the most relevant disease-related genes. However, the statistical relevance of the selections doesn't determine the biological relevance, and particularly when genes are selected within a group of highly correlated variables or co-expressed genes. Common supervised learning methods consider that every gene can have an isolated action in the model which is not so much realistic. An observable biological phenomenum is the result of a set of reactions inside a complex system which makes genes interact with each other, and genes that have a common biological function tend to be co-expressed (correlation between expression variables). Then, in a second part, we are interested in gene co-expression networks, where genes are linked if they are co-expressed. More precisely, we aim to identify communities of co-expressed genes, and then to select the most relevant disease-related communities as well as the "key-genes" of these communities. It leads to a variety of biological interpretations, because a community of co-expressed genes is often associated with a specific biological function. We propose an original and efficient approach that permits to treat simultaneously the problem of modeling the gene co-expression network and the problem of detecting the communities in network. We put forward the performances of our approach by comparing it to the existing methods that are popular for analysing gene co-expression networks (WGCNA and spectral approaches). The last part presents the results produced by applying our proposed approach on a real-world data set. We obtain convincing and robust results that help us make more diverse biological interpretations than with results produced by common supervised learning methods. Données transcriptomiques Réseaux de gènes Transcriptomic data Co-expression network Variable selection Dimensionality reduction Penalized regression Network clustering Machine learning
4	Caractérisation des cancers de vessie par l’analyse intégrative des données de puces exons / Bladder cancer characterisation by an integrative exon array data analysis Kamoun, Aurélie 06 March 2013 (has links) Les rapides progrès technologiques en matière de techniques de biologie à grande échelle, comprenant notamment les microarrays, conduisent en 2006 au développement d’une nouvelle génération de puces à très haute résolution, capables de cibler à la fois tous les gènes du transcriptome humain, mais également tous les exons de ces gènes pris individuellement. L’avènement de cette puce, communément appelée puce exon, permit d’obtenir une mesure précise des changements transcriptomiques affectant les cellules cancéreuses, en offrant la possibilité de prendre en compte l’expression relative de différents exons d’un même gène.L’épissage alternatif et la transcription alternative sont les deux principaux mécanismes biologiques à l’origine de l’existence de plusieurs transcrits pour un même gène. Ces processus biologiques ont été mis en évidence depuis longtemps mais leur régulation dans les cellules normales ainsi que leurs dérégulations dans les cancers sont encore mal caractérisées de par la complexité des mécanismes impliqués. Par leur design, les puces exons permettent de mettre en évidence la présence de variations d’expression entre plusieurs transcrits potentiels d’un même gène, ouvrant ainsi la voie à une meilleure compréhension de ces processus biologiques.A partir d’un important jeu de données d’échantillons de cancers de la vessie dont le profil transcriptomique fut obtenu par puces exons, nous nous sommes intéressés à l’étude des changements d’épissage alternatif et à l’utilisation de promoteurs alternatifs dans les tumeurs de vessie. L’utilisation d’outils statistiques et mathématiques dédiés à l’analyse de ces puces nous a permis dans un premier temps d’identifier de nombreux gènes dont l’expression relative des différents transcrits est spécifiquement dérégulée dans les tumeurs de vessie. Ces transcrits constituent une nouvelle source pour l’identification de cibles thérapeutiques spécifiques des tumeurs. Nous avons pu montrer qu’avec une approche ciblée sur les changements d’expression relative de transcrits alternatifs d’un même gène, il était possible de constituer un panel de potentiels marqueurs tumoraux permettant le développement de nouveaux tests urinaires utiles à la détection des cancers de vessie et à la surveillance des patients.Par une analyse non supervisée des profils d’exons potentiellement dérégulés, nous avons pu observer une stratification des tumeurs similaire à celle observée par l’étude des profils géniques issus de puces classiques, confirmant alors l’existence d’un sous groupe de tumeurs de vessie présentant des caractéristiques transcriptomiques propres. Nous avons pu associer à ce sous-groupe de mauvais pronostic, une signature d’inclusion différentielle de certains exons. Cette signature impliquant 19 gènes permet d’identifier précisément ces tumeurs de manière très spécifique et constitue par conséquent un outil puissant utilisable en clinique.L’étude ciblée d’une voie de signalisation fréquemment dérégulée dans les cancers nous a permis de mettre en évidence une dérégulation globale de l’expression relative des transcrits alternatifs de gènes impliqués dans la prolifération cellulaire, et d’en identifier de probables régulateurs. Enfin, L’analyse des données de puces exons à la lumière des données de méthylation de l’ADN nous a permis d’identifier un mécanisme épigénétique régulant l’utilisation de promoteurs alternatifs dans un sous-groupe de tumeurs de vessie.L’ensemble des résultats obtenus par l’analyse de ces puces exons a par conséquent permis de caractériser à l’échelle du transcrit les dérégulations spécifiques des tumeurs de vessie, et d’en identifier certains mécanismes. Ces dérégulations permettent non seulement d’identifier spécifiquement plusieurs sous-groupe de tumeurs dont un de mauvais pronostic, mais offrent également de nouvelles possibilités quant-à la recherche de marqueurs urinaires pour la surveillance des patients. / The development of microarray technology in the late 1990’s served as an essential tool to comprehend the scope of transcriptomic deregulations occurring in cancer cells. Signals generated from the first generation of transcriptomic microarrays gave simultaneous measures of expression from a large number of genes, therefore enabling to identify candidate genes involved in cancer progression and putative therapeutic targets. In 2006, through a fast de- velopment of high-throughput technologies, the available large scale analysis tools became enriched with a new generation of high resolution microarrays measuring expression signals both at the gene-level and at the exon-level of each gene. The advent of this high-resolution microarray, commonly called exon array, provided the opportunity to get a more accurate meas- ure of transcriptomic changes affecting cancer cells by enabling to consider relative expression changes of the exons from a same gene.Alternative splicing and alternative transcription are the two main biological mechanisms accounting for the production of several transcripts from a same gene. Although these bio- logical processes have been known for a long time, their regulation in normal cells and their deregulation in cancer still remain challenging to well-characterize, mainly due to the complex- ity of the involved mechanisms. Through their design, exon arrays enable to identify variable expression patterns within several potential transcripts of a same gene, therefore bringing new insight into these biological processes.Based on a large dataset of bladder cancer samples that were profiled on exon arrays, we focused on the study of alternative splicing changes and alternative promoter usage in bladder tumours. Analysis of these exon arrays through the use of adapted statistical and mathemat- ical tools initially resulted in the identification of numerous genes showing differential relative expression patterns of their transcripts between cancer and normal samples. These transcripts represent a new opportunity to define tumour-specific therapeutic targets. We demonstrated that using an approach targeted on relative expression changes of transcripts from a same gene, it was possible to build up a panel of potential tumour-specific markers enabling the development of new urinary test to detect bladder cancer and monitor its evolution.Through an unsupervised analysis of putatively deregulated exon profiles, we observed that the partitioning of bladder tumours was similar to the classification resulting from the study of classical gene microarray expression profiles, consequently confirming the existence of a bladder subgroup with peculiar transcriptomic properties. For this subgroup of bad prognosis, we established a signature based on the differential alternative inclusion of several exons. This signature relates to 19 genes and enables to accurately identify tumours from this subgroup, therefore providing a powerful tool to be used in clinical practice.By studying a specific pathway often deregulated in cancer, we highlighted an overall dereg- ulation of the relative expression of alternative transcripts from genes involved in cell prolifer- ation, and identified potential actors involved in the underlying regulatory process. Eventually, the analysis of exon arrays in the light of DNA methylation array data enabled us to identify an epigenetic mechanism regulating the use of alternative promoters in a subgroup of bladder tumours.Together, the results obtained from exon array analysis consequently provided a character- ization at the transcript level of bladder tumour specific deregulations and brought insight into the underlying mechanisms. The highlighted deregulations not only allow to accurately identify two subgroups of tumours, of which one has a bad prognosis, but also offer new possibilities regarding the definition of urinary markers for patient monitoring. Puces exons Epissage alternatif Promoteurs alternatifs Methylation de l’ADN Signatures transcriptomiques Marqueurs urinaires Cancer de la vessie Exon arrays Alternative splicing Alternative promoters DNA methylation Transcriptomic signature Urinary markers Bladder cancer
5	Stochastic modelling using large data sets : applications in ecology and genetics / Modélisation stochastique de grands jeux de données : applications en écologie et en génétique Coudret, Raphaël 16 September 2013 (has links) Deux parties principales composent cette thèse. La première d'entre elles est consacrée à la valvométrie, c'est-à-dire ici l'étude de la distance entre les deux parties de la coquille d'une huître au cours du temps. La valvométrie est utilisée afin de déterminer si de tels animaux sont en bonne santé, pour éventuellement tirer des conclusions sur la qualité de leur environnement. Nous considérons qu'un processus de renouvellement à quatre états sous-tend le comportement des huîtres étudiées. Afin de retrouver ce processus caché dans le signal valvométrique, nous supposons qu'une densité de probabilité reliée à ce signal est bimodale. Nous comparons donc plusieurs estimateurs qui prennent en compte ce type d'hypothèse, dont des estimateurs à noyau.Dans un second temps, nous comparons plusieurs méthodes de régression, dans le but d'analyser des données transcriptomiques. Pour comprendre quelles variables explicatives influent sur l'expression de gènes, nous avons réalisé des tests multiples grâce au modèle linéaire FAMT. La méthode SIR peut être envisagée pour trouver des relations non-linéaires. Toutefois, elle est principalement employée lorsque la variable à expliquer est univariée. Une version multivariée de cette approche a donc été développée. Le coût d'acquisition des données transcriptomiques pouvant être élevé, la taille n des échantillons correspondants est souvent faible. C'est pourquoi, nous avons également étudié la méthode SIR lorsque n est inférieur au nombre de variables explicatives p. / There are two main parts in this thesis. The first one concerns valvometry, which is here the study of the distance between both parts of the shell of an oyster, over time. The health status of oysters can be characterized using valvometry in order to obtain insights about the quality of their environment. We consider that a renewal process with four states underlies the behaviour of the studied oysters. Such a hidden process can be retrieved from a valvometric signal by assuming that some probability density function linked with this signal, is bimodal. We then compare several estimators which take this assumption into account, including kernel density estimators.In another chapter, we compare several regression approaches, aiming at analysing transcriptomic data. To understand which explanatory variables have an effect on gene expressions, we apply a multiple testing procedure on these data, through the linear model FAMT. The SIR method may find nonlinear relations in such a context. It is however more commonly used when the response variable is univariate. A multivariate version of SIR was then developed. Procedures to measure gene expressions can be expensive. The sample size n of the corresponding datasets is then often small. That is why we also studied SIR when n is less than the number of explanatory variables p. Données transcriptomiques Estimateur à noyau Processus de renouvellement Régression inverse par tranches Tests multiples Valvométrie Kernel density estimator Multiple testing Renewal process Sliced inverse regression Transcriptomics Valvometry
6	Understanding the impact of engineered nanoparticles Gammarus sp. as a valuable non-vertebrate model? / Compréhension de l'impact des nanoparticules manufacturées : intérêt du gammare comme modèle invertébrés ? Mehennaoui, Kahina 20 December 2017 (has links) La toxicité potentielle des nanomatériaux présente un intérêt sociétal et scientifique élevé en raison de la promesse d'innovations pour de nombreuses applications techniques. Cependant, elle n’est pas forcément liée à la taille réelle, à la masse, à la surface des nanoparticules (NP) ou à leurs agglomérats. La toxicité des NPs pourrait être fortement influencée par d'autres propriétés inhérentes et encore incomprises telles que le relargage d’ions, de la particule elle-même, sa surface, ou des molécules adhérentes à la surface, qui interfèreraient avec l'absorption cellulaires des NPs. Le projet « NANOGAM» étroitement lié au projet « FNR CORE2012 NANION », vise à définir certains processus et facteurs impliqués dans l'absorption des NPs et leur toxicité. Une telle compréhension est une condition préalable au développement des nanomatériaux, fondement de la philosophie « safer-by-design ». Les objectifs de ce projet de thèse sont multiples. En tenant compte des caractéristiques des principaux paramètres physico-chimiques tels que la taille et l’aspect de la surface, l’étude a porté sur l'absorption de NPs d'argent et d'or, et leurs effets biologiques via une approche multi-biomarqueurs (mortalité, effets comportementaux, effets physiologiques, effets transcriptomiques, etc.) sur une espèce sensible, Gammarus fossarum (Crustacea Amphipoda). Le but de cette investigation est de comprendre si la toxicité des nanomatériaux est inhérente aux propriétés intrinsèques des NPs ou plutôt aux ions relargués, ce qui contribuera à la prédiction de la toxicité des NPs en rapport avec leurs propriétés physico-chimiques et ce afin de limiter le nombre d’essais répétitifs sur de nouveaux nanomatériaux. G. fossarum ont été exposés à de faibles concentrations d'AgNPs et AuNPs pendant 72h à jeun et 15 jours nourris. Les résultats obtenus ont montré que (i) la nature de l’enrobage de surface est le principal facteur responsable de l'absorption d'AgNPs et d'AuNPs par G. fossarum ; (ii) les ions libérés et les NPs elles-mêmes jouent un rôle dans la toxicité des AgNPs et AuNPs étudiées ; (iii) la composition chimique des NPs a conduit à des effets différents aux niveaux sub-individuels (transcriptomique), ainsi qu’à une distribution différente dans les tissues selon la nature métallique de la NP. Les AgNPs ont été localisées dans les branchies de G. fossarum tandis que les AuNPs ont été observées dans les caeca intestinaux. Cette étude a également révélé que Gammarus sp. est un excellent modèle pour l'étude de la toxicité et des effets des AgNPs et des AuNPs / The potential toxicity of nanomaterials is of high societal and scientific interest due to the promise of ground-breaking innovations for many technical applications. However, toxicity can often not be related to the actual size, mass or surface area of the single nanoparticles (NPs) or the NP agglomerates. Therefore, it can be proposed that the toxicity is greatly influenced by other inherent and non-understood properties of the particles to which ions dissolving from the particle, surface or molecules adhering to the surface interfering with the uptake of NPs into cells, may have important contributions. The PhD project “NANOGAM”, closely linked up to CORE2012 NANION project that aims to obtain knowledge to understand some of the processes and factors involved in NP uptake and toxicity as such understanding is a prerequisite for the development of nanomaterials following the safer-by-design philosophy. This PhD project aims to investigate, based on known characteristics of the key physico-chemical parameters; as size and surface functionalities, of a well-chosen list of silver and gold NPs, the uptake, and dependent biological effects of different complexity (mortality, behavioural effects, physiological effects, transcriptomic effects, etc.), on a sensitive species; Gammarus fossarum (Crustacea Amphipoda), in order to understand to which extent toxicity of nanomaterials is due to intrinsic material properties or ion leaching. Such understanding will contribute to the prediction of toxicity based on material properties rather than repetitive testing of an indefinite number of new nanomaterials. G. fossarum were exposed at low concentrations of AgNPs and AuNPs for 72h or 15 days in presence or absence of food. The obtained results showed that (i) surface coating is the main factor governing AgNPs and AuNPs uptake by G. fossarum, (ii) both released ions and NPs themselves play a role in the potency of the studied AgNPs and AuNPs and (iii) chemical composition led to different effects at the sub-individual levels (target genes expression) and different tissue distribution as AgNPs were found in G. fossarum gills while AuNPs were found in the intestinal caeca. Additionally, this work shows that Gammarus sp. are valuable models for the study of the effects of AgNPs and AuNPs Gammarus sp. Nanoparticules d’argent Nanoparticules d’or Relargage d’ions Approche multi-biomarqueurs Transcriptomiques Gammarus sp. Silver nanoparticles Gold nanoparticles Ions release Multi-biomarker approach Transcriptomic 571.95
7	Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous : application au cancer colorectal / Using domain knowledge in the Transcriptomic analysis : Semantic similarity, functional classification and fuzzy profiles. Application to colorectal cancer Benabderrahmane, Sidahmed 15 December 2011 (has links) L'analyse bioinformatique des données de transcriptomique a pour but d'identifier les gènes qui présentent des variations d'expression entre différentes situations, par exemple entre des échantillons de tissu sain et de tissu malade et de caractériser ces gènes à partir de leurs annotations fonctionnelles. Dans ce travail de thèse, je propose quatre contributions pour la prise en compte des connaissances du domaine dans ces méthodes. Tout d'abord je définis une nouvelle mesure de similarité sémantique et fonctionnelle (IntelliGO) entre les gènes, qui exploite au mieux les annotations fonctionnelles issues de l'ontologie GO ('Gene Ontology'). Je montre ensuite, grâce à une méthodologie d'évaluation rigoureuse, que la mesure IntelliGO est performante pour la classification fonctionnelle des gènes. En troisième contribution je propose une approche différentielle avec affectation floue pour la construction de profils d'expression différentielle (PED). Je définis alors un algorithme d'analyse de recouvrement entre classes fonctionnelles et ensemble des références, ici les PEDs, pour mettre en évidence des gènes ayant à la fois les mêmes variations d'expression et des annotations fonctionnelles similaires. Cette méthode est appliquée à des données expérimentales produites à partir d'échantillons de tissus sains, de tumeur colo-rectale et de lignée cellulaire cancéreuse. Finalement, la mesure de similarité IntelliGO est généralisée à d'autres vocabulaires structurés en graphe acyclique dirigé et enraciné (rDAG) comme l'est l'ontologie GO, avec un exemple d'application concernant la réduction sémantique d'attributs avant la fouille. / Bioinformatic analyses of transcriptomic data aims to identify genes with variations in their expression level in different tissue samples, for example tissues from healthy versus seek patients, and to characterize these genes on the basis of their functional annotation. In this thesis, I present four contributions for taking into account domain knowledge in these methods. Firstly, I define a new semantic and functional similarity measure which optimally exploits functional annotations from Gene Ontology (GO). Then, I show, thanks to a rigorous evaluation method, that this measure is efficient for the functional classification of genes. In the third contribution, I propose a differential approach with fuzzy assignment for building differential expression profiles (DEPs). I define an algorithm for analyzing overlaps between functional clusters and reference sets such as DEPs here, in order to point out genes that have both similar functional annotation and similar variations in expression. This method is applied to experimental data produced from samples of healthy tissue, colorectal tumor and cancerous cultured cell line. Finally the similarity measure IntelliGO is generalized to another structured vocabulary organized as GO as a rooted directed acyclic graph, with an application concerning the semantic reduction of attributes before mining. Expression génique Transcriptome Exploration de données Analyse de données symboliques Syndrome de Lynch Données transcriptomiques Cancer colorectal Ontologie GO Mesure de similarité sémantique Graphe acyclique dirigé enraciné Classification fonctionnelle de gènes Profils d'expression Réduction d'attributs 572.865 570.285 005.74
8	Evaluation de la réponse cellulaire et moléculaire d'une diatomée benthique d'eau douce à l'exposition à des nanoparticules carbonées / Assessment of the cellular and molecular response of a benthic freshwater diatom exposed to carbon-based nanoparticles Garacci, Marion 16 November 2018 (has links) Différentes approches ont été utilisées pour évaluer les effets de deux formes de nanoparticules de carbone (NPC), nanotubes et graphène, afin de comprendre les mécanismes de la réponse générée par la diatomée benthique d'eau douce Nitzschia palea. Les effets à l'échelle de la communauté ont démontré un impact temporaire sur la croissance du biofilm et une accumulation des NPC dans la matrice extracellulaire. L'application d'une étude transcriptomique a mis en évidence l'importance de l'interaction physique, à l'origine d'altération du frustule, dans la mise en place de cette réponse extracellulaire se traduisant par une surproduction des substances exo-polymériques (EPS). Cette approche a également révélé l'impact des NPC sur l'activité photosynthétique des diatomées et une modification du métabolisme énergétique, suggérant une allocation énergétique en faveur de la production d'EPS. L'étude du protéome extracellulaire a permis d'avoir un premier aperçu de la composition de la matrice extracellulaire, principalement constituée de protéines à caractère hydrophobe. Lors de l'exposition aux NPC, les diatomées semblent produire un système adhésif complexe permettant de renforcer la matrice extracellulaire et d'augmenter la stabilité du biofilm tout en piégeant les NPC. L'exposition des diatomées face au deux formes de NPC induit une réponse présentant une forte similitude notamment pour les plus fortes concentrations testées. / Different approaches were used to assess the effect of two forms of carbon-based nanoparticles (CNP) nanotubes and graphene, in order to determine the mechanism of the response generated by the benthic freshwater diatom Nitzschia palea. The effect at the cellular community scale demonstrated a temporary impact on biofilm growth and an accumulation of NPC in the extracellular matrix. The use of transcriptomic study evidenced the role of the physic interaction, causing alteration of the frustule, in the extracellular response leading to an overexcretion of exopolymeric substances (EPS). This approach also revealed the impact of NPC on the photosynthetic activity of diatoms and a modification of the energetic metabolism suggesting an energetic allocation for the EPS production. The study of the extracellular proteome allowed to have a first insight of the extracellular matrix composition, in majority composed of hydrophobic-like proteins. In NPC exposure, diatoms seemed to produce an adhesive system allowing to strengthen the extracellular matrix and increase the biofilm stability while trapping NPC. The exposition of diatoms to the two NPC forms induce a response greatly similar for the highest tested concentration. Allotropes du carbone Nanotube de carbone Graphène Diatomée Biofilm Transcriptomiques Protéomiques Effet d'ombrage Matrice extracellulaire Allocation énergétique Carbon allotrops Carbon nanotubes Graphene Diatom Biofilm Transcriptomic Proteomic Shading effect Extracellular matrix Energetic allocation
9	Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal. Benabderrahmane, Sidahmed 15 December 2011 (has links) (PDF) L'analyse bioinformatique des données de transcriptomique a pour but d'identifier les gènes qui présentent des variations d'expression entre différentes situations, par exemple entre des échantillons de tissu sain et de tissu malade et de caractériser ces gènes à partir de leurs annotations fonctionnelles. Dans ce travail de thèse, je propose quatre contributions pour la prise en compte des connaissances du domaine dans ces méthodes. Tout d'abord je définis une nouvelle mesure de similarité sémantique et fonctionnelle (IntelliGO) entre les gènes, qui exploite au mieux les annotations fonctionnelles issues de l'ontologie GO ('Gene Ontology'). Je montre ensuite, grâce à une méthodologie d'évaluation rigoureuse, que la mesure IntelliGO est performante pour la classification fonctionnelle des gènes. En troisième contribution je propose une approche différentielle avec affectation floue pour la construction de profils d'expression différentielle (PED). Je définis alors un algorithme d'analyse de recouvrement entre classes fonctionnelles et ensemble des références, ici les PEDs, pour mettre en évidence des gènes ayant à la fois les mêmes variations d'expression et des annotations fonctionnelles similaires. Cette méthode est appliquée à des données expérimentales produites à partir d'échantillons de tissus sains, de tumeur colo-rectale et de lignée cellulaire cancéreuse. Finalement, la mesure de similarité IntelliGO est généralisée à d'autres vocabulaires structurés en graphe acyclique dirigé et enraciné (rDAG) comme l'est l'ontologie GO, avec un exemple d'application concernant la réduction sémantique d'attributs avant la fouille. [INFO:INFO_LG] Computer Science/Learning Données transcriptomiques Cancer colorectal Ontologie GO Mesure de similarité sémantique Graphe acyclique dirigé enraciné Classification fonctionnelle de gènes Profils d'expression Réduction d'attributs

Search results