Global ETD Search

21	Dynamic machine learning for supervised and unsupervised classification / Apprentissage automatique dynamique pour la classification supervisée et non supervisée Sîrbu, Adela-Maria 06 June 2016 (has links) La direction de recherche que nous abordons dans la thèse est l'application des modèles dynamiques d'apprentissage automatique pour résoudre les problèmes de classification supervisée et non supervisée. Les problèmes particuliers que nous avons décidé d'aborder dans la thèse sont la reconnaissance des piétons (un problème de classification supervisée) et le groupement des données d'expression génétique (un problème de classification non supervisée). Les problèmes abordés sont représentatifs pour les deux principaux types de classification et sont très difficiles, ayant une grande importance dans la vie réelle. La première direction de recherche que nous abordons dans le domaine de la classification non supervisée dynamique est le problème de la classification dynamique des données d'expression génétique. L'expression génétique représente le processus par lequel l'information d'un gène est convertie en produits de gènes fonctionnels : des protéines ou des ARN ayant différents rôles dans la vie d'une cellule. La technologie des micro-réseaux moderne est aujourd'hui utilisée pour détecter expérimentalement les niveaux d'expression de milliers de gènes, dans des conditions différentes et au fil du temps. Une fois que les données d'expression génétique ont été recueillies, l'étape suivante consiste à analyser et à extraire des informations biologiques utiles. L'un des algorithmes les plus populaires traitant de l'analyse des données d'expression génétique est le groupement, qui consiste à diviser un certain ensemble en groupes, où les composants de chaque groupe sont semblables les uns aux autres données. Dans le cas des ensembles de données d'expression génique, chaque gène est représenté par ses valeurs d'expression (caractéristiques), à des points distincts dans le temps, dans les conditions contrôlées. Le processus de regroupement des gènes est à la base des études génomiques qui visent à analyser les fonctions des gènes car il est supposé que les gènes qui sont similaires dans leurs niveaux d'expression sont également relativement similaires en termes de fonction biologique. Le problème que nous abordons dans le sens de la recherche de classification non supervisée dynamique est le regroupement dynamique des données d'expression génique. Dans notre cas, la dynamique à long terme indique que l'ensemble de données ne sont pas statiques, mais elle est sujette à changement. Pourtant, par opposition aux approches progressives de la littérature, où l'ensemble de données est enrichie avec de nouveaux gènes (instances) au cours du processus de regroupement, nos approches abordent les cas lorsque de nouvelles fonctionnalités (niveaux d'expression pour de nouveaux points dans le temps) sont ajoutés à la gènes déjà existants dans l'ensemble de données. À notre connaissance, il n'y a pas d'approches dans la littérature qui traitent le problème de la classification dynamique des données d'expression génétique, définis comme ci-dessus. Dans ce contexte, nous avons introduit trois algorithmes de groupement dynamiques que sont capables de gérer de nouveaux niveaux d'expression génique collectés, en partant d'une partition obtenue précédente, sans la nécessité de ré-exécuter l'algorithme à partir de zéro. L'évaluation expérimentale montre que notre méthode est plus rapide et plus précis que l'application de l'algorithme de classification à partir de zéro sur la fonctionnalité étendue ensemble de données... / The research direction we are focusing on in the thesis is applying dynamic machine learning models to salve supervised and unsupervised classification problems. We are living in a dynamic environment, where data is continuously changing and the need to obtain a fast and accurate solution to our problems has become a real necessity. The particular problems that we have decided te approach in the thesis are pedestrian recognition (a supervised classification problem) and clustering of gene expression data (an unsupervised classification. problem). The approached problems are representative for the two main types of classification and are very challenging, having a great importance in real life.The first research direction that we approach in the field of dynamic unsupervised classification is the problem of dynamic clustering of gene expression data. Gene expression represents the process by which the information from a gene is converted into functional gene products: proteins or RNA having different roles in the life of a cell. Modern microarray technology is nowadays used to experimentally detect the levels of expressions of thousand of genes, across different conditions and over time. Once the gene expression data has been gathered, the next step is to analyze it and extract useful biological information. One of the most popular algorithms dealing with the analysis of gene expression data is clustering, which involves partitioning a certain data set in groups, where the components of each group are similar to each other. In the case of gene expression data sets, each gene is represented by its expression values (features), at distinct points in time, under the monitored conditions. The process of gene clustering is at the foundation of genomic studies that aim to analyze the functions of genes because it is assumed that genes that are similar in their expression levels are also relatively similar in terms of biological function.The problem that we address within the dynamic unsupervised classification research direction is the dynamic clustering of gene expression data. In our case, the term dynamic indicates that the data set is not static, but it is subject to change. Still, as opposed to the incremental approaches from the literature, where the data set is enriched with new genes (instances) during the clustering process, our approaches tackle the cases when new features (expression levels for new points in time) are added to the genes already existing in the data set. To our best knowledge, there are no approaches in the literature that deal with the problem of dynamic clustering of gene expression data, defined as above. In this context we introduced three dynamic clustering algorithms which are able to handle new collected gene expression levels, by starting from a previous obtained partition, without the need to re-run the algorithm from scratch. Experimental evaluation shows that our method is faster and more accurate than applying the clustering algorithm from scratch on the feature extended data set... Classification supervisée Classification non supervisée Expression génétique Dynamic classification Pedestrian recognition Gene clustering Dynamic fusion
22	Sciences de l'information pour l'étude des systèmes biologiques (exemple du vieillissement du système immunitaire) / Information sciences to study biological systems (example of the aging of the immune system) Bedhiafi, Walid 20 September 2017 (has links) Le laboratoire i3 et le laboratoire LGIPH, utilisent des approches à haut débit pour l’étude du système immunitaire et ces disfonctionnements. Des limites ont été observées quant à l’utilisation des approches classiques pour l’annotation des signatures d’expression des gènes. L’objectif principal a été de développer une approche d’annotation pour répondre à ce besoin. L’approche que nous avons développée est une approche basée sur la contextualisation des gènes et de leurs produits puis sur la modélisation des voies biologiques pour la production de bases de connaissances pour l’étude de l’expression des gènes. Nous définissons ici un contexte d’expression des gènes comme suit : population cellulaire+compartiment anatomique+état pathologique. Pour connaitre ces contextes, nous avons opté pour la fouille de la littérature et nous avons développé un package Python, qui permet d’annoter les textes automatiquement en fonction de trois ontologies choisies en fonction de notre définition du contexte. Nous montrons ici que notre package a des performances meilleures que un outil de référence. Nous avons l’avons utilisé pour le criblage d’un corpus sur le vieillissement du système immunitaire dont on présente ici les résultats. Pour la modélisation des voies biologiques nous avons développé en collaboration avec le LIPAH une méthode de modélisation basée sur un algorithme génétique qui permet de combiner les résultats de mesure de la proximité sémantique sur la base des annotations des gènes et les données d’interactions. Nous avons réussis retrouver des réseaux de références avec un taux d’erreur de 0,47. / High-throughput experimental approaches for gene expression study involve several processing steps for the quantification, the annotation and interpretation of the results. The i3 lab and the LGIPH, applies these approaches in various experimental setups. However, limitations have been observed when using conventional approaches for annotating gene expression signatures. The main objective of this thesis was to develop an alternative annotation approach to overcome this problem. The approach we have developed is based on the contextualization of genes and their products, and then biological pathways modeling to produce a knowledge base for the study of gene expression. We define a gene expression context as follows: cell population+ anatomical compartment+ pathological condition. For the production of gene contexts, we have opted for the massive screening of literature. We have developed a Python package, which allows annotating the texts according to three ontologies chosen according to our definition of the context. We show here that it ensures better performance for text annotation the reference tool. We used our package to screen an aging immune system text corpus. The results are presented here. To model the biological pathways we have developed, in collaboration with the LIPAH lab a modeling method based on a genetic algorithm that allows combining the results semantics proximity using the Biological Process ontology and the interactions data from db-string. We were able to find networks with an error rate of 0.47. Expression génétique Information Contexte Ontologie Sciences des données Sciences de l'information Gene expression Information Ontology 570.285
23	Inhibition de l'apoptose par inversion du rapport [Na⁺]ᵢ/[K⁺]ᵢ : preuve de l'existence de facteur(s) de transcription sensible(s) à la [Na⁺]ᵢ et rôle de la mortaline Taurin, Sébastien January 2003 (has links) Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal. Na⁺ K⁺-ATPase [Na⁺]ᵢ Expression génétique Mortaline p53 Remodelage vasculaire
24	Mécanismes de transcription par l'ARN polymérase II : étude structure-fonction du site catalytique et rôles des facteurs de transcription TFIIA, TFIIE et TFIIF Langelier, Marie-France January 2005 (has links) Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal. Expression génétique Facteurs généraux de transcription Synthèse des ARN messagers Structure cristallographique Mécanisme catalytique Mutagénèse dirigée Essais fonctionnels Photo-pontage Protéine-ADN
25	Dissection moléculaire du site de fixation de l'antigène d'une molécule d'histocompatibilité de classe II et modélisation stochastique des interactions macromoléculaires au sein de la cellule vivante Peccoud, Jean 09 January 1991 (has links) (PDF) Ce travail est constitue de deux parties indépendantes. Par mutagenese dirigée et expression dans des fibroblastes en culture, il a ete possible d'étudier 30 mutants du produit de classe ii du mhc murin, a#k. Ces mutants ont ete testes par reconnaissance par des anticorps monoclonaux, par présentation d'antigènes peptidiques et par présentation du superantigenes. L'allure générale du site de fixation de l'antigène correspond a celle observée dans la structure cristalline d'une molécule de classe i. Les résultats ont aussi permis de déterminer les résidus ayant une influence critique sur la fixation de l'antigène. Enfin, l'étude de la présentation des superantigenes montre que ceux-ci ne sont pas fixes de manières analogues aux antigènes peptidiques. Le faible nombre de molécules de certaines espèces moléculaires impliquées dans les mécanismes réglant l'expression génétique pose le probleme du modèlé cinétique pertinent dans ce type de conditions. Il faut renoncer a la notion de concentration et munir le modèle d'un espace d'états discret. Le déterminisme des réactions doit aussi être abandonne au profit d'une évolution stochastique. La deuxième partie du travail s'attache a la définition mathématique des processus de saut représentant un système de réactions chimiques entre espèces présentes en très faibles quantités. Une équivalence avec les systèmes différentiels de la cinétique déterministe est établie. Un modèle de transport avec saut est aussi défini. Il permet de traduire les situations dans lesquelles des évolutions aléatoires et déterministes de déroulent conjointement. Enfin, ces constructions ont nécessité un travail préalable de nature algébrique. Une analyse stoechiometrique détaillée de l'operon lactose, des étapes précoces du développement du phase ainsi que de la réplication des plasmides de la famille cole1 est conduite. Sa généralisation est envisagée histocompatibilté mutagène dirigée stucture-fonction présentation modélisation stochastique stoechiométrie biochimie expression génétique
26	The role of the LHCX light-harvesting complex protein family in diatom photoprotection / Rôle des protéines de la famille des antennes collectrices de lumière, LHCX, dans la photoprotection chez les diatomées Taddei, Lucilla 25 July 2016 (has links) Les diatomées constituent le principal groupe du phytoplancton dans les océans, contribuant à près de 20% de la production primaire globale. Dans leur environnement très variable, les diatomées sont particulièrement efficaces dans leur capacité à ajuster leur activité photosynthétique en dissipant sous forme de chaleur l’énergie lumineuse absorbée en excès, par un processus appelé le « Non-Photochemical Quenching of chlorophyll fluorescence », (NPQ). Chez la diatomée modèle, Phaeodactylum tricornutum, il a été montré que LHCX1, une protéine proche des antennes photosynthétiques, est impliquée dans le NPQ. Par des approches intrégrées de génétique, biologie moléculaire, biochimie, imagerie des cinétiques de fluorescence et spectroscopie ultrarapide, j’ai étudié le rôle de la famille des LHCX chez P. tricornutum. J’ai tout d’abord pu corréler une expression différentielle des 4 gènes LHCX de P. tricornutum avec différentes dynamiques de NPQ et activités photosynthétiques, dans différentes conditions de lumiére et nutriments. En localisant les LHCX dans les differents complexes photosynthétiques et les différents sites de dissipation d’énergie, j’ai pu proposer un modèle de régulation dynamique du NPQ impliquant à court terme principalement LHCX1 au niveau des centres réactionnels, et une autre isoforme, possiblement LHCX3, au niveau des antennes lors d’un stress lumineux prolongé. Enfin, par le criblage d’une série de mutants potentiellement dérégulés dans leur contenu en LHCXs, j’ai pu identifier des lignées avec un NPQ altéré qui pourront constituer des nouveaux outils de recherche. Dans l’ensemble ce travail de thèse a permis de mettre en évidence la diversification fonctionnelle et l’importance de la famille des LHCX dans la fine modulation des capacités de collecte de lumière et de photoprotection, expliquant sans doute en partie le succès des diatomées dans leur environnement très fluctuant. / Diatoms dominate phytoplanktonic communities in contemporary oceans, contributing to 20% of global primary productivity. In their extremely variable environment, diatoms are especially efficient in adjusting their photosynthetic activity by dissipating as heat the light energy absorbed in excess, through a process called “Non-Photochemical Quenching of chlorophyll fluorescence”, (NPQ). In the model diatom Phaeodactylum tricornutum, it has been shown that LHCX1, a photosynthetic antenna-related gene, is involved in the NPQ process. Through integrated approaches of genetics, molecular biology, biochemistry, study of the kinetics of chlorophyll fluorescence yields and ultrafast spectroscopy, I studied the role of the LHCX family in the photoprotection activity of P. tricornutum. I first correlated a differential regulation of the 4 P. tricornutum LHCX genes with different dynamics of NPQ and photosynthetic activity, in different light and nutrient conditions. By localizing the LHCXs in fractioned photosynthetic complexes and the different sites of energy dissipation, I was able to propose a model of dynamic regulation of NPQ capacity involving mainly the LHCX1 in the reaction centers, during short-term high light responses. During prolonged high light stress, the quenching occurs mainly in the antennas, potentially mediated by the LHCX3 isoform. Finally, using photosynthetic parameters, I screened a series of transgenic lines putatively deregulated in their LHCX amount, and I identified lines with altered NPQ, which could represent novel investigation tools. Altogether, this work highlighted the functional diversification and the importance of the LHCX protein family in the fine-tuning of light harvesting and photoprotection capacity, possibly contributing to explain diatoms success in their highly fluctuating environment. Diatomées Photosynthèse LHCX Lumière Expression génétique Diatoms Photosynthesis 570
27	Organisation multi-échelle du cortex humain : des réseaux anatomo-fonctioneles à l'expression des gènes / Multiscale organization of the human cortex : from anatomo-functional cognitive networks to gene expression Cioli, Claudia 30 September 2015 (has links) Ce travail est conçu dans le panorama de développement rapide de grandes bases de données qui rassemblent des ensembles de résultats expérimentaux sur l’organisation anatomo-fonctionnelle du cerveau humain à différentes échelles; l’abondance d’informations demande un effort intra et interdisciplinaire pour les synthétiser de façon cohérente. Le but de cette thèse est de contribuer à cet effort de synthèse. Le travail suit deux chemins: intra disciplinaire pour relier et synthétiser les résultats produits par la communauté de l’imagerie cérébrale, avec une focalisation particulière sur les Réseaux de Repos et les Réseaux Cognitifs; inter-disciplinaire pour relier l’organisation anatomo-fonctionnelle du cortex cérébral (résultats en imagerie cérébrale), et les expressions des gènes révélées par les bases de données publiées très récemment sur le transcriptome humain.Cette thèse est organisée en trois parties: dans Partie I nous étudions l’organisation anatomo-fonctionnelle du cortex à partir des études d’imagerie cérébrale. Dans la Partie II, nous étudions les liens entre l’expression corticale des gènes et l’organisation anatomo-fonctionnelle du cortex, à la fois en termes de similitude topographique et de congruence de fonction, en se focalisant en particulier sur le traitement de l’information et la mémorisation. Dans la Partie III, nous présentons une plate-forme pour intégrer dans une même représentation les données d’imagerie cérébrale et d’expression génétique.En perspective, nous montrons comment notre approche pourrait donner des nouveaux points de vu au débat sur les maladies neurodégénératives et psychiatriques, et sur les modelés des dynamiques corticales. / This work is conceived in the present panorama of fast development of large databases gathering experimental results about the organization of the human brain at different scales. This abundance of information calls for an intra and inter-disciplinary effort aimed to synthesize this information in a coherent way.The aim of this thesis was to contribute to this effort for knowledge synthesis to better understand the multiscale organization of the cerebral cortex. The work followed two paths: an intra-disciplinary effort to bring together results produced by the brain imaging community with particular focus on Resting State and Task Based MRI experiments; an inter-disciplinary attempt to draw a link between the anatomo-functional organization of the cortex as emerging from brain imaging studies and the cortical patterns of gene expression as revealed by recently published atlases of the adult human brain transcriptome.The thesis is organized into three parts: In Part I studied the anatomo-functional organization of the human cortex starting from brain imaging studies. In Part II we studied the link between cortical gene expression and the anatomo-functional organization of the cortex both in term of their topography and in term of their function, focusing in particular on information processing and memory formation. In Part III we present a platform that we developed to favor knowledge integration between cognitive networks and gene expression databases.In perspective we show how our approach may provide new insights to the debate about neurodegenerative and psychiatric diseases on one hand, modeling of dynamical processes in different areas of the cortex on the other. Cortex cérébral Imagerie cérébrale Expression génétique Organisation multi-échelle Méta-analyse Intégration de l'information Cerebral cortex Brain imaging 573.86
28	Cloning and characterization of a new cAMP responsive element binding protein on rat angiotensinogen gene Wu, Jie 08 1900 (has links) Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal. / Angiotensinogen (ANG) is a single peptide glycoprotein that contains 452 amino acids in human (453 amino acids in rodents). ANG releases a 10-amino acids peptide known as angiotensin l (Ang I) from it's N-terminal when acted by renin, a acidic protease. Ang I can be fiirther converted into angiotensin II (Ang II) by angiotensin converting enzyme (ACE). Ang II is one of the most potent vasoconstrictors known. Ang II also acts on the brain to mcrease blood pressure. Ang II acts on the adrenal cortex to increase the secretion of aldosterone. The levels of ANG in plasma or local tissues diïectly contribute to the levels ofAng II. Therefore the studies of regulation ofANG gene expression is important to understand the molecular mechanisms of some related diseases, such as hypertension. Previous studies m which the transfection of the fusion genes that were generated with various lengths of 5'-flanking region of the rat ANG gene linked to a bacterial chloramphenicol acetyl transferase (CAT) gene as a reporter into mouse hepatoma (Hepa 1- 6) ceUs and opossum kidney (OK) cells, identified a putative cyclic AMP responsive element (CRE) in the rat ANG gene 5'-regulatory region (N-806/-779). Compared with palindromic CRE octamer (TGACGTCA), the putative CRE of the ANG gene (ANG-CRE) is almost identical except the last two bases were in reversed order (TGACGTAC). In the present study, we isolated a fuU-length cDNA of 1345 base pairs from mouse liver cDNA library, which encodes a nuclear DNA-binding protein consisting of 436 amino acids with an apparent molecular weight of 52 kilodalton (kDa). This protein binds to the ANG-CRE, and was designated as 52-kDa protein. Southwestern blot revealed that this 52 kDa protein was present in the following tissues, such as liver, kidney, testis, brain, but not in spleen. Analysis of the deduced amino acid sequence shows no apparent basic regionleucine zipper (bZIP) stmcture, indicatmg ANG-CREB is structurally distinct fi-om bZIP family members. The antiserum against 43-kDa-CREB or ATF-2 can not interact with this 52-kDa protein, further supporting that the 52-kDa protem is immunologically different fi-om the bZIP family. The 52-kDa protein may represent a new group of CRE-binding proteins. Competitive gel mobility shift assays and Southwestern blot analysis revealed that the ANG-CREB binds to ANG-CRE, and this bindmg is not displaceable by excess amounts of CREs fi-om somatostatin (SOM), phosphoenopymvate carboxyl kmase PEPCK), and tyrosine ammo transferase (TAT) genes in vitro. These data suggest that the 52-kDa protein binds specifically to ANG-CRE and may regulate the ANG gene expression. The biological function of the 52-kDa protein is not known at present. The primary data from transient gene transfection assays showed that this protein has represser activity on the ANG gene promoter when ANG gene was stimulated by isoproterenol, but showed no effect on the ANG basal level (without any stimulation). Further experiments will be needed to study the biological function of the 52-kDa protein. / L'angiotensinogène (ANG) est une glycoprotéine fonnée de 452 acide aminés chez l'humain (453 acide aminés chez les rongeurs). Une protéase acide, la rénine, clive l'ANG de son côté N-tenninal en libérant un peptide de 10 acide aminés connu sous le nom de l'angiotensine I (Angl). Ce dernier, peut être converti en angiotensine II (AngII) sous Faction d'une enzyme de conversion dite ACE. L'Ang II est un puissant vasocoiisticteur. Il agit au niveau du cerveau en augmentant la pression sanguine et au niveau du cortex rénal en augmentant la sécrétion de l'aldostérone. Les niveaux de l'ANG daiis le plasma ou dans les tissus locaux sont directement proportionnels aux niveaux de Ang II. Ainsi les études de regulation de l'expression du gène d'Ang II sont importantes pour comprendre les mécanismes moléculaires de certames maladies, comme l'hypertension. Des études antérieiu-es par transfection en utilisant des gènes de fusion générés avec différentes longueurs de région flanquées en 5' du gène ANG de rat lié au gène rapporteur de bactérie, le chloramphénicol acetyl transférase (CAT), dans les ceUules hépatome (Hepa 1-6) de souris et dans les ceUules rénales de sarigue, ont permis d'identifier un présumé élément réponse (CRE) d'AMP cyclique dans la région régulatrice en 5' du gène ANG de rat (N- 806/-779). En comparant l'octamère palindromique de CRE (TGACGTCA) avec le présumé CRE du gène ANG (ANG-CRE), il semble qu'ils sont identiques à l'exception des deux dernières bases qui sont dans un ordre inversé (TGACGTAC). Dans cette étude, nous avons isolé à partir d'une banque de cDNA du foie de souris, une cDNA de 1345 paire de bases qui code pour une protéine de liaison à l'ADN nucléaire. Cette protéine est fonnée de 436 acide aminés avec un poids moléculaire apparent de 52 kilodalton (kDa). En se liant à ANG-CER, cette protéme est désignée comme la 52-kDa protéine. Le "Southwestern blot" a révélé que la 52-kDa protéine de 52 kDa est présente dans les tissus suivants: foie, rein, testicule et cerveau; mais absente dans la rate. L'analyse de cette séquence déduite d'acide aminés ne montre pas du stmcture apparent à la région basique de la fermeture éclaire à leucine, bzip (basic region-leucme zipper), indiquant que la 52-kDa protéine est structurellement distincte des membres de la famille bzip. L'antisérum dérigé contre le 43- kDa-CREB ou contre ATF-2 n'intéragit pas avec la 52-kDa protéme confermant amsi que la 52-kDa protéine est immunologiquenient dififérente des membres de famille bzip. La 52-kDa protéine représente donc, un nouveau groupe des protéines de liaison à CRE. Les essais sur gel à mobilité compétitive et les analyses de "southwestern blot" ont révélé que la 52-kDa protéine lié ANG-CRE et que cette liaison n'était pas déplaçable par un excès du gène CRE de somatostatin (SOM), phosphoenopymvate carboxy kmase (PEPCK) et tyrosme ammo transférase (TAT) m vitro, suggérant que la 52-kDa protéine se lié spésifiquement à ANGCRE et qu'il peut réguler l'expression du gène ANG. Les fonctioiis biologiques de la 52- kDa protéine ne sont pas encore connus. Les premiers résultats obtenus à partir des essais de transfections des gènes transitoirs montrent que cette protéine a une activité represseur sur le promoteur du gène d'ANG quand ce dernier est stimulé par l'isoprotérénol, et que, sans stimulation, elle a aucun effet sur le niveau basai d'ANG. Les expériences futures seront nécessaires poiir étudier les fonctions biologiques d'AND. Angiotensinogène (ANG) Angiotensine II (Ang II) Protéine de 52-kDa Liaison à ANG-CRE Expression génétique Physiology / Physiologie (UMI : 0719)
29	Les macrophages d’ascendance européenne et africaine répondent différemment aux infections bactériennes Pagé Sabourin, Ariane 12 1900 (has links) Des études antérieures démontrent que les descendants de peuples européens et africains présentent des différences de susceptibilité à certaines maladies infectieuses. Ces différences suggèrent des variations interpopulationnelles de la réponse immunitaire qui résultent probablement de l’adaptation de ces individus aux pathogènes de leur environnement. Nous avons caractérisé la réponse immunitaire chez des descendants de peuples européens et africains à des infections bactériennes. Nous avons infecté des macrophages dérivés de monocytes de 30 Américains d’origine africaine (Africains) et de 31 Américains d’origine européenne (Européens) avec les pathogènes intracellulaires Listeria monocytogenes et Salmonella typhimurium pendant 4 heures, puis nous avons mesuré le niveau d’expression pangénomique des cellules infectées et non infectées par séquençage de l’ARNm. Nous avons estimé le niveau de contrôle de l’infection par les macrophages à 2, 4 et 24 heures post-infection en évaluant le taux de survie des bactéries. Nous avons observé que les Africains présentent significativement moins de bactéries intracellulaires après 4 et 24 heures que les Européens, suggérant que les Africains contrôlent mieux les infections bactériennes. Nous avons identifié des différences interpopulationnelles dans le niveau de sécrétion des cytokines et dans le niveau d’expression de certains gènes, ce qui suggère que les Africains modulent une réponse inflammatoire plus forte que les Européens. Nous avons démontré que plusieurs de ces gènes ont subi des évènements de sélection positive récents seulement chez les Européens. Notre étude a identifié plusieurs gènes candidats susceptibles d’influencer le cours des infections bactériennes chez les humains. Nos résultats indiquent que les différences dans la progression des maladies infectieuses entre les populations européennes et africaines seraient le résultat de la sélection naturelle. / Previous studies demonstrate that people of African and European ancestry differ in their susceptibility to certain infectious diseases. Differences in infection progression between these populations suggest inter-population variation in the immune response, possibly caused by adaptation to the pathogens of their historical environments. Here, we characterize the immune response of people of African and European ancestry to bacterial infections. Monocyte-derived macrophages from 30 African Americans (Africans) and 31 European Americans (Europeans) were infected with the intracellular pathogens Listeria monocytogenes and Salmonella typhimurium for 4 hours and whole genome gene expression of infected and non-infected cells was measured by RNA-sequencing. Macrophage control of bacterial infection at 2, 4 and 24 hours was assessed by culturing infected cell lysate and counting colony-forming units to approximate bacterial survival rate. We found that macrophages derived from Africans presented fewer intracellular bacteria after 4 and 24 hours than Europeans, suggesting that Africans better control intracellular bacterial infections. Concordant with this observation, we identified inter-population differences in cytokine secretion and gene expression that might explain this pattern of increased infection control in Africans. Interestingly, several of those differences indicate that Africains have a stronger pro-inflammatory response than Europeans. We show that several of these genes appear to have been subject to recent selection in the Europeans population alone. We also identify multiple candidate genes that may affect the course of infection in these populations. Overall, our findings suggest that differences in infectious disease progression observed in Africans and in Europeans may be the outcome of natural selection. Génomique humaine Interaction hôte-pathogène Expression génétique Immunologie Génétique des populations Human genomics Host-pathogen interactions Gene expression Immunology Population genetics
30	Développement de méthodes bio-informatiques pour la découverte de variants codants et non codants dans le cadre des traits sanguins Méric de Bellefon, Sébastian 04 1900 (has links) La santé cardiovasculaire, la fonction immunitaire, l'hémostase et la réponse à d'autres maladies dépendent de l'abondance et des caractéristiques spécifiques des cellules sanguines. Au fil des années, un effort considérable a été fait pour trouver les variants génétiques, les gènes et les mécanismes de régulation impliqués dans la création de ces cellules. L'inactivation d'un allèle, appelée "perte de fonction" (LoF), est un type de variant codant que nous aimerions associer aux phénotypes sanguins. Comme ces mutations ne peuvent pas être artificiellement induites chez l'humain, pour des raisons éthiques évidentes, nous observons les occurences naturelles de ces pertes de fonction et espérons que la taille des cohortes sera suffisante pour trouver des associations statistiquement significatives. L'inactivation des deux allèles, appelée "knockout" (KO), peut avoir des conséquences plus fortes qu'une simple perte de fonction. Nous espérons également trouver des KO d'origine naturelle grâce à la taille des cohortes. La combinaison de deux variants LoF différents sur les deux allèles est appelée knockout hétérozygote composé. Nous nous intéressons également aux variants non codants qui affectent l'expression des gènes impliqués dans l'hématopoïèse. Certains de ces variants créent ou perturbent des sites de liaison des facteurs de transcription (TF), ces protéines qui se lient à des séquences d'ADN spécifiques et régulent l'expression des gènes. Les sites de liaison (TFBS) des facteurs de transcription se trouvent dans les promoteurs des gènes et dans les amplificateurs spécifiques au type cellulaire. Alors que certaines de ces mutations peuvent être bénignes ou même bénéfiques, la présence d'un LoF ou d'un KO peut être trop nuisible à la survie de l'individu. Les résultats de cette étude sont limités par le biais de survie. Comparée à une étude d'association pangénomique, cette étude se concentre sur un plus petit nombre de variants génétiques pour augmenter la puissance statistique et offrir une interprétation pour les résultats statistiquement significatifs. Le programme Trans-Omics for Precision Medicine (TOPMed) recueille et garantit la qualité des 45 000 séquences du génome entier que nous avons utilisées dans cette étude, ainsi que les bilans sanguins correspondants. Grâce à ces données, nous avons pu trouver plusieurs associations connues et nouvelles entre des variants rares et des phénotypes sanguins. / Cardiovascular health, immune function, hemostasis and the response to other illnesses depend on the abundance and specific features of blood cells. Over the years, a considerable effort has been made to find which genetic variants, genes and regulatory mechanisms are involved in the creation of these cells. The inactivation of an allele, called a loss-of-function (LoF), is a type of coding variant we would like to associate with blood phenotypes. For obvious ethical reasons, these mutations cannot be artificially induced in human, so we fall back on natural occurrences and hope that large cohorts will provide enough samples to find statistically significant associations. The inactivation of both alleles, called a knockout (KO), may have stronger consequences than a simple loss-of-function. We also hope to find naturally occurring knockouts thanks to the size of a large cohort. The combination of two different LoF variants is called a compound heterozygote knockout. We are also interested in non-coding variants that affect the expression of genes that are involved in hematopoiesis. Some of these variants create or disrupt the binding sites of transcription factors (TF), the proteins that bind to specific DNA sequences and regulate gene expression. Transcription factors binding sites (TFBS) are found in gene promoters and cell type specific enhancers. While some of these mutations can be benign or even beneficial, the presence of a LoF or KO may be too detrimental for the individual to survive. The results of this study are limited by survival bias. Compared to a genome-wide association study, this study focuses on a smaller number of genetic variants to increase statistical power and give an interpretation to the statistically significant findings. The Trans-Omics for Precision Medicine (TOPMed) program collects and ensures the quality of the 45,000 whole-genome sequences we used in this study, as well as the corresponding complete blood counts. Thanks to this raw data, we were able to find several known and novel associations between rare variants and blood phenotypes. Association pangénomique méta-analyse Expression génétique Hématopoïèse Facteur de transcription Promoteur GWAS SNP meta-analysis Gene expression Hematopoiesis Transcription factor Promoter

Search results