Spelling suggestions: "subject:"́bioinformatics"" "subject:"́bioinformatic""
291 |
Extraction de Connaissances pour la Modelisation tri-dimensionnelle de l'Interactome StructuralGhoorah, Anisah 22 November 2012 (has links) (PDF)
L'étude structurale de l'interactome cellulaire peut conduire à des découvertes intéressantes sur les bases moléculaires de certaines pathologies. La modélisation par homologie et l'amarrage de protéines ("protein docking") sont deux approches informatiques pour modéliser la structure tri-dimensionnelle (3D) d'une interaction protéine-protéine (PPI). Des études précédentes ont montré que ces deux approches donnent de meilleurs résultats quand des données expérimentales sur les PPIs sont prises en compte. Cependant, les données PPI ne sont souvent pas disponibles sous une forme facilement accessible, et donc ne peuvent pas être re-utilisées par les algorithmes de prédiction. Cette thèse présente une approche systématique fondée sur l'extraction de connaissances pour représenter et manipuler les données PPI disponibles afin de faciliter l'analyse structurale de l'interactome et d'améliorer les algorithmes de prédiction par la prise en compte des données PPI. Les contributions majeures de cette thèse sont de : (1) décrire la conception et la mise en oeuvre d'une base de données intégrée KBDOCK qui regroupe toutes les interactions structurales domaine-domaine (DDI); (2) présenter une nouvelle méthode de classification des DDIs par rapport à leur site de liaison dans l'espace 3D et introduit la notion de site de liaison de famille de domaines protéiques ("domain family binding sites" ou DFBS); (3) proposer une classification structurale (inspirée du système CATH) des DFBSs et présenter une étude étendue sur les régularités d'appariement entre DFBSs en terme de structure secondaire; (4) introduire une approche systématique basée sur le raisonnement à partir de cas pour modéliser les structures 3D des complexes protéiques à partir des DDIs connus. Une interface web (http://kbdock.loria.fr) a été développée pour rendre accessible le système KBDOCK. Le système KBDOCK couvre plus de 2,700 hetero DDIs non-redondantes correspondant à 1,439 DFBSs localisés sur 947 domaines Pfam distincts. KBDOCK a permis de réaliser plusieurs études étendues. Par exemple, KBDOCK a été utilisé pour montrer que: (1) après de 70% de familles de domaines protéiques n'ont qu'un seul DFBS et les autres familles en ont un petit nombre seulement, ce qui suggère que les DDIs re-utilisent souvent les mêmes sites de liaison; (2) plus de 80% de DFBSs interagissent avec une seule famille de domaines protéiques et les autres DFBSs interagissent avec un petit nombre de familles, ce qui indique que la plupart des DFBSs sont principalement monogames dans leur interactions avec les autres domaines protéiques; (3) les DFBSs impliqués dans des interactions présentent des régularités en terme de structure secondaire, ce qui pourrait servir comme un descripteur complémentaire dans la prédiction d'interaction; (4) lorsque les domaines re-utilisent leur DFBS, le docking orienté vient améliorer les prédictions. Ainsi, KBDOCK constitue une ressource unifiée qui permet d'enrichir les connaissances sur l'interactome structural.
|
292 |
Dynamique des hélitrons dans le genome d'Arabidopsis thaliana : développement de nouvelles stratégies d'analyse des éléments transposablesTempel, Sébastien 18 June 2007 (has links) (PDF)
Les hélitrons constituent un groupe d'éléments transposables découverts récemment dans les génome eucaryotes. A travers une étude bioinformatique, nous avons étudié leur mode d'invasion, la modularité de leur séquence et leurs impacts sur les gènes à leur proximité dans le génome d'Arabidopsis thaliana. Les hélitrons sont les éléments transposables les plus répandus dans ce génome ; néanmoins ils ne sont que partiellement reconnus par des logiciels d'alignement. Nous avons modélisé ces éléments sous la forme d'une grammaire formelle. Cette grammaire est constituée des deux extrémités terminales séparées par une séquence nucléotidique quelconque de taille fixée. Nous avons créé une matrice d'occurrences des modèles associant toutes les combinaisons possibles d'extrémités. La matrice a fait apparaître des associations préférentielles entre certaines extrémités et a permis la découverte de nouvelles familles d'hélitrons chimériques. La détection des ORFs contenant les protéines de transposition a permis de confirmer la relation hélitron autonome non-autonome et de comprendre le mécanisme de création des chimères d'hélitrons. Nous avons proposé une nouvelle nomenclature des hélitrons basée sur leurs extrémités et non sur leur séquence globale. L'étude de la séquence d'une famille d'hélitrons a montré une réorganisation constante des domaines nucléiques entre les différentes copies de cette famille. Pour comprendre cette organisation, nous avons mis au point le logiciel DomainOrganizer qui permet d'observer la composition en domaines des éléments transposables. DomainOrganizer détecte les frontières entre domaines à partir d'un alignement multiple et crée la liste des domaines. A partir de cette liste, il recherche, par un algorithme d'optimisation combinatoire, le nombre minimal de domaines qui recouvrent au maximum l'ensemble des séquences. Enfin, DomainOrganizer visualise et classe les séquences en fonction de leurs domaines. L'analyse par domaines de la famille AtREP21 a permis de comprendre la nature de cette variabilité et de retracer l'histoire évolutive de cette famille à partir de l'identification des domaines. L'étude de la localisation des hélitrons AtREP3 dans ce génome de plante a montré une insertion préférentielle de ceux-ci dans les promoteurs de gènes. Les profils d'expression de ces gènes, nous a permis d'identifier plusieurs clusters. Par ailleurs, les motifs de régulation ont montré une grande variabilité de motifs dans les promoteurs mais pas dans les hélitrons. Ces résultats ont montré que les hélitrons non-autonomes transportent dans leurs séquences internes des motifs de liaisons aux facteurs de transcription. Des analyses complémentaires devront être réalisées pour comprendre l'action régulatrice des hélitrons sur les gènes situés à leur proximité.
|
293 |
Modélisation dynamique de la signalisation cellulaire : aspects différentiels et discrets; application à la signalisation du facteur de croissance TGF-beta dans le cancerAndrieux, Geoffroy 18 July 2013 (has links) (PDF)
La signalisation cellulaire regroupe l'ensemble des mécanismes biologiques permettant à une cellule de répondre de façon adaptée à son microenvironnement. Pour ce faire, de nombreuses réactions biologiques entrent en jeux avec un important enchevêtrement, créant ainsi un réseau dont le comportement s'apparente à un système complexe. Le compréhension de la réponse cellulaire à une stimulation passe par le développement conjoint des techniques d'acquisition de données, et des méthodes permettant de formaliser ces données dans un modèle. C'est sur ce dernier point que s'inscrivent les travaux exposés dans cette thèse. Nous présentons ici deux approches visant à répondre à des questions de natures différentes sur la signalisation cellulaire. Dans la première nous utilisons un modèle différentiel pour étudier le rôle d'un nouvel interactant dans la voie canonique du TGF-beta. Dans la seconde nous avons exploré la combinatoire de la signalisation cellulaire en développant un formalisme discret basé sur les transitions gardées. Cette approche regroupe l'interprétation de la base de données Pathway Interaction Database dans un unique modèle dynamique de propagation du signal. Des méthodes de simulations et d'analyses inspirées des techniques de vérification de modèles telles que l'atteignabilité et l'invariance ont été développées. En outre, nous avons étudié la régulation du cycle cellulaire en réponse à la signalisation, ainsi que la régulation des gènes de notre modèle en comparaison avec des données d'expressions.
|
294 |
Recherche automatisée de motifs dans les arbres phylogénétiquesBigot, Thomas 05 June 2013 (has links) (PDF)
La phylogénie permet de reconstituer l'histoire évolutive de séquences ainsi que des espèces qui les portent. Les récents progrès des méthodes de séquençage ont permis une inflation du nombre de séquences disponibles et donc du nombre d'arbres de gènes qu'il est possible de construire. La question qui se pose est alors d'optimiser la recherche d'informations dans ces arbres. Cette recherche doit être à la fois exhaustive et efficace. Pour ce faire, mon travail de thèse a consisté en l'écriture puis en l'utilisation d'un ensemble de programmes capables de parcourir et d'annoter les arbres phylogénétiques. Cet ensemble de programmes porte le nom de TPMS (Tree Pattern Matching Suite). Le premier de ces programmes (tpms_query) permet d'effectuer l'interrogation de collections à l'aide d'un formalisme dédie. Les possibilités qu'il offre sont : La détection de transferts horizontaux : Si un arbre de gènes présente une espèce branchée dans un arbre au milieu d'un groupe monophylétique d'espèces avec lesquelles elle n'est pas apparentée, on peut supposer qu'il s'agit d'un transfert horizontal, si ces organismes sont des procaryotes ou des eucaryotes unicellulaires. La détection d'orthologie : Si une partie d'un arbre de gènes correspond exactement à l'arbre des espèces, on peut alors supposer que ces gènes sont un ensemble de gènes d'orthologues. La validation de phylogénies connues : Quand l'arbre des espèces donne lieu à des débats, il peut est possible d'interroger une large collection d'arbres de gènes pour voir combien de familles de gènes correspondent à chaque hypothèse. Un autre programme, tpms_computations, permet d'effectuer des opérations en parallèle sur tous les arbres, et propose notamment l'enracinement automatique des arbres via différents critères, ainsi que l'extraction de sous arbres d'orthologues (séquence unique par espèce). Il propose aussi une méthode de détection automatique d'incongruences. La thèse présente le contexte, les différents algorithmes à la base de ces programmes, ainsi que plusieurs utilisations qui en ont été faites
|
295 |
Etude de la variabilité des contributions de nutriments à un réseau métabolique : modélisation, optimisation et application en nutritionAbdou-Arbi, Oumarou 30 September 2013 (has links) (PDF)
Nous développons une approche générique pour comprendre comment différents régimes alimentaires peuvent influencer la qualité et la composition du lait. Cette question s'intègre dans le cadre du Flux Balance Analysis (FBA), qui consiste à analyser un réseau métabolique en optimisant un système de contraintes linéaires. Nous avons proposé une extension du FBA pour analyser la transformation des nutriments en intégrant des hypothèses biologiques utilisées par différents modèles numériques dans un modèle générique de la glande mammaire. Notre méthode permet de quantifier les précurseurs qui interviennent dans la composition des sorties du système, en calculant des contributions des entrées dans les sorties [AIO]. A l'aide de cette approche, nous avons montré que la transformation des nutriments du lait ne peut pas être modélisée par l'optimisation d'une combinaison linéaire des flux des réactions sur un modèle du métabolisme mammaire. Pour étudier plus précisément la flexibilité d'un réseau métabolique, nous avons proposé un algorithme e
|
296 |
Exploiter les capacités parallèles des architectures modernes en bioinformatique applications à la génétique, la comparaison de structures et l'analyse de larges graphesChapuis, Guillaume 18 December 2013 (has links) (PDF)
La croissance exponentielle de la génération de données pour la bioinformatique couplée à une stagnation des fréquences d'horloge des processeurs modernes accentuent la nécessité de fournir des implémentation tirant bénéfice des capacités parallèles des ordinateurs modernes. Cette thèse se concentre sur des algorithmes et implementations pour des problèmes de bioinformatique. Plusieurs types de parallélisme sont décrits et exploités. Cette thèse présente des applications en génétique, avec un outil de détection de QTL paralllisé sur GPU, en comparaison de structures de protéines, avec un outil permettant de trouver des régions similaires entre protéines parallélisé sur CPU, ainsi qu'à l'analyse de larges graphes avec une implémentation multi-GPUs d'un nouvel algorithme pour le problème du "All-Pairs Shortest Path".
|
297 |
Variations structurales du génome et du transcriptome humains induites par les rétrotransposons LINE-1 / Structural variations of the human genome and transcriptome induced by LINE-1 retrotransposonsMir, Ashfaq Ali 04 December 2015 (has links)
Les rétrotransposons sont des éléments génétiques mobiles qui constituent presque la moitié de notre génome. Seule la sous-famille L1HS appartenant à la classe des Long Interspersed Element-1(LINE-1 ou L1) a gardé une capacité de mobilité autonome chez l’Homme. Leur mobilisation dans la lignée germinale, mais Aussi dans certains tissus somatiques, contribue à la diversité du génome humain ainsi qu’à certaines maladies comme le cancer. Ainsi, de nouvelles copies de L1 peuvent directement s'intégrer dans des séquences codantes ou régulatrices, et altérer leur fonction. De plus, les séquences L1 contiennent elles-mêmes plusieurs éléments cis-régulateurs et leur insertion à proximité ou dans un gène peut produire des altérations génétiques plus subtiles. Afin d'explorer l'ensemble de ces altérations à l'échelle du génome, nous avons développé un logiciel dédié à l’analyse des données de séquençage d'ARN qui permet d'identifier des transcrits chimériques ou antisens impliquant les L1 et d'annoter ces isoformes en fonction des différents événements d’épissage alternatif subits. Au cours de ce travail, il est apparu que la compréhension du lien entre polymorphisme des insertions et phénotype nécessite une vue complète des différentes copies L1HS présentes chez un individu donné. Afin de disposer d'un catalogue aussi complet que possible de ces polymorphismes identifiés dans des échantillons humains sains ou pathologiques et publiés dans des journaux scientifiques, nous avons développé euL1db, la base de données des insertions de rétrotransposon L1HS chez l’Homme. En conclusion, ce travail aidera à comprendre l’impact des L1 sur l’expression des gènes, à l'échelle du génome. / Retrotransposons are mobile genetics elements, which form almost half of our genome. Only the L1HS subfamily of the Long Interspersed Element-1 class (LINE-1 or L1) has retained the ability to jump autonomously in humans. Their mobilization in the germline – but also in some somatic tissues – contributes to human genetic diversity and to diseases, such as cancer. L1 reactivation can be directly mutagenic by disrupting genes or regulatory sequences. In addition, L1 sequences themselves contain many regulatory cis-elements. Thus, L1 insertions near a gene or within intronic sequences can also produce more subtle genic alterations. To explore L1-mediated genic alterations in a genome-wide manner, we have developed a dedicated RNA-seq analysis software able to identify L1 chimeric or antisense transcripts and to annotate these novel isoforms with their associated alternative splicing events. During the course of this work, it appeared that understanding the link between L1HS insertion polymorphisms and phenotype or disease requires a comprehensive view of the different L1HS copies present in a given individual or sample. To provide a comprehensive summary of L1HS insertion polymorphisms identified in healthy or pathological human samples and published in peer-reviewed journals, we developed euL1db, the European database of L1HS retrotransposon insertions in humans. This work will help understanding the overall impact of L1 insertions on gene expression, at a genome-wide scale.
|
298 |
Caractérisation des lymphocytes B régulateurs chez l'Homme / Characterization of human regulatory B cellsSimon, Quentin 13 November 2015 (has links)
Le potentiel régulateur des lymphocytes B (LB), largement associé avec la production d’interleukine-10 (IL-10), a été mis en évidence dans des modèles murins de pathologies spécifiques d’Ag. Les cellules B transitionnelles (Tr.) CD24fortes CD38fortes ont été décrites comme régulatrices, au travers de la production d’IL-10, de l’inhibition de la prolifération T, ainsi que de la suppression de la réponse inflammatoire des cellules T. Les LB transitionnels représentent un stade de développement central dans la maturation des cellules B, en faisant le lien entre les cellules immatures de la moelle osseuse et celles matures situées dans les organes lymphoïdes secondaires. Dans une première étude, nous montrons que cette population est hétérogène, et composée de LB Tr. de type 1 (T1), T2, T3 et Tr. CD27+. Les LB T3 anergiques semblent jouer un rôle dans la tolérance périphérique en limitant la prolifération des lymphocytes T (LT) CD4+, tandis que les LB Tr. CD27+ IL-10+ nouvellement décrits inhibent la différenciation des LT CD4+ en cellules productrices d’IFN-γ et de TNF-α. Notons que les LB T1 et Tr. CD27+ se différencient rapidement en cellules productrices d’Ac suite à la reconnaissance de signaux de l’immunité innée. La production d’IL-10 est en partie dépendante des signaux perçus, provenant du microenvironnement. Nous avons décrit dans un second travail que les LB s’adaptent aux cellules avec lesquelles ils sont cultivés. En effet, les cellules B régulent spécifiquement les LT CD4+ mémoires (et non naïfs), en limitant leur prolifération avant d’induire une mort cellulaire. Ces caractéristiques fonctionnelles pourraient être associées avec une modification du programme transcriptionnel, permise par la plasticité des cellules B, qui se polarisent en LB régulateurs (Breg) de façon ciblée. L’expression des gènes PRDM1 et IL10 serait associée avec une signature Breg spécifique en culture mixte autologue, en opposition avec celle des gènes NFκB1 et BCL6. La transplantation rénale est un excellent modèle physiopathologique, pour étudier l’importance de certaines populations de LB dans la tolérance immunologique. L’étude BHL (B lymphocytes in humoral rejection and alloimmunisation) nous a permis de confirmer que les LB Tr. ont probablement un rôle important dans cette tolérance du greffon. La présence d’anticorps spécifiques du donneur (DSA) semble limiter l’émergence des LB Tr., même si le pourcentage de cellules B CD24fortes CD38fortes n’est a priori pas associé avec la capacité du compartiment lymphocytaire B à réguler la prolifération des cellules T des patients alloimmunisés. / Regulatory B cells (Breg) were first reported to be interleukine-10 (IL-10) producing B cells in mice. The almost concurrent discovery of Breg cells drew interest toward potential links with transitional B cells because of phenotypic and functional similarities. In addition with IL-10 production, CD24high CD38high transitional B cells limit the proliferation of T cells and the polarization of CD4+ T cells into Th1 cells. Transitional B cells represent a central developmental stage in B-cell maturation, linking generation in the bone marrow with differentiation in periphery. In a first study, we reveal for the first time that human transitional B cells encompass not only transitional type 1 and type 2 B cells, but also distinct anergic type 3 B cells, as well as IL-10-producing CD27+ transitional B cells. Interestingly, the latter two subsets differentially regulate CD4+ T-cell proliferation and polarization toward Th1 effector cells. Additional experiments showed that type 1 and CD27+ transitional B cells are capable to differentiate into antibody secreting cells after toll-like receptor 9 engagement. In a second work, we wanted to explore the ability of B cells to target T-cell populations. We demonstrate that B cells can be suppressive cells. B cells are capable to target CD4+ memory T-cell, limiting the proliferation and inducing the death of this T-cell population. At the opposite, B cells seem to be effector of CD4+ naïve T-cell functions. These properties are probably associated with a specific transcriptional program. Thus, we observed that suppressive B cells overexpress PRDM1 and IL10, whereas effector B cells preferentially express BCL6 and NFκB1 in in vitro mixed culture. In the last part, we worked on B-cell phenotype and functions in transplanted patients. BHL (B lymphocytes in humoral rejection and alloimmunisation) is a clinical study that aims to better understand the role of B cells in the alloimmunisation and the chronic rejection occurring after renal transplantation. Donor specific antibodies (DSA) seem to limit the expansion of transitional B cells, which are probably not associated with the ability of B cells to regulate T-cell proliferation in DSA+ patients.
|
299 |
Etude bioinformatique du réseau d'interactions entre protéines de transport ches les FungiBrohée, Sylvain 10 November 2008 (has links)
Les protéines associées aux membranes sont d'une importance cruciale pour la cellule. Cependant, en raison d'une plus grande difficulté de manipulation, les données biochimiques les concernant sont très lacunaires, notamment au point de vue de la formation de complexes entre ces protéines.<p><p>L'objectif global de notre travail consiste à combler ces lacunes et à préciser les interactions entre protéines membranaires chez la levure Saccharomyces cerevisiae et plus précisément, entre les transporteurs. Nous avons commencé notre travail par l'étude d'un jeu de données d'interactions à grande échelle entre toutes les perméases détectées par une méthode de double hybride spécialement adaptée aux protéines insolubles (split ubiquitin). Premièrement, la qualité des données a été estimée en étudiant le comportement global des données et des témoins négatifs et positifs. Les données ont ensuite été standardisées et filtrées de façon à ne conserver que les plus significatives. Ces interactions ont ensuite été étudiées en les modélisant dans un réseau d'interactions que nous avons étudié par des techniques issues de la théorie des graphes. Après une évaluation systématique de différentes méthodes de clustering, nous avons notamment recherché au sein du réseau des groupes de protéines densément interconnectées et de fonctions similaires qui correspondraient éventuellement à des complexes protéiques. Les résultats révélés par l'étude du réseau expérimental se sont révélés assez décevants. En effet, même si nous avons pu retrouver certaines interactions déjà décrites, un bon nombre des interactions filtrées semblait n'avoir aucune réalité biologique et nous n'avons pu retrouver que très peu de modules de protéines de fonction semblable hautement inter-connectées. Parmi ceux-ci, il est apparu que les transporteurs d'acides aminés semblaient interagir entre eux.<p><p>L'approche expérimentale n'ayant eu que peu de succès, nous l'avons contournée en utilisant des méthodes de génomique comparative d'inférence d'interactions fonctionnelles. Dans un premier temps, malgré une évaluation rigoureuse, l'étude des profils phylogénétiques (la prédiction d'interactions fonctionnelles en étudiant la corrééélation des profils de présence - absence des gènes dans un ensemble de génomes), n'a produit que des résultats mitigés car les perméases semblent très peu conservées dès lors que l'on considère d'autres organismes que les \ / Doctorat en Sciences / info:eu-repo/semantics/nonPublished
|
300 |
Development of an integrated Information Technology System for management of laboratory data and next-generation sequencing workflows within a cancer genomics research platform / Développement d’un système informatique intégré pour la gestion des données de laboratoire et des étapes de séquençage de nouvelle génération au sein d’une plateforme de recherche en génomique du cancerVoegele, Catherine 27 November 2015 (has links)
L'objectif de mon travail de thèse était de développer des outils bio informatiques permettant d'améliorer la traditionnelle gestion de l'information scientifique au sein d'un grand centre de recherche et en particulier au sein d'une plateforme de génomique. Trois outils ont été développés: un cahier de laboratoire électronique, un système de gestion de l'information de laboratoire pour des applications de génomique dont le séquençage de nouvelle génération, ainsi qu'un système de gestion des échantillons pour de grandes bio-banques. Ce travail a été réalisé en étroite collaboration avec des biologistes, épidémiologistes et informaticiens. Il a également inclus la mise en place d'interactions entre les différents outils pour former un système informatique intégré. Les trois outils ont été rapidement adoptés par l'ensemble des scientifiques du centre de recherche et sont désormais utilisés au quotidien pour le suivi de toutes les activités de laboratoire mais aussi plus globalement pour les autres activités scientifiques du centre de recherche. Ces outils sont transposables dans d'autres instituts de recherche / The aim of my thesis work was to develop bioinformatics tools to improve the traditional scientific information management within a large research centre and especially within a genomics platform. Three tools have been developed: an electronic laboratory notebook, a laboratory information management system for genomics applications including next generation sequencing, as well as a sample management system for large biobanks. This work has been conducted in close collaboration with biologists, epidemiologists and IT specialists. It has also included the setup of interactions between the different tools to make an integrated IT system. The three tools have been rapidly adopted by all the scientists of the research centre and are now daily used for the tracking of all the laboratory’s activities but also more globally for the research centre’s other scientific activities. These tools are transposable in other research institutes
|
Page generated in 0.0782 seconds