Global ETD Search

51	Comparaison de réseaux biologiques Mohamed Babou, Hafedh 06 November 2012 (has links) (PDF) La comparaison de réseaux biologiques est actuellement l'une des approches les plus prometteuses pour aider à la compréhension du fonctionnement des organismes vivants. Elle apparaît comme la suite attendue de la comparaison de séquences biologiques dont l'étude ne représente en réalité que l'aspect génomique des informations manipulées par les biologistes. Dans cette thèse, nous proposons une approche innovante permettant de comparer deux réseaux biologiques modélisés respectivement par un graphe orienté D et un graphe non-orienté G, et dotés d'une fonction f établissant la correspondance entre les sommets des deux graphes. L'approche consiste à extraire automatiquement une structure dans D, biologiquement significative, dont les sommets induisent dans G, par f, une structure qui soit aussi biologiquement significative. Nous réalisons une étude algorithmique du problème issu de notre approche en commençant par sa version dans laquelle D est acyclique (DAG). Nous proposons des algorithmes polynomiaux pour certains cas, et nous montrons que d'autres cas sont algorithmiquement difficiles (NP-complets). Pour résoudre les instances difficiles, nous proposons une bonne heuristique et un algorithme exact basé sur la méthode branch-and-bound. Pour traiter le cas où D est cyclique, nous introduisons une méthode motivée par des hypothèses biologiques et consistant à décomposer D en DAGs tels que les sommets de chaque DAG induisent dans G un sous-graphe connexe. Nous étudions également dans cette thèse, l'inférence des voies de signalisation en combinant les informations sur les causes et sur les effets des événements extra-cellulaires. Nous modélisons ce problème par un problème d'orientation de graphes mixtes et nous effectuons une étude de complexité permettant d'identifier les instances faciles et celles difficiles. [INFO:INFO_CC] Informatique/Complexité Réseaux hétérogènes Biologie computationnelle NP-difficulté APX-difficulté Complexité paramétrée Heuristiques Branch-and-Bound
52	Inférence de réseaux d'interaction protéine-protéine par apprentissage statistique Brouard, Céline 14 February 2013 (has links) (PDF) L'objectif de cette thèse est de développer des outils de prédiction d'interactions entre protéines qui puissent être appliqués en particulier chez l'homme, sur les protéines qui constituent un réseau avec la protéine CFTR. Cette protéine, lorsqu'elle est défectueuse, est impliquée dans la mucoviscidose. Le développement de méthodes de prédiction in silico peut s'avérer utile pour suggérer aux biologistes de nouvelles cibles d'interaction et pour mieux expliquer les fonctions des protéines présentes dans ce réseau. Nous proposons une nouvelle méthode pour le problème de la prédiction de liens dans un réseau. Afin de bénéficier de l'information des données non étiquetées, nous nous plaçons dans le cadre de l'apprentissage semi-supervisé. Nous abordons ce problème de prédiction comme une tâche d'apprentissage d'un noyau de sortie, appelée régression à noyau de sortie. Un noyau de sortie est supposé coder les proximités existantes entre les noeuds du graphe et l'objectif est d'approcher ce noyau à partir de descriptions appropriées en entrée. L'utilisation de l'astuce du noyau dans l'ensemble de sortie permet de réduire le problème d'apprentissage à partir de paires à un problème d'apprentissage d'une fonction d'une seule variable à valeurs dans un espace de Hilbert. En choisissant les fonctions candidates pour la régression dans un espace de Hilbert à noyau reproduisant à valeur opérateur, nous développons, comme dans le cas de fonctions à valeurs scalaires, des outils de régularisation. Nous établissons en particulier des théorèmes de représentation dans le cas supervisé et dans le cas semi-supervisé, que nous utilisons ensuite pour définir de nouveaux modèles de régression pour différentes fonctions de coût, appelés IOKR-ridge et IOKR-margin. Nous avons d'abord testé l'approche développée sur des données artificielles, des problèmes test ainsi que sur un réseau d'interaction protéine-protéine chez la levure S. Cerevisiae et obtenu de très bons résultats. Puis nous l'avons appliquée à la prédiction d'interactions entre protéines dans le cas d'un réseau construit autour de la protéine CFTR. interactions protéine-protéine prédiction de liens méthodes à noyaux apprentissage semi-supervisé noyau à valeur opérateur régression à noyau de sortie sorties structurées
53	Statistique bayésienne et applications en génétique des populations Blum, Michael G B 03 December 2012 (has links) (PDF) Les approches statistiques en génétique des populations visent deux objectifs distincts qui sont la description des données et la possibilité d'inférer les processus évolutifs qui ont généré les patrons observés. Le premier chapitre de ce manuscrit décrit nos apports théoriques et méthodologiques concernant le calcul bayésien approché (Approximate Bayesian Computation) qui permet de réaliser l'objectif d'inférence des processus évolutifs. Je décris des résultats asymptotiques qui permettent de décrire des propriétés statistiques du calcul bayésien approché. Ces résultats mettent en évidence à la fois l'intérêt des méthodes dites avec ajustement qui reposent sur des équations de régression et aussi l'intérêt de réduire la dimension des descripteurs statistiques utilisés dans le calcul bayésien approché. Je présente ensuite une méthode originale de calcul bayésien approché qui permet de manière conjointe d'effectuer des ajustements et de réduire la dimension des descripteurs statistiques. Une comparaison des différentes méthodes de réduction de dimension clos le premier chapitre. Le deuxième chapitre est consacré à l'objectif de description des données et se place plus particulièrement dans un cadre spatial. Les méthodes statistiques proposées reposent sur le concept d'isolement par la distance qui est une forme particulière de l'autocorrélation spatiale où la corrélation entre individus décroit avec la distance. Une approche originale de krigeage nous permet de caractériser des patrons d'isolement par la distance non-stationnaire où la manière avec laquelle la corrélation entre individus décroit avec la distance dépend de l'espace. Une deuxième extension que nous proposons est celle d'isolement par la distance anisotrope que nous caractérisons et testons à partir d'une équation de régression. La conclusion de ce manuscrit met l'accent sur les problèmes d'interprétation des résultats statistiques, l'importance de l'échantillonnage et la nécessité de tester l'adéquation des modèles aux données. Je conclus par des perspectives qui se proposent de faire passer l'analyse statistique bayésienne à l'échelle des données massives produites en génétique. [MATH:MATH_ST] Mathematics/Statistics [STAT:TH] Statistics/Statistics Theory [STAT:TH] Statistiques/Théorie Statistique bayésienne génétique des populations calcul bayésien approché coalescent processus stochastiques en biologie krigeage
54	Sur la bio-informatique des réseaux d'automates Sené, Sylvain 27 November 2012 (has links) (PDF) Ce travail présente des contributions théoriques et appliquées dans le contexte des systèmes dynamiques discrets vus comme modèles des réseaux de régulation biologique. En mettant en avant le fait qu'accroître les connaissances du vivant nécessite aujourd'hui de mieux comprendre les propriétés mathématiques qui le régissent, il développe diverses réflexions menées en bio-informatique théorique en se fondant sur le formalisme des réseaux d'automates, notamment booléens. Les trois principaux thèmes abordés sur ces réseaux sont la robustesse environnementale, la combinatoire comportementale et la robustesse structurelle. La robustesse environnementale est notamment évoquée à travers une étude de la manière dont les réseaux d'automates réagissent face à l'influence de conditions de bord fixées (on y retrouve une généralisation au cas non-linéaire d'un résultat connu dans le domaine des automates cellulaires). La combinatoire comportementale est quant à elle abordée par les cycles d'interaction dont on connaît l'importance sur la dynamique des réseaux. Pour ces motifs particuliers et leurs intersections sont présentées des caractérisations combinatoires de leur comportement asymptotique en parallèle, qui font ensuite l'objet de comparaisons. Enfin, le thème de la robustesse structurelle est traité au travers du concept de graphe de transition général, qui a mené à mettre en évidence tous les comportements possibles des cycles d'interaction, à donner une classification de la robustesse des réseaux vis-à-vis de leur asynchronisme/synchronisme, de laquelle se sont imposées des études plus précises sur le rôle de la non-monotonie dans ces réseaux. Bio-informatique théorique réseaux d'automates systèmes dynamiques discrets robustesse environnementale combinatoire comportementale robustesse structurelle et non-monotonie
55	Problèmes de réarrangement avec marqueurs génomiques dupliqués Thomas, Antoine 18 July 2014 (has links) (PDF) La compréhension de la dynamique des réarrangements génomiques est importante en phylogénie. La phylogénie est l'étude de l'évolution des espèces. Un but majeur est d'établir les relations d'évolution au sein d'un groupe d'espèces, pour déterminer la topologie de l'arbre d'évolution formé par ce groupe et des ancêtres communs à certains sous-ensembles. Pour ce faire, il est naturellement très utile de disposer d'un moyen d'évaluer les distances évolutionnaires relatives entre des espèces, ou encore d'être capable d'inférer à un groupe d'espèces le génome d'un ancêtre commun à celles-ci. Ce travail de thèse, dans la lignée d'autres travaux, consiste à élaborer de tels moyens, ici dans des cas particuliers où les génomes possèdent des gènes en multiples copies, ce qui complique les choses. Plusieurs hypotèses explicatives de la présence de duplications ont été considérées, des formules de distance ainsi que des algorithmes de calcul de scénarios ont été élaborés, accompagnés de preuves de complexité. ́bioinformatique génomique comparative réarrangements marqueurs dupliqués genome halving duplication en tandem breakpoints inversion DCJ échange de blocs
56	Méthodes numériques et formelles pour l'ingénierie des réseaux biologiques : traitement de l'information par des populations d'oscillateurs. Approches par contraintes et Taxonomie des réseaux biologiques Ben amor, Mohamed hedi 11 July 2012 (has links) (PDF) Cette thèse concerne l'ingénierie des systèmes complexes à partir d'une dynamique souhaitée. En particulier, nous nous intéressons aux populations d'oscillateurs et aux réseaux de régulation génétique. Dans une première partie, nous nous fondons sur une hypothèse, introduite en neurosciences, qui souligne le rôle de la synchronisation neuronale dans le traitement de l'information cognitive. Nous proposons de l'utiliser sur un plan plus large pour étudier le traitement de l'information par des populations d'oscillateurs. Nous discutons des isochrons de quelques oscillateurs classés selon leurs symétries dans l'espace des états. Cela nous permet d'avoir un critère qualitatif pour choisir un oscillateur. Par la suite, nous définissons des procédures d'impression, de lecture et de réorganisation de l'information sur une population d'oscillateurs. En perspective, nous proposons un système à couches d'oscillateurs de Wilson-Cowan. Ce système juxtapose convenablement synchronisation et désynchronisation à travers l'utilisation de deux formes de couplage: un couplage continu et un couplage par pulsation. Nous finissons en proposant une application de ce système: la détection de contours dans une image. En deuxième partie, nous proposons d'utiliser une approche par contraintes pour identifier des réseaux de régulation génétique à partir de connaissances partielles sur leur dynamique et leur structure. Le formalisme que nous utilisons est connu sous le nom de réseaux d'automates booléens à seuil ou réseaux Hopfield-semblables. Nous appliquons cette méthode, afin de déterminer le réseau de régulation de la morphogenèse florale d'Arabidopsis thaliana. Nous montrons l'absence d'unicité des solutions dans l'ensemble des modèles valides (ici, 532 modèles). Nous montrons le potentiel de cette approche dans la détermination et la classification de modèles de réseaux de régulation génétique. L'ensemble de ces travaux mène à un certain nombre d'applications, en particulier dans le développement de nouvelles méthodes de stockage de l'information et dans le design de systèmes de calcul non conventionnel. Évocation mnésique Synchronisation et désynchronisation Populations d'oscillateurs Approche par contraintes Robustesse Réseaux de régulation génétique
57	Comparaisons de séquences biologiques sur architecture massivement multi-cœurs Tran, Tuan Tu 21 December 2012 (has links) (PDF) Rechercher les similarités entre séquences est une opération fondamentale en bioinformatique, que cela soit pour étudier des questions biologiques ou bien pour traiter les données issues de séquenceurs haut-débit. Il y a un vrai besoin d'algorithmes capables de traiter des millions de séquences rapidement. Pour trouver des similarités approchées, on peut tout d'abord considérer de petits mots exacts présents dans les deux séquences, les graines, puis essayer d'étendre les similarités aux voisinages de ces graines. Cette thèse se focalise sur la deuxième étape des heuristiques à base de graines : comment récupérer et comparer efficacement ces voisinages des graines, pour ne garder que les bons candidats ? La thèse explore différentes solutions adaptées aux processeurs massivement multicoeurs: aujourd'hui, les GPUs sont en train de démocratiser le calcul parallèle et préparent les processeurs de demain. La thèse propose des approches directes (extension de l'algorithme bit-parallèle de Wu-Manber, publiée à PBC 2011, et recherche dichotomique) ou bien avec un index supplémentaire (utilisation de fonctions de hash parfaites). Chaque solution a été pensée pour tirer le meilleur profit des architectures avec un fort parallélisme à grain fin, en utilisant des calculs intensifs mais homogènes. Toutes les méthodes proposées ont été implémentés en OpenCL, et comparées sur leur temps d'exécution. La thèse se termine par un prototype de read mapper parallèle, MAROSE, utilisant ces concepts. Dans certaines situations, MAROSE est plus rapide que les solutions existantes avec une sensibilité similaire. Bioinformatique Calcul intensif Parallélisme Processeurs massivement multi-coeurs Cartes graphiques GPU Comparaisons de séquences Heuristiques à base de graines
58	Conception par modélisation et criblage in silico d'inhibiteurs du récepteur c-Met Asses, Yasmine 03 October 2011 (has links) (PDF) L'enjeu des travaux effectués au cours de cette thèse est l'extraction in silico de molécules potentiellement intéressantes dans le processus d'inhibition du récepteur tyrosine kinase c-Met. La faculté de cette protéine à interagir dans les phénomènes d'embryogenèse et de réparation tissulaires rendent son inhibition cruciale dans les traitements contre les développements tumoraux où c-Met se trouve impliquée. Dans ce but, la stratégie que nous avons employée implique l'utilisation de plusieurs méthodes in silico de conception rationnelle de médicaments. Nous avons utilisé comme support les multiples structures cristallographiques publiées sur la ProteinData Base (PDB). Un travail de modélisation par homologie fut tout d'abord nécessaire pour combler les lacunes des structures cristallographiques collectées. Afin d'échantillonner au mieux l'espace conformationnel du récepteur kinase c-Met et de caractériser sa flexibilité, une longue campagne de simulation de Dynamique Moléculaire (DM) fut menée concernant les formes apo et holo des structures cristallographiques disponibles. Pour compléter ces simulations, une partie du travail consista à utiliser également la méthode des modes normaux de vibration (NM). De ces 2 approches (DM et NM), nous avons extrait un ensemble de 10 conformères considérés comme les plus représentatifs de l'espace conformationnel simulé pour la kinase c-Met et avons proposé un mode de fonctionnement de ce récepteur. Utilisant les conformations extraites de l'échantillonnage conformationnel, nous avons ensuite mené une importante campagne de criblage virtuel sur plusieurs chimiothèques constituant au total environ 70.000 composés. L'analyse des résultats de l'arrimage moléculaire nous a conduits à la sélection de plusieurs molécules intéressantes possédant théoriquement une bonne affinité pour la kinase c-Met. Ces molécules ont été soumises aux tests expérimentaux effectués par l'équipe de biologistes associée à nos travaux. [CHIM:CHEM] Chimie/Chemo-informatique bioinformatique modélisation moléculaire protéines tyrosine kinase c-Met cancer modélisation par homologie échantillonnage conformationnel dynamique moléculaire modes normaux de vibration docking moléculaire clustering criblage virtuel inhibiteurs
59	Modélisation et résolution par métaheuristiques coopératives : de l'atome à la séquence protéique Boisson, Jean-Charles 08 December 2008 (has links) (PDF) A travers cette thèse, nous montrons l'importance de la modélisation et de la coopération de métaheuristiques pour la résolution de problèmes réels en bioinformatique. Pour ce faire, deux problèmes ont été étudiés : le premier dans le domaine de la protéomique pour l'identification de protéines à partir de données spectrales et le second dans le domaine de l'analyse structurale de molécules pour le problème du docking moléculaire flexible. Ainsi, pour le premier problème, un nouveau modèle basé sur une comparaison directe des bases de données protéiques avec les données expérimentales brutes a été mise en place. L'approche associée a été intégrée au sein d'un moteur d'identification par empreinte de masse peptide appelé ASCQ_ME. Ce modèle d'identification a permis ensuite de proposer et de valider une modélisation pour le problème de " de novo protein sequencing " qui consiste à retrouver la séquence d'une protéine à partir seulement des données expérimentales. Il s'agit d'un modèle en trois étapes appelé SSO pour " Sequence ", " Shape " et " Order ". Après une étude de chacune de ces étapes, SSO a été implémenté et testé à travers trois métaheuristiques collaborant de manière séquentielle. Pour le second problème, une étude des nouvelles modélisations multi-objectives a été menée et a conduit à la définition d'un ensemble de huit modèles différents testés à l'aide d'algorithmes génétiques multi-objectifs parallèles. Une douzaine de configuration d'opérateurs génétiques ont été testé afin de mettre en évidence l'efficacité de l'hybridation des algorithmes génétiques avec des recherches locales. Pour chacune des parties, l'implémentation et la mise en place des collaborations fut possible grâce à la plateforme ParadisEO et notamment grâce à mes contributions à la partie ParadisEO-MO dédiée aux métaheuristiques à base de solution unique. L'ensemble de ces travaux a été soutenu par le PPF BioInformatique de l'Université des Sciences et Technologies de Lille et le projet ANR Dock. [CHIM:CHEM] Chimie/Chemo-informatique Modélisation coopération métaheuristique protéomique docking moléculaire flexible ParadisEO
60	Étude de l'anesthésie générale à l'échelle atomique par modélisation d'un homologue bactérien du récepteur nicotinique humain Laurent, Benoist 16 June 2014 (has links) (PDF) La découverte des anesthésiques représente un progrès majeur de la médecine, rendu possible par l'observation empirique de leurs effets. Des expériences ont révélées les neurorécepteurs comme cibles possibles des anesthésiques, des canaux localisés sur la membrane des cellules cibles aux terminaisons nerveuses. Le récepteur GLIC, un homologue bactérien du récepteur nicotinique humain, a été co-cristallisé en 2011 avec des anesthésiques généraux liés à lui. Dans cette thèse, j'utilise les simulations de dynamique moléculaire pour caractériser les interactions entre des anesthésiques généraux et différentes formes de GLIC. En 2011, le propofol et le desflurane ont été co-cristallisés dans un site de liaison intra-sous-unité localisé dans le domaine transmembranaire de GLIC. En 2013, il a été montré que le bromoforme se lie à ce site ainsi qu'à un site inter-sous-unités. Dans ce travail, je décris des simulations d'une nouvelle structure cristalline montrant un site de liaison situé dans le pore du canal. Des simulations d'innondation de GLIC par le bromoforme ont démontré l'accessibilité spontanée des sites expérimentaux dans un environnement non cristallin. Des calculs d'énergie libre mettent en évidence des différences d'énergie de liaison entre les sites et entre des mutants de GLIC. Un échantillonnage complet des poches de liaison m'a permis de détecter un autre site de liaison inter-sous-unité duquel l'accessibilité est semble modulée par un résidu en particulier. Les données accumulées au cours de ce projet fournissent une image grandissante de l'action des anesthésiques à l'échelle atomique. [STAT:AP] Statistics/Applications [STAT:AP] Statistiques/Applications modélisation moléculaire nicotinique pLGIC GLIC Epock

Search results