Spelling suggestions: "subject:"prédiction"" "subject:"rédiction""
31 |
Analyse et prédiction de la relation séquence - structure locale et flexibilité au sein des protéines globulairesBornot, Aurélie 05 November 2009 (has links) (PDF)
La prédiction in silico de la structure tridimensionnelle d'une protéine à partir de sa séquence en acides aminés constitue un défi scientifique d'intérêt majeur. Il est à présent admis que les structures protéiques peuvent être décrites à partir d'un répertoire limité de structures locales récurrentes. Cette observation a conduit au développement de techniques de prédiction de la structure 3D par assemblage de fragments. Ces techniques sont aujourd'hui parmi les plus performantes. Dans ce contexte, la prédiction des structures locales constitue une première étape vers la prédiction de la structure 3D globale d'une protéine. Mon travail de thèse porte principalement sur l'étude des structures protéiques locales à travers deux thèmes : (i) la prédiction des structures locales à partir de la séquence et (ii) l'analyse de la prédictibilité des structures locales en fonction de la flexibilité des structures protéiques. Ces études reposent sur une bibliothèque de 120 fragments chevauchants de 11 résidus de long précédemment développée au sein du laboratoire. Une méthode de prédiction des structures locales à partir de la séquence avait également été mise en place et permettait d'obtenir un taux de prédiction correct de 51 %. La prise en compte de données évolutionnaires couplée à l'utilisation de Machines à Vecteurs de Support a permis d'améliorer la prédiction des structures locales jusqu'à 63 % de prédiction correctes. De plus, un indice de confiance permettant d'évaluer directement la qualité de la prédiction et ainsi d'identifier les régions plus ardues à prédire a été mis au point. Par ailleurs, la structure des protéines n'est pas rigide. Ainsi, j'ai étendu notre analyse à l'étude la prédictibilité structurale des séquences d'acides aminés en fonction de leur flexibilité structurale au sein des protéines. Une analyse des propriétés dynamiques des structures locales a été menée en s'appuyant sur (i) les B-facteurs issus des expériences de cristallographie et (ii) les fluctuations du squelette polypeptidique observées lors de simulations de dynamique moléculaire. Ces analyses de la relation flexibilité-structure locale ont conduit au développement d'une stratégie de prédiction originale de la flexibilité à partir de la séquence. Nos différentes approches constituent une première étape vers la prédiction de la structure tridimensionnelle globale d'une protéine.
|
32 |
Information incomplète et regret interne en prédiction de suites individuellesStoltz, Gilles 27 May 2005 (has links) (PDF)
Le domaine de recherche dans lequel s'inscrit ce travail de thèse est la théorie de la prédiction des suites individuelles. Cette dernière considère les problèmes d'apprentissage séquentiel pour lesquels on ne peut ou ne veut pas modéliser le problème de manière stochastique, et fournit des stratégies de prédiction très robustes. Elle englobe aussi bien des problèmes issus de la communauté du machine learning que de celle de la théorie des jeux répétés, et ces derniers sont traités avec des méthodes statistiques, incluant par exemple les techniques de concentration de la mesure ou de l'estimation adaptative. Les résultats obtenus aboutissent, entre autres, à des stratégies de minimisation des regrets externe et interne dans les jeux à information incomplète, notamment les jeux répétés avec signaux. Ces stratégies s'appliquent au problème d'ajustement séquentiel des prix de vente, ou d'allocation séquentielle de bande passante. Le regret interne est ensuite plus spécifiquement étudié, d'abord dans le cadre de l'investissement séquentiel dans le marché boursier, pour lequel des simulations sur des données historiques sont proposées, puis pour l'apprentissage des équilibres corrélés des jeux infinis à ensembles de stratégies convexes et compacts.
|
33 |
Apprentissage de Modèles pour la Classification et la Recherche d'ImagesMensink, Thomas 26 October 2012 (has links) (PDF)
Nous assistons actuellement à une explosion de la quantité des données visuelles. Par exemple, plusieurs millions de photos sont partagées quotidiennement sur les réseaux sociaux. Les méthodes d'interprétation d'images vise à faciliter l'accès à ces données visuelles, d'une manière sémantiquement compréhensible. Dans ce manuscrit, nous définissons certains buts détaillés qui sont intéressants pour les taches d'interprétation d'images, telles que la classification ou la recherche d'images, que nous considérons dans les trois chapitres principaux. Tout d'abord, nous visons l'exploitation de la nature multimodale de nombreuses bases de données, pour lesquelles les documents sont composés d'images et de descriptions textuelles. Dans ce but, nous définissons des similarités entre le contenu visuel d'un document, et la description textuelle d'un autre document. Ces similarités sont calculées en deux étapes, tout d'abord nous trouvons les voisins visuellement similaires dans la base multimodale, puis nous utilisons les descriptions textuelles de ces voisins afin de définir une similarité avec la description textuelle de n'importe quel document. Ensuite, nous présentons une série de modèles structurés pour la classification d'images, qui encodent explicitement les interactions binaires entre les étiquettes (ou labels). Ces modèles sont plus expressifs que des prédicateurs d'étiquette indépendants, et aboutissent à des prédictions plus fiables, en particulier dans un scenario de prédiction interactive, où les utilisateurs fournissent les valeurs de certaines des étiquettes d'images. Un scenario interactif comme celui-ci offre un compromis intéressant entre la précision, et l'effort d'annotation manuelle requis. Nous explorons les modèles structurés pour la classification multi-étiquette d'images, pour la classification d'image basée sur les attributs, et pour l'optimisation de certaines mesures de rang spécifiques. Enfin, nous explorons les classifieurs par k plus proches voisins, et les classifieurs par plus proche moyenne, pour la classification d'images à grande échelle. Nous proposons des méthodes d'apprentissage de métrique efficaces pour améliorer les performances de classification, et appliquons ces méthodes à une base de plus d'un million d'images d'apprentissage, et d'un millier de classes. Comme les deux méthodes de classification permettent d'incorporer des classes non vues pendant l'apprentissage à un coût presque nul, nous avons également étudié leur performance pour la généralisation. Nous montrons que la classification par plus proche moyenne généralise à partir d'un millier de classes, sur dix mille classes à un coût négligeable, et les performances obtenus sont comparables à l'état de l'art.
|
34 |
Conception d'une mesure automatisée de détection des changements alimentaires chez le porcGermain, Simon January 2015 (has links)
Le mandat consiste à développer un outil afin de détecter les désordres alimentaires chez le porc, dans le but de prévenir des problèmes de croissance ou de maladie potentiels. L'outil proposé analyse les données récoltées sur 5 jours consécutifs (période mémoire) pour prédire la consommation de la journée suivante. Il utilise une régression polynomiale généralisée avec contraintes et lissage. L'outil calcule ensuite la différence entre la prédiction et les observations.
|
35 |
Utilisation de modèles analytiques et numériques pour la prédiction du comportement sous charge statique de dispositifs de retenue de ponts routiers de niveau PL-2 en béton armé de barre d'armature de polymères renforcés de fibres de verreFortier, Alexandre January 2014 (has links)
Ce mémoire présente les résultats de calculs analytiques de prédiction du comportement de dispositifs de retenue de niveau PL-2 armé d'armature en polymères renforcés de fibres de verre (PRFV) soumis aux essais de chargement quasi statique horizontal. L'un des modèles analytiques à l'étude est le calcul de la charge ultime que peut reprendre un dispositif de retenue en fonction des dimensions de la fissure au niveau de la connexion. Le deuxième modèle analytique à l'étude est le calcul de prédiction de la relation charge-déflexion en tête de muret. La collaboration entre le Ministère des Transports du Québec (MTQ), le Ministère des Transports de l'Alberta et l'Université de Sherbrooke a permis d'effectuer des essais quasi statiques sur plusieurs configurations durant les dernières années. Les configurations de dispositifs provenant du MTQ sont des barrières de type 210 et 311 dont les murets et les dalles sont entièrement armés de barres en PRFV. Les configurations des dispositifs de l'Alberta sont quant à eux des dispositifs de type S-1642 et S-1650 dont les murets sont armés de barres en PRFV et les dalles sont armées de barres d'acier enduit d'époxy. Grâce à cette banque de données, il est possible d'effectuer l'étude des modèles sur différentes configurations et ainsi déterminer certaines de leurs limites. De plus, une modélisation par éléments finis de la configuration de dispositif de retenue de type 311 (PL-2) a été effectuée. Le dispositif a été modélisé en trois dimensions avec le logiciel ADINA. De ce modèle, une comparaison avec les données expérimentales a été effectuée afin de le valider. De plus, une étude paramétrique a été effectuée sur l'influence des résistances du béton de la dalle et du muret et du module d'élasticité des barres en polymères renforcés de fibres (PRF). En effet, des bétons de 35 MPa et 50 MPa ont été utilisés afin de représenter trois cas de combinaison de résistance en compression des bétons. Finalement, trois grades de modules élastiques ont été utilisés sur le dispositif ayant un béton de 35 MPa au niveau de la dalle et un béton de 50 MPa au niveau du muret (combinaison la plus courante) afin d'étudier l'effet du module élastique des barres.
|
36 |
Modèles probabilistes et statistiques pour la conception et l'analyse des systèmes de communicationsBermolen, Paola 26 February 2010 (has links) (PDF)
Dans cette thèse nous abordons deux problématiques différentes : la prédiction et la classification de trafic et les mécanismes d'accès dans les réseaux MANETs. Dans la première partie de la thèse, nous abordons le problème de la prédiction et la classification du trafic. Sur la base des observations du passé et sans considérer aucun modèle en particulier, nous analysons le problème de la prédiction en ligne de la charge sur un lien. Concernant la classification du trafic, nous nous concentrons principalement sur des applications P2P, et particulièrement la télévision P2P (P2P-TV). Dans les deux cas, nous employons la technique de Support Vector Machines (SVM). Les algorithmes que nous proposons fournissent des résultats très précis. De plus, ils sont robustes et leur coût est extrêmement bas. Ces propriétés font que nos solutions soient particulièrement adaptées à des applications en temps réel. Dans la deuxième partie de la thèse, nous abordons deux problèmes différents liés aux mécanismes d'accès dans les réseaux MANETs, et en particulier, nous nous concentrons sur CSMA. Nous présentons d'abord les différents modèles existants pour CSMA et nous identifions leurs principaux points faibles. Des solutions possibles sont proposées, bases sur les outils de la géométrie aléatoire. Nous abordons ensuite le problème de QoS dans CSMA et nous proposons deux mécanismes différents permettant de garantir un débit minimum pour chaque transmission admise. Le but principal étant d'identifier le meilleur mécanisme dans un scénario donné comparé au protocole CSMA.
|
37 |
Bioinformatique et épissage dans les pathologies humaines / Bioinformatics and splicing in human diseasesDesmet, François-Olivier 07 December 2010 (has links)
Découvert en 1977, l'épissage est une étape de maturation post-transcriptionnelle consistant à rabouter les exons et éliminer les introns d'un ARN pré-messager. Pour que l'épissage soit correctement pris en charge par l'épisome et ses protéines auxiliaires, différents signaux sont présents le long de la séquence de l'ARN pré-messager. Il est maintenant reconnu que près de la moitié des mutations pathogènes chez l'homme impactent l'épissage, aboutissant à un dysfonctionnement du gène. Il est ainsi indispensable pour les biologistes d'être capables de détecter ces signaux sur une séquence génomique.Cette thèse a donc pour but de concevoir de nouveaux algorithmes permettant d'apporter la puissance de calcul des ordinateurs au service de la biologie de l'épissage. La solution proposée, Human Splicing Finder (HSF), est capable de prédire les trois types de signaux d'épissage à partir d'une séquence quelconque extraite du génome humain. Nous avons évalué l'efficacité de prédiction d'HSF dans l'ensemble des situations associées à des mutations pathogènes pour lesquelles il a été démontré expérimentalement leur impact sur l'épissage et par rapport aux autres algorithmes de prédiction. Parallèlement à ces apports directs tant pour la connaissance des processus biologiques de l'épissage que pour le diagnostic, les nouvelles approches thérapeutiques génotype-spécifiques peuvent également bénéficier de ces nouveaux algorithmes. Ainsi HSF permet de mieux cibler les oligonucléotides anti-sens utilisés pour induire le saut d'exon dans la myopathie de Duchenne et les dysferlinopathies.La reconnaissance récente de l'intérêt majeur de l'épissage dans des domaines aussi variés que la recherche fondamentale, la thérapeutique et le diagnostic nécessitaient un point central d'accès aux signaux d'épissage. HSF a pour objet de remplir ce rôle, en étant régulièrement mis à jour pour intégrer de nouvelles connaissances, et est d'ores et déjà reconnu comme un outil de référence. / Discovered in 1977, splicing is a post-transcriptional maturation process that consists in link-ing exons together and removing introns from a pre-messanger RNA. For splicing to be cor-rectly undertaken by the spliceosome and its auxiliary proteins, several signals are located along the pre-messanger RNA sequence. Nearly half of pathogenous mutations in humans are now recognized to impact splicing and leading to a gene dysfunction. Therefore it is es-sential for biologists to detect those signals in any genomic sequence.Thus, the goals of this thesis were to conceive new algorithms: i) to identify splicing signals; ii) to predict the impact of mutations on these signals and iii) to give access to this information to researchers thanks to the power of bioinformatics. The proposed solution, Human Splicing Finder (HSF), is a web application able to predict all types of splicing signals hidden in any sequence extracted from the human genome. We demonstrated the prediction's efficiency of HSF for all situations associated with pathogenous mutations for which an impact on splicing has been experimentally demonstrated. Along with these direct benefits for the knowledge of biological processes for splicing and diagnosis, new genotype-specific therapeutic approaches can also benefit from these new algorithms. Thus, HSF allows to better target antisense olignucleotides used to induce exon skipping in Duchenne myopathy and dysferlinopathies.The recent recognition of the major interest of splicing in various domains such as fundamen-tal research, therapeutics and diagnosis needed a one stop shop for splicing signals. HSF has for object to fulfill this need, being regularly updated to integrate new knowledge and is already recognized as an international reference tool.
|
38 |
Développement d’outils de prédiction des complications et des récidives de l’infection à Clostridium difficile / Development and validation of clinical prediction tool for complicated and recurrent Clostridium difficile infectionAbou Chakra, Claire Nour January 2017 (has links)
Résumé : Depuis 2002, une augmentation des taux d’issues défavorables de l’infection à Clostridium difficile (ICD) a été attribuable à l’émergence de la souche NAP1/BI/R027. Il est indispensable d’identifier les facteurs de risque de développer des complications (ICDc) et des récidives (ICDr), et de pouvoir les prédire lors du diagnostic afin d’optimiser le traitement. Le projet de recherche a comme objectifs: i) l’identification des facteurs de risque pour le développement d’ICDc et ICDr et ii) le développement et la validation d’un outil de prédiction à partir de variables mesurées dans les 48h du diagnostic d’une ICD. Méthode: Une cohorte multicentrique prospective de patients adultes hospitalisés pour une ICD. Les données suivantes ont été recueillies: i) démographiques; ii) comorbidités; iii) traitements et procédures reçus dans les 2 mois avant le diagnostic; iv) paramètres cliniques, vi) biochimiques, hématologiques et vii) microbiologiques (ribotypage). Un suivi à 30 et 90 jours a été effectué. Les facteurs de risque ont été identifiés par des modèles multivariés de régression logistique et d'analyse de survie. La méthode de validation croisée a été utilisée pour la dérivation et la validation interne. Différents modèles ont été comparés selon l’aire sous la courbe ROC (ASC), l’erreur de prédiction (EP) et les paramètres de performance. Un score prédictif a été dérivé à partir du modèle optimal. Résultats: Au total, 1380 patients ont été inclus dont 96% suivis 90 jours. Une ICDc a été observée chez 8% et une ICDr chez 26%. La souche R027 représentait 52% des souches caractérisées. Les ICDc sont associées à un âge ≥80 ans, un rythme cardiaque >90/min, un rythme respiratoire >20/min, globules blancs (GB) <4 et ≥20×10[indice supérieur 9]/L, albumine sérique <25 g/L, urée sérique >7 mmol/L, et CRP ≥150 mg/L. Les ICDr sont associés à l'âge ≥ 65 ans, à l’exposition à des macrolides et/ou clindamycine, CRP ≥150 mg/L, R027, et une hospitalisation ≥14 jours suivant l'ICD. Un sous-groupe de 1038 cas complets a été utilisé pour la modélisation prédictive. Le modèle optimal contenait l’âge ≥80 ans, GB ≥12×10[indice supérieur 9]/L, albumine sérique <26 g/L et urée sérique >7 mmol/L, avec une ASC de 0,84 et une EP de 6%. Un score variant entre 0 et 17 points a été construit. En validation, un score >10 points présentait une sensibilité de 50% (IC[indice inférieur 95]% = 28-72), une spécificité de 85% (81-89), une valeur prédictive positive de 17% (7-27) et une valeur prédictive négative de 96% (94-99). Conclusions: En utilisant une large cohorte prospective multicentrique et plusieurs étapes de modélisation prédictive et de validation interne, nous avons identifié les facteurs associés aux ICDc et ICDr et dérivé un score prédictif des ICDc ayant une performance acceptable. Au moment du diagnostic de l’ICD, ces facteurs sont à considérer pour envisager le traitement le plus optimal afin de prévenir ces issues. / Abstract : A significant increase in Clostridium difficile infection (CDI) unfavourable outcomes was observed since 2002 and was associated with the emergence of the strain NAP1/BI/R027. Identifying patients at high risk of developing complications (cCDI) and recurrences (rCDI), and predicting these outcomes early in the course of illness could improve clinical decision-making. The main objectives of this research were to: i) identify risk factors for cCDI and rCDI, and ii) develop and validate a clinical prediction rule for cCDI using predictors measured within 48h of CDI diagnosis. Methods: Adult in patients with confirmed CDI diagnosis in 10 acute care hospitals, were enrolled in a prospective cohort. Data at enrolment were collected : demographics, underlying illnesses, past medical and drug history (two months prior to CDI), clinical signs, blood tests, and C. difficile strain type. A follow-up was completed on day 30 and 90 after enrolment. Risk factors were identified by multivariate logistic regression and survival analyses. Split-sample technique was used for training and validation sets. Several predictive models were derived and assessed in both sets by AUC/ROC, prediction error (PE), and performance parameters. A predictive score was built using the optimal predictive model. Results: A total of 1380 patients were enrolled and 96% had 90 days follow -up. cCDI was observed in 8% and rCDI in 26%. R027 was identified in 52% of patients. Age ≥80 years, heart rate >90/min, respiratory rate >20/ min, white cell count <4 or ≥20 × 109/L, albumin <25 g/L, blood urea nitrogen >7 mmol/L, and C-reactive protein (CRP) ≥150 mg/L were independently associated with cCDI. Age ≥65 years, increased CRP, expos ure to macrolides/clindamycin, R 027, and prolonged hospital stay were associated with rCDI. A sub-group of 1038 complete cases was used for predictive modelling. In the training set, the optimal model with 6% PE and AUC 0.84 included age≥80, WBC≥12x10 [superscript 9]/L, BUN>7 mmol/L, and serum albumin <26 g/L. A predictive score was built with minimum 0 and maximum 17 points. A score >10 points showed 50% sensitivity (95%CI, 28-72), 85% specificity (81-89), 17% (7-27) positive predictive value, and 96% (94-99) negative predictive value. Conclusion: Through a large multicenter prospective cohort and multiple modelling approached, independent risk factors of complications and recurrence of CDI were identified. We derived a predictive score that included easily available meas ures at the bedside and showed acceptable performance. At time of CDI diagnosis, these predictors could be used by clinicians to identify patients at higher risk and adjust for the most optimal treatment that could prevent unfavourable outcomes.
|
39 |
Structural bioinformatics analysis of the family of human ubiquitin-specific proteasesZhu, Xiao January 2007 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
|
40 |
Un paradigme d'expérimentation au laboratoire de sciences pour l'identification et l'optimisation statistique d'un modèle algébrique par l'interaction visuo-graphiqueTouma, Georges January 2006 (has links)
Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal.
|
Page generated in 0.0647 seconds