Global ETD Search

1	Ανάλυση και μοντελοποίηση βιολογικών δικτύων με χρήση δεδομένων από μεγάλης κλίμακας τεχνικές της μοριακής βιολογίας Δημητρακοπούλου, Κωνσταντίνα 02 April 2014 (has links) Στην εποχή της Συστημικής Ιατρικής, οι τεχνολογίες μαζικής καταγραφής της γονιδιακής και miRNA έκφρασης (π.χ. μικροσυστοιχίες, RNA-seq) αλλά και οι τεχνολογίες ανίχνευσης πρωτεϊνικών αλληλεπιδράσεων (π.χ. yeast two-hybrid, co-immunoprecipitation) απελευθέρωσαν τεράστια ποσά δεδομένων για την αποσαφήνιση των μηχανισμών των πολύπλοκων ασθενειών. Η παρούσα διδακτορική διατριβή συμβάλλει προσφέροντας νέες υπολογιστικές μεθοδολογίες και εργαλεία και παραθέτοντας νέες αξιόπιστες βιολογικές υποθέσεις για την επίλυση σύνθετων ασθενειών του ανθρώπου. Καταρχήν, αποκτήθηκε γνώση του θεωρητικού υπόβαθρου διάφορων μέγαλης κλίμακας μοριακών τεχνικών, τεχνικών εξόρυξης δεδομένων όπως η ομαδοποίηση καθώς και γραφοθεωρητικών προσεγγίσεων. Έπειτα, σχεδιάστηκε μια μεθοδολογία για συνδυασμό πρωτεωμικών και μεταγραφωμικών δεδομένων και αναπτύχθηκε ένα αλγόριθμος ομαδοποίησης γράφων, που ονομάζεται Detect Modules (DetMod), ο οποίος ανιχνεύει κοινοτήτες/υπο-δομές (modules) πρωτεϊνών με διακριτή βιολογική λειτουργία και έντονη δυναμική συσχέτιση σε επίπεδο έκφρασης. Η απόδοση και αξιοπιστία της μεθόδου εξετάστηκε και πιστοποιήθηκε στον απλό οργανισμό-μοντέλο Saccharomyces cerevisiae προτού εφαρμοστεί στην επίλυση προβλημάτων της φαρμακογονιδιωματικής όπως η απόκριση του μεταγραφήματος στην θεραπεία με ταμοξιφένη στην περίπτωση του θετικού στην απόκριση σε οιστρογόνα καρκίνου του μαστού. Αποτέλεσμα της μεθόδου είναι δυναμικοί βιοδείκτες της απόκρισης στην ταμοξιφένη με μορφή υπο-δομών αντί μεμονωμένων πρωτεϊνών. Παράλληλα, στα πλαίσια της σύγχρονης βιβλιογραφίας όπου οι εμπλεκόμενοι μηχανισμοί του καρκίνου αλληλοεπικαλύπτονται με αυτούς της γήρανσης, μια προσαρμοσμένη μεθοδολογία ανάλογη με την προαναφερόμενη εφαρμόστηκε στη μελέτη του φαινομένου της γήρανσης. Τα αποτελέσματα της μεθόδου σε πολλαπλούς ιστούς του ποντικού, και σε δεύτερο στάδιο μεμονωμένα στον καρδιακό ιστό, ανέδειξαν ποια μοριακά μονοπάτια εμπλέκονται στη γήρανση όλων των ιστών και ποια εξειδικεύονται σε ένα μόνο ιστό. Στην περίπτωση του καρδιακού ιστού βιοδείκτες σε μορφή υπο-δομών αποτυπώνουν τα εμπλεκόμενα μονοπάτια αλλά και τη συνεργατική δράση και υπαιτιότητα των miRNA. Σε επόμενο στάδιο μελετήθηκαν οι μηχανισμοί απόκρισης στη γρίπη Α (Η1Ν1) μέσω της ανακατασκευής Γονιδιακών Ρυθμιστικών Δικτύων (ΓΡΔ) που αναπαριστούν τις χρονικά μεταβαλλόμενες αιτιατές σχέσεις μεταξύ μοριακών μονοπατιών από χρονοσειρές γονιδιακής έκφρασης. Το χρονικά μεταβαλλόμενο ΓΡΔ προέκυψε μέσα από μια μέθοδο συνδυασμού πολλαπλών αλγορίθμων ανακατασκευής από διαφορετικές κλάσεις του μαθηματικού φορμαλισμού. Η μέθοδος προσέφερε νέα γνώση για τη συνδεσιμότητα των μοριακών μονοπατιών μέχρι και την 60η ημέρα μετά την εισβολή του ιού στον πνευμονικό ιστό του ποντικού από το στάδιο της φυσικής ανοσίας, στη χυμική ανοσία και τέλος στη διαδικασία αποκατάστασης. Τέλος, παρουσιάζεται ο OLYMPUS, ένας νέος υβριδικός μη επιβλεπόμενος αλγόριθμος ομαδοποίησης που εφαρμόστηκε σε χρονοσειρές γονιδιακής έκφρασης σε απόκριση στη γρίπη Α (Η1Ν1). Ο OLYMPUS χρησιμοποιεί τον Διαφορεξελικτικό αλγόριθμο ως στρατηγική βελτιστοποίησης ενός ασαφούς αλγορίθμου ομαδοποίησης και παράλληλα ενσωματώνει το κριτήριο Bayesian Information με σκοπό την αυτόματη εύρεση του βέλτιστου αριθμού ομάδων. Η ανάλυση των εξαγόμενων ομάδων προσέφερε νέες υποθέσεις σχετικά με τη δυναμική πολλών μοριακών μονοπατιών που εμπλέκονται στην ανοσολογική απόκριση και για πρώτη φορά αναδείχθηκε ο ρόλος των κατασταλμένων διεργασιών στο κινητικό μοντέλο της γρίπης Α. / In the Systems Medicine era, the large scale gene and miRNA expression techniques (e.g. microarrays, RNA-seq) as well as techniques for the detection of protein interactions (e.g. yeast two-hybrid, co-immunoprecipitation) have released mass amounts of data for deciphering the underlying mechanisms of complex diseases. The present PhD thesis contributes by providing new computational methodologies and tools, and by offering novel biological hypotheses for solving complex human diseases. Initially, a good grasp of the current high-throughput molecular techniques was acquired along with familiarization with data mining tecniques such as clustering and with graph-theoretic approaches. Then, a methodology for integrating proteomic and transcriptomic data was designed and a graph clustering algorithm was developed, called Detect Modules (DetMod), which detects, on the composite transcriptome-proteome network, communities/modules with distinct biological function and enhanced association at the dynamic expression level. The performance and reliability of the method was tested and validated in the simple model organism Saccharomyces cerevisiae before solving pharmacogenomics problems such as the transcriptome response mechanisms during tamoxifen response in estogen-response-positive breast cancer cases. The output of the method was dynamic biomarkers of tamoxifen response in the form of modules instead of individual proteins. In parallel, the recent literature associates the mechanisms involved in cancer with those involved in aging. In this context, an adapted methodology similar to the aforementioned was applied in the study of aging. The findings of the method in multiple mouse tissues and on second level in cardiac tissue highlighted the cross-tissue aging molecular pathways as well as the tissue-specific. In the case of cardiac tissue modular biomarkers captured the underlying tissue-specific pathways as well as the synergism of miRNAs. On next level, the response mechanisms to Influenza A (H1N1) were explored through the reconstruction of Gene Regulatory Networks (GRNs), which in turn represent the time-varying causal pathway interactions based on time series expression data. The final time-varying GRN was derived from an ensemble of reconstruction algorithms from different classes of mathematical formalism. The method offered new knowledge for the pathway interactivity until the day 60 after the viral invasion in the mouse lung tissue, from the innate response to the humoral and the late repair phase. Finally, OLYMPUS is presented, a novel unsupervised hybrid clustering algorithm which was applied at time series expression data in response to Influenza A (H1N1). OLYMPUS uses the Differential Evolutionary algorithm as optimization strategy of a fuzzy clustering algorithm and in parallel integrates the Bayesian Information Criterion in order to detect automatically the optimal cluster number. The cluster analysis offered new hypotheses regarding the dynamics of several molecular pathways and for the first time, the role of suppressed biological processes was highlighted in the Influenza A kinetic model. Βιολογικά δίκτυα Συστημική βιολογία 570.285 Biological networks Systems biology
2	Σχεδιασμός & ανάπτυξη μιας μετα-βάσης δεδομένων για το δίκτυο πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο Γιουτλάκης, Άρης 26 July 2013 (has links) Η αποσαφήνιση της σχέσης του γονοτύπου με το φαινότυπο ενός οργανισμού είναι μια από τις μεγαλύτερες προκλήσεις των επιστημών ζωής σήμερα. Για την επίτευξη του στόχου αυτού, η κατανόηση της δομής και της ρύθμισης του δικτύου πρωτεϊνικών αλληλεπιδράσεων (ΔΠΑ) είναι ένα από τα καθοριστικά στάδια αυτής της συσχέτισης. Πρώτο βήμα προς την κατεύθυνση αυτή αποτελεί η λεπτομερής και ακριβής ανακατασκευή του ΔΠΑ. Πειραματικά αποτελέσματα που υποστηρίζουν πρωτεϊνικές αλληλεπιδράσεις δημοσιεύονται στη βιβλιογραφία, από όπου η γνώση αυτή εξορύσσεται είτε μέσω άμεσης καταγραφής από ερευνητές είτε μέσω υπολογιστικών αλγορίθμων ανάλυσης κειμένου, και αποθηκεύεται σε πρωτογενείς βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων (ΒΔΠΑ). Για το ΔΠΑ στον άνθρωπο, υπάρχουν αρκετές ΒΔΠΑ, οι οποίες λόγω διαφορετικών στόχων, τρόπων εξόρυξης γνώσης από τη βιβλιογραφία και διαφορετικής διαχείρισης της βάσης, παρουσιάζουν μικρή επικάλυψη, περιγράφουν τα δεδομένα τους με ασύμβατο μεταξύ τους τρόπο και ορολογία, και ορίζουν τις πρωτεϊνικές αλληλεπιδράσεις μέσω διαφορετικών επιπέδων αναφοράς της γονιδιακής πληροφορίας. Για την ενοποίηση δεδομένων πρωτεϊνικών αλληλεπιδράσεων από διάφορες πρωτογενείς βάσεις έχουν αναπτυχθεί μετα-βάσεις, οι οποίες προσπαθούν να ξεπεράσουν τα προβλήματα που προκύπτουν από την ετερογένεια των ΒΔΠΑ. Και στην περίπτωση των μεταβάσεων, όμως, ανακύπτουν προβλήματα, που αφορούν: α) στο ότι το δίκτυο ορίζεται με βάση τις πρωτεϊνικές αλληλεπιδράσεις και όχι τις πρωτεΐνες-κόμβους του ΔΠΑ, β) στον πλεονασμό κωδικών ταυτοποίησης των πρωτεϊνών στα διάφορα επίπεδα αναφοράς της γονιδιακής πληροφορίας, γ) στην ετερογένεια του τρόπου κανονικοποίησης των κωδικών ταυτοποίησης πρωτεϊνών, δ) στην υστέρηση της ανανέωσής τους σε σχέση με τις πρωτογενείς βάσεις και ε) στην επιλογή των δεδομένων που καταγράφονται από τις ΒΔΠΑ. Ο σκοπός αυτής της εργασίας είναι ο σχεδιασμός και η ανάπτυξη μιας μετα-βάσης δεδομένων για το δίκτυο πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο, PICKLE, που να προσφέρει επαρκείς λύσεις στα προβλήματα αυτά. Η μεγάλη διαφορά σε σχέση με τις υπάρχουσες μετα-βάσεις είναι ο ορισμός του ΔΠΑ με βάση το αξιολογημένο πλήρες ανθρώπινο πρωτεϊνωμα (Reviewed complete Human Proteome), όπως αυτό ορίζεται από τη βάση δεδομένων γνώσης πρωτεϊνικής πληροφορίας UniProt ΚΒ. Για τις πρωτεΐνες αυτές αναζητήθηκε η σχετική πληροφορία αλληλεπιδράσεων στις πέντε κύριες δημόσιες βάσεις πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο, DIP, HPRD, IntAct, MINT και BioGRID. Τα προβλήματα του πλεονασμού και της κανονικοποίησης λύθηκαν μέσω της ανάπτυξης μίας κατάλληλης γονιδιακής οντολογίας, η οποία μας επέτρεψε να συνδέσουμε το πλήρες ανθρώπινο πρωτεϊνωμα με τα υπόλοιπα επίπεδα αναφοράς της γενετικής πληροφορίας, δρώντας παράλληλα ως ένας ευέλικτος και ακριβής μηχανισμός κανονικοποίησης. Για τη γρήγορη ανανέωση των δεδομένων της μετα-βάσης, αναπτύχθηκε μια αυτοματοποιημένη διαδικασία σύνδεσης και ενημέρωσής της από τις PPIDBs. Η πρώτη έκδοση της PICKLE κατέγραψε 83720 αλληλεπιδράσεις για 12418 UNIPROT IDs από το σύνολο των 20225 του πλήρους ανθρώπινου πρωτεϊνωματος, που υποστηρίζονται από 27.590 δημοσιεύσεις. Η PICKLE θα εμπλουτιστεί με ένα φιλικό προς το χρήστη γραφικό περιβάλλον και θα συνδεθεί με εργαλεία ανάλυσης δικτύων και ομικών δεδομένων, για να αποτελέσει πολύτιμο εργαλείο σε βιοϊατρικές μελέτες και εφαρμογές. / The elucidation of the underlying relationship between an organism’s genotype and its expressed phenotype is currently one the greatest challenges faced by life sciences and biology in general. In order to achieve that, the better understanding of the inner structure and regulation mechanisms of the protein-protein interaction (PPI) networks is of great importance. The first step towards that goal is the detailed and accurate reconstruction of the PPI network itself. The scientific literature is constantly being updated with new experimental results supporting PPI evidence, which in turn are fed into primary PPI databases (PPIDB) by the use of either curators or text mining algorithms. Currently there is a large number of PPIDB referring to the human PPIs. Since many of them have different goals, literature curation methods, and database administration strategies, it is not surprising that they also exhibit a limited PPI overlap and incompatible terminology for PPI intera\-ctors, i.e. use of arbitrary levels of genetic organization. A number of meta-databases have been developed in order to achieve integrated overviews of PPI networks while circumventing the problems inherent in the field of primary PPI databases. Unfortunately, meta-databases have a number of issues of their own, such as: a) top-down network definition based on protein interactions instead of interactors, b) protein identifier redundancy in all levels of reference, c) the use of {\it ad hoc} normalization methods, d) infrequent updating and d) insufficient information stored. The major goal of this thesis is the design and implementation of PICKLE (Protein Interaction Knowledge Base), a meta-database for the human PPI network created specifically to tackle the aforementioned problems. PICKLE’s novelty stems from its unique approach to PPI network definition, following a bottom-up reconstruction method based on UniProt’s reviewed complete human proteome (RCHP) definition. Five primary PPIDB (DIP, HPRD, IntAct, ΜΙΝΤ and BioGRID) were mined for interactions explicitly constrained by UniProt’s proteome definition. Furthermore, in order to tackle the issues of redundancy and inadequate normalization, a specific ontology was designed which allowed linking of the RCHP set with all the other levels of genetic organization while also serving as an agile yet accurate normaliza\-tion mechanism. In order to address the issue of updating, an autonomous means of data collection and integration was developed. PICKLE’s maiden release recorded 83720 direct PPIs involving 12418 UniProt IDs (out of 20225) supported by a total of 27590 publications. PICKLE, an evolving valuable bioinformatics for biomedical research and red biotechnology applications tool will soon be updated with a user-friendly interface and upgraded by linking it with network analysis software and various omics datasets. Βιοπληροφορική Συστημική βιολογία 025.065 726 44 Bioinformatics Systems biology Biological databases Protein interaction networks
3	Η μεταβολομική ως εργαλείο κλινικής πρόγνωσης : Συγκριτική ανάλυση μεταβολικού προτύπου αγοριών και κοριτσιών από τεχνητή γονιμοποίηση για τη διερεύνηση προδιάθεσης σε μεταβολικές διαταραχές Τελώνης, Αριστείδης 30 July 2014 (has links) Η ενδοκυττάρια έγχυση σπέρματος (ICSI) εισήχθη ως μέθοδος υποβοηθούμενης αναπαραγωγής (ΑRT) κυρίως για την αντιμετώπιση της ανδρικής στειρότητας. Όμως, λόγω των υψηλών ποσοστών επιτυχίας, και παρά τις αυξανόμενες ανησυχίες για τους κινδύνους από τη σημαντική ανθρώπινη παρεμβολή στο γονιδίωμα, το επιγονιδίωμα και την ανάπτυξη των παιδιών, προτιμάται ακόμα και σε περιπτώσεις όπου δεν απαιτείται ιατρικά. Από τις λίγες σήμερα συστηματικές μελέτες παιδιών από ART, καταγράφεται αυξημένο ποσοστό προδιάθεσης τους σε ασθένειες που σχετίζονται με κακό καρδιομεταβολικό πρότυπο στην ενήλικη ζωή. Στόχος της εργασίας ήταν η διερεύνηση της δυνατότητας χρήσης της μεταβολομικής ανάλυσης για τον πρώϊμο και έγκυρο προσδιορισμό σχετικών διαταραχών σε δείγματα πλάσματος προεφηβικών κοριτσιών και αγοριών από ΙCSI, που επιλέχτηκαν από ένα συστηματικά χαρακτηρισμένο σύνολο παιδιών μελέτης της Α’ Παιδιατρικής Κλινικής, Νοσοκομείου «Αγία Σοφία», Ιατρικής Σχολής, ΕΚΠΑ. ΥΛΙΚΑ ΚΑΙ ΜΕΘΟΔΟΙ: Τα μεταβολικά πρότυπα πλάσματος (α) 10 κοριτσιών από ΙCSI και 10 από φυσιολογική γονιμοποίηση (NC) και (β) 16 αγοριών από ΙCSI και 16 από NC ποσοτικοποιήθηκαν με χρωματογραφία αερίων – φασματομετρία μάζας (GC-MS). Μετά από την ταυτοποίηση κορυφών και την κατάλληλη κανονικοποίηση των προτύπων, 86 πρότυπα 70 μεταβολιτών στα κορίτσια και 92 πρότυπα 80 μεταβολιτών στα αγόρια αναλύθηκαν ξεχωριστά, και συγκριτικά με αλγορίθμους πολυπαραμετρικής στατιστικής ανάλυσης των λογισμικών TM4-MeV (v.4.9.0), και ΧLSTAT (v.2013.4.03). Οι διαφορές στο πρότυπο σύστασης του πλάσματος σε μικρού μεγέθους μεταβολίτες μεταξύ των ΙCSI και ΝC ομάδων σε κορίτσια και αγόρια και μεταξύ των δύο φύλων οπτικοποιήθηκαν σε κατάλληλα ανακατασκευασμένο από τη βιβλιογραφία και σχετικές βάσεις δεδομένων μεταβολικό δίκτυο πολλών ιστών. ΑΠΟΤΕΛΕΣΜΑΤΑ: Στα κορίτσια, ο αλγόριθμος μερικών ελαχίστων τετραγώνων-διακριτής ανάλυσης (PLS-DA) κατέδειξε σαφή διαχωρισμό των μεταβολικών πρoτύπων μεταξύ των ομάδων ΙCSI και NC. Ο διαχωρισμός αυξάνεται με το συνυπολογισμό των βιοχημικών μετρήσεων. Στα αγόρια, η PLS-DA των μεταβολικών ή και βιοχημικών προτύπων κατέδειξε επίσης διαχωρισμό, αν και μικρότερο, σε σχέση με κορίτσια. Η ανάλυση σημαντικότητας για μικροσυστοιχίες (SAM), που ενδείκνυται για την ανάλυση ομικών δεδομένων, ανέδειξε 37 από τους 70 μεταβολίτες που αναλύθηκαν στα κορίτσια με σημαντικά διαφορετική συγκέντρωση μεταξύ των ΙCSI και ΝC ομάδων, με 34 από αυτούς να αυξάνονται στην ICSI ομάδα. Οι 34 μεταβολίτες αφορούν κύρια σε σάκχαρα, αλκοόλες και οξέα σακχάρων, οργανικά οξέα και λιπίδια, που έχουν συνδεθεί με αντίσταση στην ινσουλίνη, μεταβολικό σύνδρομο, ή/και την παχυσαρκία. Η ίδια ανάλυση στα αγόρια ανέδειξε 25 από τους 80 μεταβολίτες που αναλύθηκαν με χαρακτηριστική διαφορά μεταξύ των ομάδων ICSI και NC, εκ των οποίων 9 με σημαντικά μικρότερη συγκέντρωση στην ομάδα ΙCSI. Χαρακτηριστικά αναφέρεται ότι στους 9 μεταβολίτες ανήκουν οι 4 με την πλέον διαφορετική συγκέντρωση μεταξύ των ICSI και NC ομάδων, που είναι η σορβιτόλη, και τα αρωματικά αμινοξέα τρυπτοφάνη, φαινυλαλανίνη και τυροσίνη. Συγκριτική ανάλυση του μεταβολικού προτύπου των δύο φύλων στην NC ομάδα κατέδειξε μια σαφή διαφοροποίηση, η οποία φαίνεται να αποτελεί κύρια αιτία της παρατηρούμενης φυλο-ειδικής μεταβολικής διαφοροποίησης μεταξύ των ομάδων ICSI και ΝC. ΣΥΜΠΕΡΑΣΜΑΤΑ: Η πολυπαραμετρική ανάλυση της σύστασης του πλάσματος σε μικρού μοριακού βάρους μεταβολίτες επέτρεψε τον προσδιορισμό μεταβολικών διαφορών μεταξύ των ομάδων ICSI και NC, που υποστηρίζουν την προδιάθεση των παιδιών από ICSI σε αντίσταση στην ινσουλίνη, με διακριτούς όμως μεταβολικούς και βιοχημικούς δείκτες μεταξύ των δύο φύλων. Τα ευρήματα αυτά πρέπει να επιβεβαιωθούν σε ένα ευρύτερο σύνολο παιδιών και των δύο φύλων. Καταδεικνύουν όμως την αξία της μεταβολομικής να παρέχει μία υψηλής ευκρίνειας προοπτική της μεταβολικής κατάστασης, οδηγώντας στον προσδιορισμό χαρακτηριστικών μεταβολικών προτύπων ακόμα και σε πολύπλοκες καταστάσεις φυσιολογίας. / The intracytoplasmic sperm injection (ICSI) method was introduced in artificial reproduction technology (ART) mainly to treat male infertility. However, due to its high success rates and despite the growing concerns concerning the risk that the significant human intervention associated with this method may have to the genome, epigenome and development of the offspring, the use of ICSI has gradually increased in the recent years, even when it is not medically required. Based on the few currently available systematic studies of ART conceived children, the latter are considered of higher risk for cardio-metabolic diseases as adults. The goal of the present study is to investigate whether metabolomic analysis of the blood plasma could contribute to the early and accurate determination of relevant predisposition in ICSI conceived prepubertal girls and boys, specifically selected from a systematically characterized group of children, participated in a study of the First Department of Pediatrics of the “Agia Sophia” Hospital, Medical School, University of Athens. MATERIALS AND METHODS: The blood plasma metabolic profiles of (a) 10 ICSI- and 10 naturally conceived (NC) girls and (b) 16 ICSI and 16 NC boys were acquired using gas chromatography-mass spectrometry. After peak identification and appropriate normalization, 86 profiles of 70 metabolites in girls and 92 profiles of 80 metabolites in boys were analyzed separately and comparatively using multivariate statistical analysis algorithms of TM4-MeV (v.4.9.0) and XLSTAT (v.2013.4.03) software. The differences in the plasma metabolite concentration profiles between the ICSI and NC groups in girls and boys were visualized in an inter-tissue metabolic network that was reconstructed based on relevant literature and metabolic databases. RESULTS: For the girls, the algorithm of partial least squares-discriminant analysis (PLS-DA) indicated a clear differentiation of the metabolic profiles between the ICSI and NC groups. The discrimination is more pronounced, when biochemical data are also considered. For the boys also, PLS-DA indicated separation between the metabolomic profiles of the two groups analyzed individually or in combination with the biochemical data, but not as explicit as in girls. Significance analysis for microarrays (SAM) determined 37 out of the 70 analyzed metabolites in the plasma profiles of the girls with significantly different concentration between the ICSI and the NC groups; 34 of these were of higher concentration in the ICSI group. The 34 metabolites include mainly sugars, sugar alcohols and acids, organic acids and lipids that have been associated with insulin resistance, metabolic syndrome and/or obesity. The same analysis in the plasma profiles of the boys determined 25 out of the 80 analyzed metabolites with significant difference between the ICSI and NC groups; nine of these were of significantly lower concentration in the ICSI group. It is underlined that the four most discriminatory metabolites between the ICSI and NC groups, i.e. sorbitol and the aromatic amino acids tryptophan, phenylalanine and tyrosine, are among the nine negatively significant. Comparative analysis of the metabolic profiles between the two sexes within the NC group indicated an unequivocal differentiation, which is considered to be the main cause of the observed sex-specific metabolic differences between the ICSI and NC groups. CONCLUSIONS: The multivariate statistical analysis of blood plasma metabolite profiles enabled the determination of sex-specific metabolic differences between the ICSI and NC groups; these differences support increased predisposition to insulin resistance for the ICSI offspring, with clearly different, however, metabolic and biochemical markers in the two sexes. These findings need to be confirmed in a wider group of children. They demonstrate, however, the value of metabolomics to provide a high-resolution perspective of the metabolic state, leading to the determination of characteristic metabolic profiles even in complex physiological conditions. Μεταβολομική Μεταβολισμός Συστημική βιολογία Τεχνητή γονιμοποίηση Αίμα Πλάσμα 612.39 Metabolomics Metabolism Systems biology Assisted reproduction Artificial insemination Intracytoplasmic sperm injection (ICSI) Blood Plasma
4	Χρήση ευφυών αλγοριθμικών τεχνικών για επεξεργασία πρωτεϊνικών δεδομένων Θεοφιλάτος, Κωνσταντίνος 10 June 2014 (has links) H παρούσα διατριβή εκπονήθηκε στο Εργαστήριο Αναγνώρισης Προτύπων, του Τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής του Πανεπιστημίου Πατρών. Αποτελεί μέρος της ευρύτερης ερευνητικής δραστηριότητας του Εργαστηρίου στον τομέα του σχεδιασμού και της εφαρμογής των τεχνολογιών Υπολογιστικής Νοημοσύνης στην ανάλυση βιολογικών δεδομένων. Η διδακτορική αυτή διατριβή χρηματοδοτήθηκε από το πρόγραμμα Ηράκλειτος ΙΙ. Ο τομέας της πρωτεωμικής είναι ένα σχετικά καινούργιο και γρήγορα αναπτυσσόμενο ερευνητικό πεδίο. Μια από τις μεγαλύτερες προκλήσεις στον τομέα της πρωτεωμικής είναι η αναδόμηση του πλήρους πρωτεϊνικού αλληλεπιδραστικού δικτύου μέσα στα κύτταρα. Εξαιτίας του γεγονότος, ότι οι πρωτεϊνικές αλληλεπιδράσεις παίζουν πολύ σημαντικό ρόλο στις βασικές λειτουργίες ενός κυττάρου, η ανάλυση αυτών των δικτύων μπορεί να αποκαλύψει τον ρόλο αυτών των αλληλεπιδράσεων στις ασθένειες καθώς και τον τρόπο με τον οποίο οι τελευταίες αναπτύσσονται. Παρόλα αυτά, είναι αρκετά δύσκολο να καταγραφούν και να μελετηθούν οι πρωτεϊνικές αλληλεπιδράσεις ενός οργανισμού, καθώς το πρωτέωμα διαφοροποιείται από κύτταρο σε κύτταρο και αλλάζει συνεχώς μέσα από τις βιοχημικές του αλληλεπιδράσεις με το γονιδίωμα και το περιβάλλον. Ένας οργανισμός έχει ριζικά διαφορετική πρωτεϊνική έκφραση στα διάφορα σημεία του σώματός του, σε διαφορετικά στάδια του κύκλου ζωής του και υπό διαφορετικές περιβαλλοντικές συνθήκες. Δημιουργούνται, λοιπόν, δύο πάρα πολύ σημαντικοί τομείς έρευνας, που είναι, πρώτον, η εύρεση των πραγματικών πρωτεϊνικών αλληλεπιδράσεων ενός οργανισμού που θα συνθέσουν το πρωτεϊνικό δίκτυο αλληλεπιδράσεων και, δεύτερον, η περαιτέρω ανάλυση του πρωτεϊνικού δικτύου για εξόρυξη πληροφορίας (εύρεση πρωτεϊνικών συμπλεγμάτων, καθορισμός λειτουργίας πρωτεϊνών κτλ). Στην παρούσα διδακτορική διατριβή παρουσιάζονται καινοτόμες αλγοριθμικές τεχνικές Υπολογιστικής Νοημοσύνης για την πρόβλεψη πρωτεϊνικών αλληλεπιδράσεων, τον υπολογισμό ενός βαθμού εμπιστοσύνης για κάθε προβλεφθείσα αλληλεπίδραση, την πρόβλεψη πρωτεϊνικών συμπλόκων από δίκτυα πρωτεϊνικών αλληλεπιδράσεων και την πρόβλεψη της λειτουργίας πρωτεϊνών. Συγκεκριμένα, στο κομμάτι της πρόβλεψης και βαθμολόγησης πρωτεϊνικών αλληλεπιδράσεων αναπτύχθηκε μια πληθώρα καινοτόμων τεχνικών ταξινόμησης. Αυτές κυμαίνονται από υβριδικούς συνδυασμούς μετα-ευρετικών μεθόδων και ταξινομητών μηχανικής μάθησης, μέχρι μεθόδους γενετικού προγραμματισμού και υβριδικές μεθοδολογίες ασαφών συστημάτων. Στο κομμάτι της πρόβλεψης πρωτεϊνικών συμπλόκων υλοποιήθηκαν δύο βασικές καινοτόμες μεθοδολογίες μη επιβλεπόμενης μάθησης, οι οποίες θεωρητικά και πειραματικά ξεπερνούν τα μειονεκτήματα των υπαρχόντων αλγορίθμων. Για τις περισσότερες από αυτές τις υλοποιηθείσες μεθοδολογίες υλοποιήθηκαν φιλικές προς τον χρήστη διεπαφές. Οι περισσότερες από αυτές τις μεθοδολογίες μπορούν να χρησιμοποιηθούν και σε άλλους τομείς. Αυτό πραγματοποιήθηκε με μεγάλη επιτυχία σε προβλήματα βιοπληροφορικής όπως η πρόβλεψη microRNA γονιδίων και mRNA στόχων τους και η μοντελοποίηση - πρόβλεψη οικονομικών χρονοσειρών. Πειραματικά, η μελέτη αρχικά επικεντρώθηκε στον οργανισμό της ζύμης (Saccharomyces cerevisiae), έτσι ώστε να αξιολογηθούν οι αλγόριθμοι, που υλοποιήθηκαν και να συγκριθούν με τις υπάρχουσες αλγοριθμικές μεθοδολογίες. Στη συνέχεια, δόθηκε ιδιαίτερη έμφαση στις πρωτεΐνες του ανθρώπινου οργανισμού. Συγκεκριμένα, οι καλύτερες αλγοριθμικές τεχνικές για την ανάλυση δεδομένων πρωτεϊνικών αλληλεπιδράσεων εφαρμόστηκαν σε ένα σύνολο δεδομένων που δημιουργήθηκε για τον ανθρώπινο οργανισμό. Αυτό είχε σαν αποτέλεσμα την δημιουργία ενός πλήρους, σταθμισμένου δικτύου πρωτεϊνικών αλληλεπιδράσεων για τον άνθρωπο και την εξαγωγή των πρωτεϊνικών συμπλόκων, που υπάρχουν σε αυτό καθώς και τον λειτουργικό χαρακτηρισμό πολλών αχαρακτήριστων πρωτεϊνών. Τα αποτελέσματα της ανάλυσης των δεδομένων πρωτεϊνικών αλληλεπιδράσεων για τον άνθρωπο είναι διαθέσιμα μέσω μίας διαδικτυακής βάσης γνώσης HINT-KB (http://hintkb.ceid.upatras.gr), που υλοποιήθηκε στα πλαίσια αυτής της διδακτορικής διατριβής. Σε αυτή την βάση γνώσης ενσωματώνεται, από διάφορες πηγές, ακολουθιακή, δομική και λειτουργική πληροφορία για ένα τεράστιο πλήθος ζευγών πρωτεϊνών του ανθρώπινου οργανισμού. Επίσης, οι χρήστες μπορούν να έχουν προσβαση στις προβλεφθείσες πρωτεϊνικές αλληλεπιδράσεις και στον βαθμό εμπιστοσύνης τους. Τέλος, παρέχονται εργαλεία οπτικοποίησης του δικτύου πρωτεϊνικών αλληλεπιδράσεων, αλλά και εργαλεία ανάκτησης των πρωτεϊνικών συμπλόκων που υπάρχουν σε αυτό και της λειτουργίας πρωτεϊνών και συμπλόκων. Το προβλήματα με τα οποία καταπιάνεται η παρούσα διδακτορική διατριβή έχουν σημαντικό ερευνητικό ενδιαφέρον, όπως τεκμηριώνεται και από την παρατιθέμενη στη διατριβή εκτενή βιβλιογραφία. Μάλιστα, βασικός στόχος είναι οι παρεχόμενοι αλγόριθμοι και υπολογιστικά εργαλεία να αποτελέσουν ένα οπλοστάσιο στα χέρια των βιοπληροφορικάριων για την επίτευξη της κατανόησης των κυτταρικών λειτουργιών και την χρησιμοποίηση αυτής της γνώσης για γονιδιακή θεραπεία διαφόρων πολύπλοκων πολυπαραγοντικών ασθενειών όπως ο καρκίνος. Τα σημαντικόταρα επιτεύγματα της παρούσας διατριβής μπορούν να συνοψισθούν στα ακόλουθα σημεία: • Παροχή ολοκληρωμένης υπολογιστικής διαδικασίας ανάλυσης δεδομένων πρωτεϊνικών αλληλεπιδράσεων • Σχεδιασμός και υλοποίηση ευφυών τεχνικών πρόβλεψης και βαθμολόγησης πρωτεϊνικών αλληλεπιδράσεων, που θα παρέχουν αποδοτικά και ερμηνεύσιμα μοντέλα πρόβλεψης. • Σχεδιασμός και υλοποίηση αποδοτικών αλγορίθμων μη επιβλεπόμενης μάθησης για την εξόρυξη πρωτεϊνικών συμπλόκων από δίκτυα πρωτεϊνικών αλληλλεπιδράσεων. • Δημιουργία μιας βάσης γνώσης που θα παρέχει στην επιστημονική κοινότητα όλα τα ευρήματα της ανάλυσης των δεδομένων πρωτεϊνικών αλληλεπιδράσεων για τον ανθρώπινο οργανισμό. / The present dissertation was conducted in the Pattern Recognition Laboratory, of the Department of Computer Engineering and Informatics at the University of Patras. It is a part of the wide research activity of the Pattern Recognition Laboratory in the domain of designing, implementing and applying Computational Intelligence technologies for the analysis of biological data. The present dissertation was co-financed by the research program Hrakleitos II. The proteomics domain is a quite new and fast evolving research domain. One of the great challenges in the domain of proteomics is the reconstruction of the complete protein-protein interaction network within the cells. The analysis of these networks is able to uncover the role of protein-protein interactions in diseases as well as their developmental procedure, as protein-protein interactions play very important roles in the basic cellular functions. However, this is very hard to be accomplished as protein-protein interactions and the whole proteome is differentiated among cells and it constantly changes through the biochemical cellular and environment interactions. An organism has radically different protein expression in different tissues, in different phases of his life and under varying environmental conditions. Two very important domains of research are created. First, the identification of the real protein-protein interactions within an organism which will compose its protein interaction network. Second, the analysis of the protein interaction network to extract knowledge (search for protein complexes, uncovering of proteins functionality e.tc.) In the present dissertation novel algorithmic Computational Intelligent techniques are presented for the prediction of protein-protein interactions, the prediction of a confidence score for each predicted protein-protein interaction, the prediction of protein complexes and the prediction of proteins functionality. In particular, in the task of predicting and scoring protein-protein interactions, a wide range of novel classification techniques was designed and developed. These techniques range from hybrid combinations of meta-heuristic methods and machine learning classifiers, to genetic programming methods and fuzzy systems. For the task of predicting protein complexes, two novel unsupervised methods were designed and developed which theoretically and experimentally surpassed the limitations of existing methodologies. For most of the designed techniques user friendly interfaces were developed to allow their utilizations by other researchers. Moreover, many of the implemented techniques were successfully applied to other research domaines such as the prediction of microRNAs and their targets and the forecastment of financial time series. The experimental procedure, initially focused on the well studied organism of Yeast (Saccharomyces cerevisiae) to validate the performance of the proposed algorithms and compare them with existing computational methodologies. Then, it focuses on the analysis of protein-protein interaction data from the Human organism. In specific, the best algorithmic techniques, from the ones proposed in the present dissertation, were applied to a human protein-protein interaction dataset. This resulted to the construction of a weighted protein-protein interaction network of high coverage, to the extraction of human protein complexes and to the functional characterization of Human proteins and complexes. The results of the analysis of Human protein-protein interaction data are available in the web knowledge base HINT-KB (http://hintkb.ceid.upatras.gr) which was implemented during this dissertation. In this knowledge base, structural, functional and sequential information from various sources were incorporated for every protein pair. Moreover, HINTKB provide access to the predicted and scored protein-protein interactions and to the predicted protein complexes and their functional characterization. The problems which occupied the present dissertation have very significant research interest as it is proved by the provided wide bibliography. The basic goal is the provided algorithms and tools to contribute in the ultimate goal of systems biology to understand the cellular mechanisms and contribute in the development of genomic therapy of complex diseases such as cancer. The most important achievements of the present dissertation are summarized in the next points: • Providing an integrated computational framework for the analysis of protein-protein interaction data. • Designing and implementing intelligent techniques for predicting and scoring protein-protein interactions in an accurate and interpretable manner. • Designing and implementing effective unsupervised algorithmic techniques for extracting protein complexes and predicting their functionality. • Creating a knowledge base which will provide to the scientific community all the findings of the analysis conducted on the Human protein-protein interaction data. Συστημική βιολογία 572.64 Protein-protein interactions Computational intelligence Biological networks clustering Protein function prediction Evolutionary algorithms Systems biology

1

Page generated in 0.0305 seconds