Η ανακάλυψη των microRNA γονιδίων το 1993 έφερε επανάσταση στα όσα γνωρίζαμε από το κεντρικό δόγμα της Βιολογίας για τη σύνθεση των πρωτεϊνών και τη ρύθμιση της πρωτεϊνικής έκφρασης. Αυτό γιατί τα microRNA γονίδια δεν κωδικοποιούν κάποια πρωτεΐνη αλλά αντί αυτού παράγουν μικρά μόρια μεγέθους περίπου 22 νουκλεοτιδιών. Τα μόρια αυτά αλληλεπιδρούν με το mRNA και συγκεκριμένα βρίσκουν στόχους στις 3 UTR περιοχές άλλων γονιδίων και αλληλεπιδρούν με βάση την αρχή της συμπληρωματικότητας Watson-Crick. Αποτέλεσμα αυτής της πρόσδεσης είναι η καταστολή της πρωτεϊνικής έκφρασης του γονιδίου στόχου μέσω αναστολής της μετάφρασης ή μέσω της υποβάθμισης του mRNA. Μετά την ανακάλυψη των microRNA και του τρόπου αλληλεπίδρασης τους ήταν φυσικό να ακολουθήσουν εκτεταμένες έρευνες για τις κυτταρικές διεργασίες τις οποίες ρυθμίζουν αλλά και σε ποιών γονίδιων τη ρύθμιση λαμβάνουν μέρος. Ως αποτέλεσμα προέκυψε ότι σε πολλές γνωστές ασθένειες παρουσιάζεται άμεση συσχέτιση με ρύθμιση από microRNA. Τέτοια περίπτωση αποτελεί και η ασθένεια του καρκίνου η οποία σε συνδυασμό με την «λεπτή» ρύθμιση που προκαλούν τα microRNA δίνει ελπίδες για νέες μοριακές θεραπείες. Αυτά είναι μερικά παραδείγματα από τα οποία μπορούμε να καταλάβουμε τη μεγάλη σημασία των microRNA και την ανάγκη για αποδοτική πρόβλεψη τους.
Εξαιτίας του μικρού τους μεγέθους αλλά και του μικρού τους ποσοστού σε σχέση με το μέγεθος του γονιδιώματος (περίπου 3%) ο πειραματικός τους εντοπισμός χαρακτηρίζεται εξαιρετικά δύσκολος. Για το λόγο αυτό έχουν επιστρατευτεί αρκετές μέθοδοι Υπολογιστικής Νοημοσύνης και Αλγόριθμοι οι οποίοι μπορούν να «ξεχωρίσουν» τα πραγματικά γονίδια από τα ψεύτικα γονίδια δημιουργώντας έτσι μοντέλα πρόβλεψης. Μέχρι στιγμής έχουν χρησιμοποιηθεί σαν μέθοδοι ταξινόμησης, Support Vector Machine, δίκτυα Bayes και άλλες πιθανοτικές μέθοδοι όπως τα Hidden Markov μοντέλα .Όλες οι μέθοδοι αυτού του είδους βασίζονται στον υπολογισμό αρκετών χαρακτηριστικών για τα microRNA που σχετίζονται με το ακολουθιακό περιεχόμενο, με τη δομή τους στο χώρο αλλά και με θερμοδυναμικά στοιχεία των μορίων. Σε μεγάλο βαθμό η αποδοτικότητα πρόβλεψης βασίζεται στην επιλογή των πιο αντιπροσωπευτικών χαρακτηριστικών και στη βελτιστοποίηση των παραμέτρων της υπολογιστικής μεθόδου που χρησιμοποιείται χωρίς μέχρι τώρα να έχει βρεθεί μια αξιόπιστη λύση.
Στην παρούσα διπλωματική εργασία αρχικά προτείναμε μια νέα υβριδική μεθοδολογία για ταυτόχρονη ταξινόμηση microRNA γονιδίων, εξαγωγή χαρακτηριστικών και υπολογισμό παραμέτρων. Η προτεινόμενη μεθοδολογία χρησιμοποιεί τις καινοτόμες τεχνικές του Εξελικτικού Προγραμματισμού και συγκεκριμένα τους Γενετικούς Αλγορίθμους για την εξαγωγή χαρακτηριστικών και βελτιστοποίηση παραμέτρων καθώς και Support Vector Machine για ταξινόμηση. Απώτερος στόχος της παρούσας εργασίας ήταν να αναπτυχθεί μια ολοκληρωμένη διαδικτυακή πλατφόρμα η οποία επιτρέπει αρχικά υπολογισμό χαρακτηριστικών για τις γονιδιακές ακολουθίες που θα εισάγει ο χρήστης και κατά δεύτερον δίνει την πρόβλεψη του ταξινομητή για το αν είναι ή όχι microRNA γονίδια μέσω ενός φιλικού περιβάλλοντος. Επιπλέον, ενσωματώθηκαν τα περισσότερα microRNA χαρακτηριστικά που έχουν προταθεί στη βιβλιογραφία και η αποδοτικότητα πρόβλεψης του ταξινομητή βελτιώθηκε μέσω της προτεινόμενης υβριδικής μεθόδου. Ενσωματώσαμε διάφορα πακέτα για τον υπολογισμό των χαρακτηριστικών όπως το Vienna RNA Package και το UnaFold και αυτό το κομμάτι της εργασίας σχετίζεται με την έρευνα για τη θερμοδυναμική και φυσικοχημική συμπεριφορά των μικρών RNA μορίων. Καινοτόμο στοιχείο αποτελεί το γεγονός ότι ο υπολογισμός των χαρακτηριστικών γίνεται με τέτοιο τρόπο ώστε να ευνοείται στη συνέχεια η εφαρμογή μεθόδων Υπολογιστικής Νοημοσύνης. Επιπλέον στο σύστημα ενσωματώσαμε βάση δεδομένων η οποία αποθηκεύει τις επεξεργασμένες ακολουθίες και τα υπολογισμένα χαρακτηριστικά δίνοντας ώθηση για την κατασκευή νέων συνόλων δεδομένων. Τέλος αυτή η δυνατότητα ανάκτησης πληροφορίας κάνει το σύστημα μας μια ολοκληρωμένη πλατφόρμα μελέτης μικρών RNA μορίων και πρόβλεψης microRNA γονιδίων. / The discovery of microRNA genes in 1993 challenged the view of the Central Dogma of Biology and introduced a new layer of complexity in which RNA is not only a carrier of gene information but also a mediator of gene expression and protein synthesis. Typically, microRNA genes are short non-coding (~20-22 nt) RNAs that do not encode proteins, but instead they produce small RNA molecules. These molecules can regulate mRNA target genes by binding to the 3’ UTR of mRNA in accordance to Watson-Crick complementarity for cleavage or translational repression. MicroRNAs have been a major object of study as they have been found to be involved in some basic biological processes. These observations underline the importance of normal microRNA homeostasis on functions such as development, differentiation, apoptosis and proliferation. Dysregulation of miRNA is fundamental to the pathogenesis of many diseases and it has been long suspected that miRNA expression can be deregulated in cancer and abnormal miRNA activity may lead to tumorgenesis. From all the above, it is obvious that the better understanding of miRNA mechanism and function may lead to new and more sophisticated design of clinical therapies. Consequently, the identification of novel microRNA genes is a challenging bioinformatics problem.
The experimental identification has some important drawbacks: the small size of microRNA genes in comparison to the size of the genome, cost and time, and low sensitivity. To overcome these technical problems a lot of computational methods have been proposed and several Artificial Intelligence techniques have been applied to distinguish real pre-miRNAs from pseudo hairpins. Support Vector Machines, Naïve Bayes and other probabilistic algorithms such as Hidden Markov Models have been successfully developed as classification methods. All these computational methods rely on the computation of several sequential, structural and thermodynamical microRNA features. In addition, the prediction efficiency is related to the extraction of the most discriminative features and to the optimization of the parameters.
At first, this thesis presents a hybrid approach for simultaneous microRNA classification, feature extraction and parameters optimization. We took advantage of the innovative techniques of Evolutionary Programming and we introduced an embedded classification method, which combines the efficiency and robustness of Support Vector Machines with Genetic Algorithms for feature selection and parameters optimization. Secondly, objective of this thesis was the development of an online platform for effective microRNA genes prediction. The prediction model is based on our classification model and we used a significant feature subset that the proposed methodology revealed to be consistent. Also, we provided the opportunity to calculate all the microRNA features that have been proposed in the literature. We incorporated different packages such as the Vienna RNA package and UnaFold package and we introduced some new features with high discriminative power. This work is related to biophysics and thermodynamics of small RNA molecules and it can be applied to other categories of regulatory molecules.
Also, the provided service in accordance to the feature calculation will encourage the application of other Artificial Intelligence Techniques in identifying microRNAs. We hope that the construction of new datasets will contribute to the Development of new Machine Learning methodologies.
Furthermore, our tool maintains a Database about predicted microRNA sequences plus some informating metadata about them. Finally it can act as an integraded system and the usage of metadata enables information retrieval.
Identifer | oai:union.ndltd.org:upatras.gr/oai:nemertes:10889/5008 |
Date | 02 February 2012 |
Creators | Κλεφτογιάννης, Δημήτριος |
Contributors | Τσακαλίδης, Αθανάσιος, Kleftogiannis, Dimitrios, Τσακαλίδης, Αθανάσιος, Λυκοθανάσης, Σπυρίδων, Μακρής, Χρήστος |
Source Sets | University of Patras |
Language | gr |
Detected Language | Greek |
Type | Thesis |
Rights | 12 |
Relation | Η ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. |
Page generated in 0.0032 seconds