Return to search

Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών / Application of the BLAST algorithm in the recognition of mutations in biological sequences

Το πρόβλημα της ευθυγράμμισης βιολογικών ακολουθιών, δηλαδή πρωτεϊνών και γονιδιακών ακολουθιών, είναι από τα πιο απαιτητικά στην επίλυση και ταυτόχρονα πιο εφαρμόσιμα προβλήματα που σχετίζονται με την επιστήμη της βιοπληροφορικής. Από την ευθυγράμμιση βιολογικών ακολουθιών προκύπτει ένας σημαντικός όγκος πληροφορίας που δίνει απαντήσεις σε εξελικτικά ερωτήματα αλλά, κυρίως, βρίσκει εφαρμογή σε πληθώρα τομέων, όπως η διάγνωση και η θεραπεία ασθενειών.
Πρόκειται για ένα θέμα που τράβηξε την προσοχή της παγκόσμιας κοινότητας της πληροφορικής μόλις στο δεύτερο μισό του περασμένου αιώνα, επομένως είναι ένα πεδίο με αρκετό χώρο για έρευνα. Στην παρούσα εργασία, αφού δοθεί το απαραίτητο βιολογικό υπόβαθρο, παρουσιάζονται αρχικά οι βασικότεροι αλγόριθμοι που έχουν παρουσιαστεί μέχρι τώρα ως προτάσεις για την εκτέλεση ευθυγραμμίσεων, εξηγούνται οι βασικές δομικές και λειτουργικές διαφορές τους και δίνεται μια πρώτη εκτίμηση της αποτελεσματικότητάς τους, όπως αυτή αντλείται από τη βιβλιογραφία.
Στη συνέχεια, το ενδιαφέρον επικεντρώνεται στον αλγόριθμο τοπικής ευθυγράμμισης BLAST. Αναλύεται η λειτουργία του βήμα προς βήμα, παρουσιάζονται οι κυριότερες εκδόσεις του, οι είσοδοι και οι έξοδοί του καθώς και το μαθηματικό υπόβαθρο στο οποίο βασίζεται η υλοποίησή του.
Στόχος του πειραματικού τμήματος της εργασίας είναι να εξετάσει κατά πόσο ο BLAST επιτυγχάνει να ταυτοποιήσει, και με τι σφάλμα, μια μεταλλαγμένη ακολουθία, τόσο ως προς το γονίδιο από το οποίο προέρχεται όσο και ως προς το είδος της και τις πιθανές της συνέπειες στον οργανισμό στον οποίο εκφράζεται. Με βάση το γονίδιο BRCA1 του Homo Sapiens, παράγεται μια σειρά μεταλλάξεων, οι οποίες μεταφράζονται. Το σύνολο των παραγομένων βιολογικών ακολουθιών, νουκλεοτιδιακών και αμινοξεϊκών, τίθεται προς αναζήτηση με χρήση του BLAST σε κατάλληλες βάσεις δεδομένων, προκειμένου να ελεγχθεί η ευαισθησία του σε μεταλλάξεις διαφορετικού τύπου και έκτασης.
Αποδεικνύεται ότι παρότι ο BLAST επιτυγχάνει με πολύ μικρό σφάλμα την ταυτοποίηση του γονιδίου, ακόμα και σε περιπτώσεις έντονης μετάλλαξης της αρχικής ακολουθίας, ωστόσο η κατανομή των αποτελεσμάτων είναι πολύ πιο ασαφής ως προς την ταυτοποίηση του είδους της μετάλλαξης. / The goal of the present thesis is the examination of the sensitivity of the local alignment algorithm BLAST, on a set of mutated biological sequences. The algorithm's sensitivity is to be measured with regard to three basic criteria:
- identification of the relation to the original gene
- identification of the mutation type
- prediction of possible influence of the organism in question
In the first, theoretical part of the thesis, a general biological background is offered, followed by a sufficient presentation on both the history and the latest achievements in the field of sequence alignment. The main topic introduced is the structure and functionality of BLAST, together with its principal editions, its inputs and outputs and the mathematical foundation standing below it.
In the experimental part of the thesis, the BRCA1 gene is picked out of the Homo Sapiens Genome; its sequence suffers a number of mutations of different type and extent. Each produced mutation is translated into the corresponding protein. The entire set of biological sequences produced is going through a BLAST Search to test the sensitivity of the algorithm according to the mutation under examination.
Analyzing the results, it is safe to claim that BLAST succeeds to recognize the gene from which the mutated sequences are produced, including extremely low error in the process. On the other hand, the identification of the mutation type is certainly of significantly lower sensitivity. Thus the main proposal extracted is the implementation of a patterns recognition system, which will integrate artificial intelligence methods to connect patterns encountered within the input sequence, with diseases reported in the appropriate documentation.

Identiferoai:union.ndltd.org:upatras.gr/oai:nemertes:10889/4676
Date03 October 2011
CreatorsΝτάλλα, Μαρία
ContributorsΔερματάς, Ευάγγελος, Ntalla, Maria, Σγάρμπας, Κυριάκος
Source SetsUniversity of Patras
Languagegr
Detected LanguageGreek
TypeThesis
Rights0

Page generated in 0.0027 seconds