Οι μικροσυστοιχίες συμπληρωματικού DNA (cDNA) αποτελούν αποδοτικά και αποτελεσματικά μέσα για την ταυτόχρονη ανάλυση της λειτουργίας δεκάδων χιλιάδων γονιδίων. Μια τυπική cDNA εικόνα μικροσυστοιχιών αποτελεί μια συλλογή πράσινων και κόκκινων κηλίδων (spots) που περιέχουν DNA. Κάθε κηλίδα καταλαμβάνει ένα μικρό τμήμα της εικόνας, με τη μέση τιμή της έντασης της κηλίδας να είναι στενά συνδεδεμένη με το επίπεδο έκφρασης του αντίστοιχου γονιδου. Η κύρια διαδικασία υπολογισμού της έντασης περιλαμβάνει τρία στάδια: Διευθυνσιοδότηση ή κατασκευή πλέγματος (gridding), κατάτμηση (Segmentation) και τέλος η διαδικασία εξαγωγής έντασης.
Στη παρούσα εργασία, η διευθυνσιοδότηση πραγματοποιήθηκε χρησιμοποιώντας μια αυτόματη τεχνική κατασκευής πλέγματος στηριζόμενη στον συνεχή μετασχηματισμό κυματιδίων (CWT). Ποιο συγκεκριμένα,, υπολογίστηκαν τα προφίλ του χ και y άξονα της εικόνας. Δεύτερον, εφαρμόστηκε, σε κάθε προφίλ, ο CWT μετασχηματισμός εώς το 15 επίπεδο, χρησιμοποιώντας daubechies 4 (db4) ως μητρικό κυματίδιο. Τρίτον, υπολογίστηκε το άθροισμα των 15 επιπέδων για κάθε ένα από τα δύο σήματα x και y. Τέταρτον, εφαρμόστηκε στα δύο νέα σήματα τεχνική καταστολής θορύβου με χρήση μετασχηματισμού Wavelet. Τελικά, το κέντρο και όρια της κάθε κηλίδας καθορίστηκαν μέσω του υπολογισμού των τοπικών ελαχίστων και μέγιστων του κάθε σήματος.
Για την κατάτμηση της εικόνας, μια νέα μέθοδος προτάθηκε, η οποία διακρίνεται σε τρία βασικά βήματα: Πρώτον, ο à trous μετασχηματισμός κυματιδίων (AWT) εφαρμόστηκε έως το δεύτερο επίπεδο στην αρχική εικόνα. Δεύτερον, στις λεπτομέρειες (details coefficients) του κάθε επιπέδου εφαρμόστηκε φίλτρο καταστολής θορύβου, προκειμένου να υποβαθμιστεί ο θόρυβος. Τρίτον, η αρχική εικόνα μαζί με τις προσεγγίσεις (approximations) και τις λεπτομέρειες (details) του κάθε επιπέδου εφαρμόστηκαν σε ένα συλλογικό σχήμα (ensemble scheme) στηριζόμενο στο MRF μοντέλο κατάτμησης. Ως τελεστές του σχήματος χρησιμοποιήθηκαν οι: Majority Vote , Min, Product και Probabilistic Product.
Η αξιολόγηση των προτεινόμενων αλγορίθμων πραγματοποιήθηκε με τη χρήση υψηλής ποιότητας εικόνας προσομοίωσης αποτελούμενη από 1040 κηλίδες (spots) με ρεαλιστικά μορφολογικά χαρακτηριστικά, η οποία δημιουργήθηκε σύμφωνα με το μοντέλο προσημείωσης μικροσυστοιχιών του Matlab καθώς και 14 πραγματικές εικόνες, επτά 16-bit grayscale TIFF εικόνες από κάθε κανάλι (κόκκινο και πράσινο), οι οποίες αποκτήθηκαν από την ευρέως διαδεδομένη βάση δεδομένων DERICI. Επιπλέον, προκειμένου να παρατηρηθεί η συμπεριφορά των αλγορίθμων στη παρουσία θορύβου, η απομιμούμενη εικόνα υποβαθμίστηκε με τη προσθήκη λευκού Gaussian θορύβου.
Η ακρίβεια της ακολουθούμενης διαδικασίας κατάτμησης, στη περίπτωση της εικόνας προσομοίωσης, προσδιορίστηκε μέσω του segmentation matching factor (SMF), probability of error (PE) και coefficient of determination (CD) με σεβασμό στη πραγματική κλάση στην οποία ανήκουν (φόντο-υπόβαθρο). Στη περίπτωση των πραγματικών εικόνων η αξιοπιστία των αλγορίθμων προσδιορίστηκε έμμεσα μετρώντας την ένταση κάθε κηλίδας, μέσω του Mean Absolute Error (MAE).
Το σύνολο των αλγορίθμων, εφαρμοσμένο στην απομιμούμενη εικόνα, κατάφερε να οδηγήσει σε καλύτερο προσδιορισμό των κηλίδων σε σχέση με το απλό MRF μοντέλο κατάτμησης. Επιπλέον, ο τελεστής Majority Vote επέτυχε το υψηλότερο ποσοστό σε όλες τις περιπτώσεις, ειδικά σε κελία (cells) με υψηλή παρουσία θορύβου (SMF: 82.69%, PE: 6.60% and CV:0.809 ), ενώ το απλό μοντέλο περιορίστηκε στο χαμηλότερο ποσοστό (SMF:94.87%-82.69%, PE:3.03%-9.85%, CV:0.961-0.729). Στη περίπτωση των πραγματικών εικόνων ο min τελεστής επέτυχε το χαμηλότερο ποσοστό (MAE: 803.96 and Normalized MAE: 0.0738), σε αντίθεση με τον τελεστή Majority Vote, ο οποίος κατάφερε να επιτύχει το υψηλότερο ποσοστό ανάμεσα στους χρησιμοποιούμενους τελεστές (MAE 990.49 and Normalized MAE 0.0738).Επιπλέον όλοι οι προτεινόμενοι αλγόριθμοι κατάφεραν να μειώσουν τη μέση τιμή MAE σε σχέση με το απλό μοντέλο MRF (MAE 1183.50 and Normalized MAE 0,0859). / Complementary DNA microarrays are a powerful and efficient tool that uses genome sequence information to analyze the structure and function of tens of thousands of genes simultaneously. A typical cDNA microarray image is a collection of green and red discrete spots containing DNA. Each spot occupies a small fraction on the image and its mean fluorescence intensity is closely related to the expression level of the genes. The main process for measuring spot intensity values involves three tasks: gridding, segmentation and data extraction.
In the present study, spot location was accomplished by using an automatic gridding method based on continues wavelet transform (CWT): Firstly, line-profiles for x and y axes were calculated. Secondly, the CWT was applied up to 15 scales to both profiles by using daubechies 4 (db4) as mother wavelet. Thirdly, a summation point by point of the signals of all the 15 scales was calculated. Fourthly, a hard-thresholding wavelet based technique was applied to each signal. Finally, spots centers and boundaries were defined by calculating the local maxima and the local minima on both signals.
The proposed segmentation method is divided into three major steps: Firstly,
à trous wavelet transform was applied up to second scale on the initial cell. Secondly, on the details coefficients, a hard threshold filter was carried out in order to suppress the noise. Finally, the initial image among the approximations and details of each scale were implemented in an ensemble scheme based on MRF model. As operators of the ensemble scheme were chosen: Majority Vote, Min, Product and Probabilistic Product.
The validation of the proposed algorithms was accomplished by a high quality simulated microarray image of 1040 cells with realistic morphological characteristics generated by using the Matlab microarray simulation model and fourteen real cDNA microarray images, seven 16-bit grayscale TIFF images of both channels (green and red), collected from the DERICI public database. In order to investigate the performance of the algorithms in presence of noise, the simulated image was corrupted with additive white Gaussian noise.
In the case of simulated image, the segmentation accuracy was evaluated by means of segmentation matching factor, probability of error and coefficient of determination in respect to the pixel actual classess (foreground-background pixels). In the case of real images the evaluation was based on Mean Absolute error (MAE), in order to measure indirectly their reliability.
According to our results in simulated cells, the proposed ensemble schemes managed to lead to more accurate spot determination in comparison to conventional MRF model. Additionally, the majority vote operator managed to accomplish the highest score in all cases, especially on cells with high noise (SMF: 82.69%,
PE: 6.60% and CV:0.809), while the conventional MRF managed to gather the lowest score in all cases (SMF:94.87%-82.69%, PE:3.03%-9.85%, CV:0.961-0.729). In the case of real images, the min operator achieved the lowest score (MAE: 803.96 and Normalized MAE: 0.0738) in contrast to majority vote, which reached the highest score among the proposed evaluating methods (MAE 990.49 and Normalized MAE 0.0738). Additionally, all the proposed algorithms managed to suppress MAE value compared to the conventional MRF segmentation model (MAE 1183.50 and Normalized MAE 0,0859).
Identifer | oai:union.ndltd.org:upatras.gr/oai:nemertes:10889/1520 |
Date | 27 April 2009 |
Creators | Μάντουκας, Θεόδωρος |
Contributors | Νικηφορίδης, Γεώργιος, Mantoukas, Theodoros, Νικηφορίδης, Γεώργιος, Μπεζεριάνος, Αναστάσιος, Σακελλαρόπουλος, Γεώργιος |
Source Sets | University of Patras |
Language | English |
Detected Language | Greek |
Type | Thesis |
Rights | 0 |
Relation | Η ΒΥΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. |
Page generated in 0.003 seconds