Global ETD Search

1	Κατασκευή διαγνωστικού συστήματος με στατιστικές μεθόδους αναγνώρισης νέων γεγονότων Λαμπρόπουλος, Νίκος 01 August 2014 (has links) Στη συγκεριμένη διπλωματική εργασία γίνεται μια σχοινοτενής μελέτη των τεχνικών αναγνώρισης νέων γεγονότων (ανωμαλιών ή outliers) σε ευρεία σετ δεδομένων. Το απαράιτητο θεωρητικό background που απαιτείται για την κατανόηση των τεχνικών παρέχεται ξεχωριστά προκειμένου να εξασφαλιστεί η συνοχή του κειμένου. Στο πρώτο κεφάλαιο γίνεται εισαγωγή στην έννοια και στις εφαρμογές του novelty detection, ενώ παρέχεται μια πρώτη κατηγοριοποίηση των τεχνικών αυτών. Στο Κεφάλαιο 2 αναλύονται οι στατιστικές προσεγγίσεις που έχουν προταθεί, τόσο οι παραμετρικές όσο και οι μη-παραμετρικές. Στα κεφάλαια 3 και 4 γίνεται μια εισαγωγή στα νευρωνικά δίκτυα και στα SVM προκείμένου να εξηγηθεί η χρήση τους στις εφαρμογές αναγνώρισης νέων γεγονότων ή ανωμαλιών (Κεφάλαιο 5). Ολοκληρώνοντας στη συγκεκριμένη διπλωματική εργασία στατιστικές προσεγγίσεις καθώς επίσης και τεχνικές βασιζόμενες σε νευρωνικά δίκτυα και SVM παρουσιάζονται με σαφήνεια, για την ανίχνευση νέων γεγονότων, ενώ η συγκριτική μελέτη τους παρέχει έναν συνοπτικό οδηγό-εργαλέιο που συνοψίζει τα πλεονεκτήματα και τα μειονεκτήματα των παρουσιαθέντων τεχνικών. / - Αναγνώριση προτύπων Pattern detection Novelty detection
2	Αναγνώριση σημάτων οδικής κυκλοφορίας σε αντίξοες συνθήκες / Road sign recognition in adverse conditions Σιόγκας, Γιώργος 16 May 2007 (has links) Η εργασία αυτή έχει ως στόχο την ανάπτυξη συστήματος αυτόματης αναγνώρισης σημάτων οδικής κυκλοφορίας (ΣΟΚ) από ψηφιακές βιντεοσκοπήσεις που λαμβάνονται από κινούμενο όχημα. Μελετώνται αλγόριθμοι που επιλύουν τα εξής προβλήματα: α) εντοπισμός της θέσης του ΣΟΚ σε ψηφιακή φωτογραφία, β) παρακολούθηση του ΣΟΚ στην ακολουθία ψηφιακών εικόνων της βιντεοσκόπησης και γ) ταξινόμηση του ΣΟΚ χρησιμοποιώντας πολλαπλές αναπαραστάσεις του με στόχο την ελαχιστοποίηση του σφάλματος. Το σύστημα αξιολογήθηκε τόσο σε ευνοικές συνθήκες φωτισμού (ηλιόλουστη μέρα, πρωινές ώρες) και οδήγησης (χαμηλές ταχύτητες), όσο και σε αντίξοες συνθήκες, όπως οδήγηση υπό βροχή, νυχτερινή οδήγηση, οδήγηση με υψηλή ταχύτητα κ.α. / This thesis aims at the implementation of a system that performs automatic recognition of road signs (RS) using digital video clips shot from inside a moving vehicle. Algorithms that solve the following issues are studied: a)detection of the position of the RS in digital photographs, b) tracking the RS in the frame sequence of the video clip and c) RS classification using multiple instances of it, aiming at the minimization of error. The system was evaluated in good lighting conditions (sunny day, morning hours) and driving (low speeds), as well as in adverse conditions, like driving in rainy conditions, driving at night, driving at high speeds etc. Αναγνώριση προτύπων Επεξεργασία εικόνας 621.367 Pattern recognition Image processing
3	Υλοποίηση συστήματος ασύρματων αισθητήρων για έλεγχο δομικής ακεραιότητας μέσω ακουστικής εκπομπής Παλληκάρης, Αλέξιος 01 August 2014 (has links) Ο Έλεγχος Δομικής Ακεραιότητας (ΕΔΤ) μέσω Ακουστικής Εκπομπής, αποτελεί ένα σημαντικό εργαλείο της μηχανικής στην έγκαιρη διάγνωση δομικών σφαλμάτων και στην αύξηση της διάρκειας ζωής κτηρίων. Οι σύγχρονες εφαρμογές συστημάτων ΕΔΤ χαρακτηρίζονται από μεγάλο κόστος εφαρμογής και συντήρησης. Χρησιμοποιώντας νέες τεχνολογίες ολοκληρωμένων συστημάτων χαμηλής κατανάλωσης ισχύος, ασύρματης επικοινωνίας, καθώς επίσης και τεχνικών ψηφιακής επεξεργασίας σημάτων και αναγνώρισης προτύπων, μπορεί να δημιουργηθεί ένα σύστημα ΕΔΤ φθηνό και αποδοτικό. Στόχος μας σε αυτή την διπλωματική είναι η υλοποίηση ενός συστήματος ασύρματων αισθητήρων, ικανών να επιτελέσουν έλεγχο δομικής ακεραιότητας μέσω ακουστικής εκπομπής, χρησιμοποιώντας μικροελεγκτές LPC2148 και πομποδέκτες nRF24L01. / Structural health monitoring with acoustic emission techniques is an important engineering tool in the diagnosis of structural faults. Modern applications of SHM systems are difficult to implement and cost inefficient. By using new integrated systems technologies, wireless communications, coupled with better techniques in signal processing and pattern recognition, a much more cheap and efficient SHM system may be build. Our target in this thesis, is to implement a wireless sensor system, capable of SHM with acoustic emission, by using LPC2148 microcontrollers and nRF24L01 transceivers. Ακουστική εκπομπή Αναγνώριση προτύπων Αλγόριθμος Goertzel Μικροελεγκτές 620.112 7 Acoustic emission Pattern recognition Goertzel algorithm Microcontrollers
4	Κατασκευή συστήματος αναγνώρισης ηχητικών σημάτων ροχαλητού με συστοιχία πιεζοηλεκτρικών αισθητήρων Λιβάνιος, Απόστολος 07 May 2015 (has links) Το ροχαλητό είναι ένα φαινόμενο που σπάνια προκαλεί ανησυχία στους ασθενείς του. Επιπλέον, η διάγνωση του ροχαλητού απαιτεί ακόμα και σήμερα εξέταση σε εργαστήριο πολυυπνογραφίας, μια διαδικασία που είναι ακριβή και επίπονη για τον ασθενή. Συνδυασμένα αυτά τα γεγονότα οδηγούν σε ένα τεράστιο ποσοστό μη διαγνωσμένων ασθενών που κινδυνεύουν να παρουσιάσουν ή παρουσιάζουν ήδη ψυχολογική επιβάρυνση, κάποια μορφή καρδιακής νόσου, μειωμένες επιδόσεις στις καθημερινές τους ασχολίες και άλλα παρεπόμενα του ροχαλητού. Πολλές μέθοδοι έχουν αναπτυχθεί για διάγνωση ροχαλητού με ακουστική ανάλυση των ήχων κατά τη διάρκεια του ύπνου με σκοπό να μετατρέψουν τη διάγνωση του ροχαλητού σε εύκολη και βολική για τον ασθενή διαδικασία. Αν και αυτές οι μέθοδοι φαίνεται να έχουν καλά αποτελέσματα σε πειράματα εργαστηρίου, πολλές φορές δεν είναι αρκετά ανθεκτικές και σταθερές και απαιτούν χρήση συγκεκριμένου εξοπλισμού για να λειτουργήσουν σε βέλτιστο επίπεδο. Αυτό έχει σαν αποτέλεσμα να μη λειτουργούν ικανοποιητικά αν υλοποιηθούν στα πλαίσια μιας καθημερινής συσκευής που ήδη έχει ο ασθενής και δε χρειάζεται να αγοράσει, όπως το κινητό του τηλέφωνο. Με αυτή τη διπλωματική γίνεται προσπάθεια ανάπτυξης και υλοποίησης μεθόδου αναγνώρισης ροχαλητού αρκετά ανθεκτικής ως προς το θόρυβο αλλά και την απόσταση της συσκευής ηχογράφησης από τον ασθενή, ώστε να μπορεί να χρησιμοποιηθεί ακόμα και με συσκευές κινητού τηλεφώνου. Επίσης, γίνονται πειραματισμοί για δημιουργία δύο μεθόδων για αναγνώριση ροχαλητού με αυτόματη εξαγωγή χαρακτηριστικών με χρήση Sparse Coding και Convolutional Predictive Sparse Decomposition Auto-encoders. / Snoring rarely is cause of alarms for its patients. In addition, in order to diagnose snoring, a patient has to pass the night at a polysomnography lab, a process that is both expensive and inconvenient. These two facts lead to a massive percentage of undiagnosed patients that might run the risk of being affected by mood swings, some kind of heart disease and other side effects of snoring. Many methods of acoustical analysis of sleep sounds have been developed in order to make snore diagnosis an easy and inexpensive process. Even though these methods seem to be good at diagnosing snore sounds in a lab environment, they sometimes fail when put in a home environment since they are not robust against noise and they are highly dependent on the equipment used for the recording of the sounds. Thus, they are not effective in most scenarios so that they can be implemented in devices that a patient might already own and replace polysomnography. In this thesis project it is attempted to develop and implement a snoring detection method that is robust enough to be used in practice. Moreover, methods of automatic feature extraction are experimented with using Sparse Coding and Convolutional Predictive Sparse Decomposition Auto-encoders. Ακουστική ανάλυση Ροχαλητό Αναγνώριση προτύπων 006.22 Acoustic analysis Snoring Pattern recognition
5	Επεξεργασία ασφάλειας Τριχόπουλος, Γεώργιος 20 October 2010 (has links) Σκοπός της εργασίας είναι να ερευνήσουμε κατά πόσο η κίνηση του ποντικιού μπορεί να χρησιμοποιηθεί ως στοιχείο ταυτοποίησης του φυσικού προσώπου. Για το λόγο αυτό δημιουργήσαμε ένα γραφικό περιβάλλον στο οποίο ο χρήστης εκτελεί έναν αριθμός πειραμάτων τα οποίο αποτελούν τη σφραγίδα του χρήστη. Στη συνέχεια εκπαιδεύουμε το σύστημα έτσι ώστε τα δεδομένα του χρήστη να έρθουν σε αντιπαραβολή με τα δεδομένα άλλων χρηστών. Μετά από αυτό το στάδιο είμααστε έτοιμοι να αναγνωρίσουμε τον εν λόγω χρήστη. Η επιτυχία (ή αποτυχία) του συστήματος μπορεί να μετρηθεί ποσοτικά. / - Αναγνώριση προτύπων Νευρωνικά δίκτυα Ποντίκια 005.8 Neural networks Pattern recognition Mice
6	Ανάπτυξη ολοκληρωμένου συστήματος για προεπεξεργασία και αναγνώριση προτύπων από δεδομένα πρωτεωμικής Ραψομανίκη, Μαρία Άννα 02 February 2011 (has links) Οι ραγδαίες εξελίξεις στη Φασματομετρία Μάζας και η εισαγωγή νέων πειραματικών τεχνικών ιονισμού, όπως οι τεχνικές Matrix-Assisted Laser Desorption Ionization (MALDI) και Surface-Enhanced Laser Desorption Ionization (SELDI) έχει καταστήσει δυνατή τη μελέτη των επιπέδων της πρωτεϊνικής έκφρασης σε σύνθετα μείγματα πρωτεϊνών από διάφορα βιολογικά δείγματα, όπως serum, πλάσμα και ούρα. Τα δεδομένα που προκύπτουν από αυτές τις τεχνολογίες μπορούν να χρησιμοποιηθούν για την αναγνώριση πρωτεϊνικών προτύπων, τα οποία θα μπορούν επιτυχώς να διαχωρίζουν καταστάσεις (π.χ. υγιής – ασθενής) καθώς και για την ανακάλυψη νέων πιθανών βιοδεικτών (biomarkers). Αυτά τα πρότυπα έχουν υψηλή διαγνωστική σημασία, καθώς μπορούν να χρησιμοποιηθούν για έγκαιρη διάγνωση, πρόγνωση, παρακολούθηση της εξέλιξης μιας ασθένειας ή της απόδοσης μιας συγκεκριμένης θεραπείας. Αυτή η στρατηγική έχει ήδη χρησιμοποιηθεί σε διάφορους τύπους καρκίνου, όπως ωοθηκών, μαστού και προστάτη, δίνοντας πολύ ενδιαφέροντα αποτελέσματα. Παρόλα αυτά, η σύνθετη φύση των πρωτεϊνικών δεδομένων κάνει την ανάλυση τους αρκετά απαιτητική, καθώς τα αρχικά, ακατέργαστα δεδομένα είναι πολύ δύσκολο να επεξεργαστούν. Πιο συγκεκριμένα, τα δεδομένα που ανακτώνται μετά από ένα πείραμα Φασματομετρίας Μάζας περιέχουν κάποιες εκατοντάδες δείγματα (δηλαδή φάσματα μάζας) και σε κάθε δείγμα αντιστοιχούν δεκάδες χιλιάδες χαρακτηριστικά. Επιπρόσθετα με το πρόβλημα των μεγάλων διαστάσεων και ταυτόχρονα λίγων δειγμάτων, κάθε φάσμα περιέχει σημαντικό ποσοστό θορύβου και τεχνουργημάτων, κυρίως εξαιτίας της υψηλής ευαισθησίας του μηχανήματος, της επιμόλυνση του δείγματος αλλά και διαφόρων ηλεκτρικών πηγών θορύβου. Ένα άλλο κοινό πρόβλημα είναι η λάθος βαθμονόμηση (calibration) των φασμάτων, που καθιστά τα δεδομένα αδύνατον να συγκριθούν. Για όλους αυτούς τους λόγους, είναι παραπάνω από προφανές ότι για να καταφέρουμε να εξάγουμε γνώση σχετικά με τις πραγματικές υποκείμενες βιολογικές διαφοροποιήσεις του πρωτεώματος πρέπει να εκτελέσουμε διάφορα βήματα προεπεξεργασίας. Ο βασικός στόχος της προεπεξεργασίας είναι η δημιουργία ενός πίνακα που θα περιέχει τα σημαντικά χαρακτηριστικά (δηλαδή τις κορυφές) και τις αντίστοιχες τιμές έντασης, ο οποίος θα αναλυθεί περαιτέρω χρησιμοποιώντας μια ποικιλία υπολογιστικών μεθόδων. Για να επιτύχουμε κάτι τέτοιο, πρέπει αρχικά να αφαιρέσουμε το θόρυβο, τα τεχνουργήματα και τη συστηματική απόκλιση χωρίς απώλεια πληροφορίας και έπειτα να ανιχνεύσουμε και να ποσοτικοποιήσουμε ένα σύνολο κορυφών. Η προεπεξεργασία περιλαμβάνει ένα σύνολο βημάτων τα οποία αλληλεπιδρούν μεταξύ τους και έχει δειχθεί ότι αν δεν εφαρμοστεί προσεκτικά θα είναι πολύ δύσκολο να εξαχθούν συμπεράσματα για την υποκείμενη ασθένεια. Η επιλογή του καλύτερου συνδυασμού μεθόδων είναι ιδιαίτερα δύσκολη, καθώς για κάθε βήμα έχουν προταθεί αρκετές εναλλακτικές μέθοδοι. Επιπλέον, είναι δύσκολο να αποτιμηθεί η απόδοση κάθε μεθόδου και να προταθεί μια μοναδική στρατηγική, καθώς για κάθε σύνολο δεδομένων προκύπτει και διαφορετικός συνδυασμός ως πιο κατάλληλος. Στα πλαίσια της παρούσας διπλωματικής εργασίας δημιουργήθηκε ένα ολοκληρωμένο σύστημα ανάλυσης πρωτεϊνικών δεδομένων, το οποίο ενσωματώνει μια καινούρια μέθοδο προεπεξεργασίας πρωτεϊνικών δεδομένων. Η μέθοδος αυτή αντιμετωπίζει τα προβληματικά χαρακτηριστικά αυτού του τύπου δεδομένων και εκμεταλλεύεται τα πλεονεκτήματα διάφορων γνωστών μεθόδων. Πιο συγκεκριμένα, η στρατηγική που προτείνουμε εστιάζει σε τρία σημαντικά προβλήματα: τη διόρθωση των λαθών της βαθμονόμησης, την ανίχνευση των κορυφών με ευαίσθητο αλλά και σταθερό τρόπο και την ακριβή ποσοτικοποίηση κάθε κορυφής. Η ανίχνευση κορυφής πραγματοποιήθηκε μέσω μιας μεθόδου βασισμένης στη λογική της χρήσης του μέσου φάσματος, όπου πρώτα ανιχνεύουμε τις κορυφές ανά κατηγορία, έπειτα εφαρμόζουμε διάφορα κριτήρια αποκοπής για να βεβαιώσουμε την αναπαραγωγιμότητα τους και μετά τις συνενώνουμε σε ένα σύνολο κορυφών, κοινό για όλες τις κατηγορίες. Αντί να χρησιμοποιούμε συγκεκριμένες θέσεις για κάθε κορυφή, προτείνουμε τη χρήση διαστημάτων κορυφής, έτσι ώστε να βεβαιώσουμε ότι οι μικρές αποκλίσεις δε δημιουργούν σφάλματα στην ποσοτικοποίηση. Για να αποτιμήσουμε τα αποτελέσματα της μεθόδου μας, στα δεδομένα που προέκυψαν μετά την προεπεξεργασία εφαρμόστηκε ένα τελικό βήμα επιλογής χαρακτηριστικών και ταξινόμησης, με χρήση του αλγορίθμου ταξινόμησης Support Vector Machines. Η προτεινόμενη μέθοδος μας εφαρμόστηκε σε ένα σύνολο MALDI MS δεδομένων, το οποίο μας παρείχε η Ερευνητική Μονάδα Πρωτεωμικής του Ιδρύματος Ιατροβιολογικών Εφαρμογών Ακαδημίας Αθηνών (ΙΙΒΕΑΑ). Το συγκεκριμένο σύνολο δεδομένων περιέχει 200 περίπου δείγματα από ασθενείς με καρκίνο ουροδόχου κύστεως (υψηλού ή χαμηλού βαθμού) ή καλοήθη ασθένεια. Μετά την εφαρμογή της προτεινόμενης μεθόδου, καταλήξαμε σε έναν πίνακα 456 κορυφών και αντίστοιχων εντάσεων. Η εφαρμογή του βήματος της ταξινόμησης πέτυχε πολύ υψηλά ποσοστά ακρίβειας, ευαισθησίας και ειδικότητας. Επιπλέον, αναγνωρίστηκαν 31 στατιστικά σημαντικά χαρακτηριστικά, μερικά από τα οποία δεν ανιχνεύονται από τις υπάρχουσες μεθόδους. / The rapid developments in mass spectrometry (MS) and the introduction of new experimental ionization methods, like matrix-assisted laser desorption ionization (MALDI) and surface-enhanced laser desorption ionization (SELDI), has made it possible to study protein expression levels in complex mixtures of proteins from various biological samples, like serum plasma and urine. The data generated from these technologies can be used to identify proteomic patterns that can successfully separate states (e.g. normal versus disease) and possibly discover novel disease biomarkers. Those patterns have high diagnostic significance, as they can be used for early diagnosis, prognosis, monitoring disease progression or therapeutic response. This strategy has already been used in various types of cancer, like ovarian, breast and prostate cancer, giving interesting results. However, the complex nature of proteomics data makes their analysis a challenging task, as the initial raw data are very difficult to handle. More specifically, the data retrieved after an MS experiment contain hundreds of samples (i.e. mass spectra), and in each sample correspond tens of thousands of features. In addition to this high dimensionality – small sample size problem, each spectrum contains a great amount of noise and artifacts, mostly due to the high sensitivity of the instrument, sample contamination and electrical noise. Another common problem is the miscalibration of the spectra that makes the data impossible to compare. For all those reasons, it is more than obvious that in order to extract knowledge about the true underlying biological differences in the proteome, various preprocessing steps need to be applied. The main goal of preprocessing is to come up with a matrix of important features (i.e. peaks) and their corresponding intensity values, which can be further analyzed using a variety of computational methods. To achieve this, one must first remove noise, artifacts and systematic bias without loss of information and then detect and quantify a set of peaks. Preprocessing involves various steps that are highly interrelated and it has been shown that if those steps are not applied carefully, it will be difficult to extract meaningful conclusions about the underlying disease. For each step, a number of methods have been proposed making the decision about the best combination of methods a very challenging task. Furthermore, it is difficult to evaluate the performance of each method and come up with a standard strategy, as for each dataset a different set of methods appear to be more effective. This thesis presents a new pipeline method for the analysis of proteomics data, which incorporates a new preprocessing method. This proposed method deals with the problematic characteristics of this type of data and exploits the advantages of various existing methods. More specifically, our proposed strategy focuses on three main problems: correcting the miscalibration of the mass spectra, detecting the peaks in a sensitive yet robust manner and extracting the true intensity values that correspond in each peak. For the peak finding step, we used a method based on the mean spectrum approach, where we first find the peaks per category, then apply certain criteria to ensure their reproducibility and then combine them in a single peak list. Instead of working with peak locations, we propose the use of peak intervals, to ensure that the small shifts present in the data do not interfere with the final results. In order to evaluate the results of our method, a final feature extraction and classification step was applied in the preprocessed data, using the Support Vector Machines classification algorithm. Our proposed pipeline method was applied in a MALDI MS dataset, obtained by the Proteomics Research Unit of the Biomedical Research Foundation. This particular dataset contained approximately 200 samples, concerning patients with bladder cancer (high or low grade) and benign bladder disease. After the application of the proposed preprocessing method we ended up with a matrix of 456 peak bins and corresponding intensities. The application of the classification algorithm achieved extremely high performance in terms of accuracy, sensitivity and specificity. Furthermore, 31 statistically important peaks were identified, some of which are not detected by existing methods. Πρωτεωμική Φασματομετρία μαζών Ταξινόμηση Αναγνώριση προτύπων 572.6 Proteomics Mass Spectrometry Classification Pattern recognition
7	Ομαδοποίηση δεδομένων και εφαρμογές Σαρρής, Γιώργος 06 December 2013 (has links) Στην παρούσα διπλωματική εργασία γίνεται αναλυτική παρουσίαση των μεθόδων ομαδοποίησης, καθώς και της Ανάλυσης Κύριων Συνιστωσών (ΑΚΣ). Σκοπός είναι να μελετηθεί η αποτελεσματικότητα της χρήσης, της Ανάλυσης Κύριων Συνιστωσών σε σύνολα δεδομένων προς ομαδοποίηση. Πιο συγκεκριμένα, συγκρίνονται εμπειρικά τα πειραματικά αποτελέσματα που παράχθηκαν από την ομαδοποίηση συνόλων δεδομένων πριν και μετά τη χρήση της ΑΚΣ σε τεχνητά και πραγματικά σύνολα δεδομένων. Στο πρώτο κεφάλαιο πραγματοποιείται μία παρουσίαση των κύριων εννοιών που άπτονται της ομαδοποίησης δεδομένων, καθώς και παρουσιάζονται οι πιο γνωστές τεχνικές ομαδοποίησης. Στο δεύτερο κεφάλαιο παρουσιάζεται συνοπτικά η Ανάλυση Κύριων Συνιστωσών, καθώς και παραθέτονται διάφορα κριτήρια επιλογής του πλήθους των κύριων συνιστωσών. Η εργασία τελειώνει με την παρουσίαση πειραματικών αποτελεσμάτων ομαδοποίησης σε τεχνητά και πραγματικά σύνολα δεδομένων, πριν και μετά τη χρήση της ΑΚΣ με διαφορετικές τεχνικές ομαδοποίησης. / In the thesis at hand, several clustering methods along with the Principal Component Analysis (PCA) are presented. The main goal is to study the application of PCA on data sets for clustering purposes. More specifically, several clustering algorithms are compared through experimental simulations and results on data sets before and after the use of PCA respectively. For this purpose simulated and real case data are employed. The first chapter of the thesis is devoted to the analytical definition of clustering and the presentation of several clustering techniques. In the second chapter, the PCA method is presented along with an extended study on criteria for determining the number of principal directions. Finally, the thesis ends with extensive experimental results, discussion and concluding remarks. Ομαδοποίηση Αναγνώριση προτύπων Clustering Pattern recognition Principal component analysis
8	Ομαδοποίηση δεδομένων υψηλής διάστασης Τασουλής, Σωτήρης 09 October 2009 (has links) Η ομαδοποίηση ομαδοποιεί τα δεδομένα βασισμένη μόνο σε πληροφορία που βρίσκεται σε αυτά η οποία περιγράφει τα αντικείμενα και τις σχέσεις τους. Ο στόχος είναι τα αντικείμενα που βρίσκονται σε μια ομάδα να είναι όμοια(ή σχετικά) μεταξύ τους και διαφορετικά απο τα αντικείμενα των άλλων ομάδων. Όσο μεγαλύτερη είναι η ομοιότητα(ή η ομοιογένεια) σε μια ομάδα και όσο μεγαλύτερη είναι η διαφορετικότητα ανάμεσα στις ομάδες τόσο καλύτερη είναι η ομαδοποίηση. Οι μεθόδοι ομαδοποίησης μπορούν να διακριθούν σε τρείς κατηγορίες, ιεραρχικές, διαχωριστικές, και στις βασισμένες στη πυκνότητα. Οι ιεραρχικοί αλγόριθμοι μας δίνουν ιεραρχίες ομάδων σε μία top-down(συγχωνευτική) ή bottom-up(διαχωριστική) μορφή. Η εργασία αυτή επικεντρώνεται στην ιεραρχική διαχωριστική ομαδοποίηση. Ανάμεσα στους ιεραρχικούς διαχωριστικούς αλγορίθμους ξεχωρίζουμε τον αλγόριθμο Principal Direction Divisive Partitioning (PDDP). Ο PDDP χρησιμοποιεί την προβολή των δεδομένων στα κύρια συστατικά της αντίστοιχης μήτρας συνδιασποράς. Αυτό επιτρέπει την εφαρμογή σε δεδομένα υψηλής διάστασης. Στην εργασία αυτή προτείνεται μια βελτίωση του αλγορίθμου \Principal Direction Divisive Partitioning. Ο προτεινόμενος αλγόριθμος συνδυάζει στοιχεία από την εκτίμηση πυκνότητας και τις μεθόδους βασισμένες στην προβολή με έναν γρήγορο και αποδοτικό αλγόριθμο, ικανό να αντιμετωπίσει δεδομένα υψηλής διάστασης. Τα πειραματικά αποτελέσματα δείχνουν βελτιωμένη απόδοση ομαδοποίησης σε σύγκριση με άλλες δημοφιλείς μεθόδους. Επίσης ερευνάται το πρόβλημα του αυτόματου καθορισμού του πλήθους των ομάδων που είναι πολύ σημαντικό την ανάλυση ομάδων. / Cluster analysis groups data objects based only on information found in the data that describes the objects and their relationships. The goal is that the objects within a group be similar (or related) to one another and different from (or unrelated to) the objects in other groups. The greater the similarity (or homogeneity) within a group and the greater the difference between groups, the better or more distinct the clustering. Clustering methods can be broadly divided into three categories, hierarchical, partitioning and density-based (while there are other categorisations). Hierarchical algorithms provide nested hierarchies of clusters in a top-down (agglomerative), or bottom-up (divisive) fashion. This work is focused on the class of hierarchical divisive clustering algorithms. Amongst the class of divisive hierarchical algorithms, the Principal Direction Divisive Partitioning (PDDP) algorithm is of particular value. PDDP uses the projection of the data onto the principal components of the associated data covariance matrix. This allows the application to high dimensional data. In this work an improvement of the algorithm PDDP is proposed. The proposed algorithm merges concepts from density estimation and projection-based methods towards a fast and efficient clustering algorithm, capable of dealing with high dimensional data. Experimental results show improved partitioning performance compared to other popular methods. Moreover, we explore the problem of automatically determining the number of clusters that is central in cluster analysis. Ομαδοποίηση Αναγνώριση προτύπων 519.53 Clustering Singular value decomposition Pattern recognition Principal component analysis
9	Computer assisted diagnosis of brain tumors based on statistical methods and pattern recognition techniques / Υπολογιστικό σύστημα αυτόματης διάγνωσης όγκων εγκεφάλου με τη χρήση στατιστικών μοντέλων και μεθόδων αναγνώρισης προτύπων Γεωργιάδης, Παντελής 05 January 2011 (has links) Η εισαγωγή της Μαγνητικής Τομογραφίας (ΜΤ) στην κλινική πρακτική και η συμπληρωματική πληροφορία που δίνει η Φασματοσκοπία Μαγνητικού Συντονισμού (ΦΜΣ) συνιστά μια από τις πιο σημαντικές εξελίξεις στη διάγνωση ασθενών με καρκίνο εγκεφάλου [1]. Παρ’ όλα αυτά, οι εικόνες ΜΤ είναι συχνά δύσκολο να ερμηνευθούν από τους ειδικούς λόγω [2] α/ της υποκειμενικότητας και περιορισμένης εμπειρίας του παρατηρητή στην εκτίμηση εικόνων που παράγει η σχετικά νέα αυτή τεχνολογία, β/ των ποικίλων κλινικών χαρακτηριστικών των όγκων (π.χ. τύπος, διαβάθμιση κακοήθειας κλπ.) και γ/ της ιδιαιτερότητας των όγκων στην αντίθεση που παρουσιάζουν με τον περιβάλλοντα ιστό. Μόνο λιγοστές μελέτες έχουν διεξαχθεί για να χαρακτηρίσουν ιστούς εγκεφάλου μέσω της ανάλυσης ποσοτικών χαρακτηριστικών από εικόνες εγκεφάλου ΜΤ [3, 4]. Ενώ έχει ήδη τονιστεί η αναγκαιότητα συσχετισμού της διαγνωστικής και προγνωστικής πληροφορίας που προέρχεται από εικόνες ΜΤ και σήματα ΦΜΣ στη διεθνή βιβλιογραφία [5], υπάρχουν λιγοστές ανάλογες αναφορές για τον σχεδιασμό και υλοποίηση συστήματος Η/Υ αυτόματης διάγνωσης όγκων εγκεφάλου κάνοντας συνδυασμό ποσοτικής πληροφορίας προερχόμενης από εικόνες ΜΤ και σήματα ΦΜΣ [6, 7]. Οι στόχοι της παρούσας διατριβής εστιάζονται στα παρακάτω: - στη μελέτη, ανάπτυξη και η υλοποίηση υπολογιστικού συστήματος αυτόματης ταξινόμησης όγκων του εγκεφάλου μέσω της ποσοτικής ανάλυσης εικόνων ΜΤ το οποίο θα βελτιώνει την ακρίβεια ταξινόμησης σε σχέση με ήδη υπάρχοντα συστήματα [4, 8, 9], όπως αυτά περιγράφονται στην διεθνή βιβλιογραφία μεταξύ πρωτογενών και δευτερογενών όγκων εγκεφάλου καθώς και μεταξύ γλοιωμάτων και μηνιγγιωμάτων με την χρήση δέντρου ιεραρχικής απόφασης δύο επιπέδων. Επιπλέον, στην ανάδειξη πως η χρήση ενός μη-γραμμικού πολυωνυμικού μετασχηματισμού ελάχιστων τετραγώνων των χαρακτηριστικών υφής έχει ως αποτέλεσμα την βελτίωση της ακρίβειας ταξινόμησης του ταξινομητή πιθανοκρατικού νευρωνικού δικτύου. - στην επέκταση και την βελτίωση του συστήματος αυτόματης ταξινόμησης όγκων του εγκεφάλου χρησιμοποιώντας α/ ογκομετρικές ποσοτικές παραμέτρους εικόνων ΜΤ, β/ ταξινομητή μηχανών διανυσμάτων στήριξης μαζί με τη μεθοδολογία συνάθροισης αποτελεσμάτων ταξινόμησης από τυχαιοποιημένα δείγματα κατηγοριών δημιουργημένων με επαναδειγματοληψία για κάθε κόμβο δέντρου ιεραρχικής απόφασης δύο επιπέδων όπου στο πρώτο επίπεδο πραγματοποιήθηκε διαχωρισμός μεταξύ πρωτογενών και δευτερογενών όγκων εγκεφάλου και στο δεύτερο και μεταξύ γλοιωμάτων και μηνιγγιωμάτων και γ/ έναν τροποποιημένο πυρήνα ακτινικής συνάρτησης βάσης για τον ταξινομητή μηχανών διανυσμάτων στήριξης ο οποίος περιλαμβάνει την τεχνική μη-γραμμικού πολυωνυμικού μετασχηματισμού ελάχιστων τετραγώνων με στόχο την βελτίωση της ακρίβειας ταξινόμησης. - στην περαιτέρω επέκταση και την βελτίωση του συστήματος αυτόματης ταξινόμησης με την εισαγωγή χαρακτηριστικών προερχόμενων από σήματα ΦΜΣ ώστε να διερευνηθεί εάν η χρήση του μπορεί να βελτιώσει τα αποτελέσματα ταξινόμησης μεταξύ μηνιγγιωμάτων και μονήρων μεταστάσεων. Τέλος κάνοντας μια περίληψη, η παρούσα διατριβή διαπραγματεύεται τον σχεδιασμό, ανάπτυξη και υλοποίηση μεθόδων και αλγορίθμων για την επεξεργασία και ανάλυση ιατρικών εικόνων, επικεντρώνοντας ειδικότερα στην εφαρμογή των μεθόδων αυτών για την διάγνωση του τύπου των όγκων εγκεφάλου. Τα πιο βασικά συμπεράσματα που απορρέουν από την παρούσα διατριβή είναι τα ακόλουθα: α/ Το σύστημα ταξινόμησης των τύπων των όγκων εγκεφάλου που σχεδιάστηκε και υλοποιήθηκε αυξάνει τα ποσοστά ορθής ταξινόμησης σε σχέση με τα υπάρχοντα. β/ Η κωδικοποίηση των ιδιοτήτων της υφής που προέρχεται από τον σύνολο του όγκου παρέχει επιπρόσθετη πληροφορία στο σύστημα ταξινόμησης αυξάνοντας τα ποσοστά επιτυχούς διαχωρισμού. γ/ Τα χαρακτηριστικά φασματοσκοπίας μαγνητικού συντονισμού αποτελούν επιπρόσθετη αξία στο χαρακτηρισμό του τύπου των όγκων εγκεφάλου μιας και οδήγησαν στην αύξηση του ποσοστού επιτυχούς διαχωρισμού του συστήματος ταξινόμησης. / The process of brain tumor characterization requires a rather intricate assessment of the various Magnetic Resonance (MR) image and spectroscopic features and is typically performed by experienced radiologists. Despite the inherently subjective nature of many of the decisions associated with this process, an expert radiologist is able to perform this task with a significant degree of precision and accuracy. However, in the effort to deliver more effective treatment, clinicians are continuously seeking for greater accuracy in the pathological characterization of brain tissues. The aim of the present thesis was to design, implement, and evaluate a software classification system for discriminating between different brain tumor types on Magnetic Resonance Imaging (MRI), employing textural and spectroscopic features. The clinical material consisted of sixty seven T1-weighted post-contrast MR brain images (21 metastases, 19 meningiomas, and 27 gliomas), obtained from patients with verified and untreated intracranial tumors. Thirty-six 2-dimensional textural features (2D), from the image histogram and the co-occurrence and run-length matrices, were extracted from each one of 67 MR-images. Similarly, an equal number of 3-dimensional textural features (3D) were also calculated in the attempt to maximize classification performances. Finally, MR-spectroscopy features were also incorporated for improving classification accuracies. Classification methods employed included i/ a modified Probabilistic Neural Network (PNN) and Support Vector Machines (SVM) algorithms, incorporating a non-linear Least Squares Features Transformation (LSFT) into the classifiers and ii/ an ensemble classification scheme employing the LSFT-SVM classifier. The LSFT improved classifiers’ performances, increased class separability, and resulted in dimensionality reduction. For evaluating the performance of the designed classification schemes, evaluations were performed by means of the external cross validation process, which is considered indicative of the generalization performance of the designed classification system to ‘unseen’ cases. It was found that the LSFT features transformation enhanced the performance of the PNN and SVM algorithms, achieving classification accuracies of 73.48 % in distinguishing metastatic from primary tumors and 88.67% in discriminating gliomas from meningiomas. When volumetric 3-dimensional features were employed, these results improved to 88.18% for discriminating between metastatic and primary tumors and 97.33% for distinguishing gliomas from meningiomas. The textural features employed in the design of the optimum classification scheme were associated primarily with image texture homogeneity. Finally, when MR-spectroscopy features were also incorporated, classification accuracy was boosted up from 95% in discriminating meningiomas from metastasis to 100%. The MR-image features that participated in the optimum feature vector were related to the degree of homogeneity, the amount of randomness and the dispersion of the gray-tone intensity values within the texture of the tumor. These textural characteristics are related to textural parameters that physicians employ in diagnosis and they were proportional to the textural imprint of brain tumors, i.e. gliomas have heterogeneous texture while meningiomas appear to be homogeneous in MR imaging. The MR-spectroscopy feature that participated in the optimum feature vector was the Choline (Cho) / N-Acetyl Aspartate (NAA) metabolite integral ratio. It was found that both meningiomas and metastases are characterized from low concentrations of NAA while meningiomas exhibit higher concentrations of Cho than metastases, which could be attributed to increased synthesis of tumor cell membranes. Finally, the proposed system might be of value as an assisting tool for brain tumor characterization on volumetric MRI series. Brain tumors Pattern recognition Magnetic resonance image (MRI) 616.994 81 Όγκοι εγκεφάλου Αναγνώριση προτύπων
10	Μεθοδολογία ανάπτυξης νέων συστημάτων μάθησης στην επεξεργασία, ανάλυση και ταξινόμηση ιατρικής εικόνας / Development of new machine learning methods for medical image processing and analysis Γκλώτσος, Δημήτριος 11 December 2008 (has links) Η διαχείριση της πληροφορίας που προέρχεται από εικόνες ιστοπαθολογίας μικροσκοπίου (βιοψίες) αποτελεί διεργασία υψηλής πολυπλοκότητας που αξιοποιείται για την εξαγωγή διαγνωστικών και προγνωστικών συμπερασμάτων από τον ιστοπαθολόγο. Η πολυπλοκότητα αυτή πηγάζει από τον τεράστιο όγκο βιολογικών οντοτήτων που περιέχονται στο δείγμα βιοψίας αλλά και στις μεταξύ τους πολυσύνθετες αλληλεπιδράσεις. Οι πιο σύγχρονες μέθοδοι τεχνητής νοημοσύνης προτείνουν εναλλακτικές προσεγγίσεις για την επίλυση των προβλημάτων υψηλής πολυπλοκότητας αυτού του τύπου. Ανάμεσα όμως στην είσοδο (δεδομένα) και έξοδο (αποτέλεσμα) των ‘έξυπνων’ υπολογιστικών συστημάτων, κρύβεται η μεθοδολογία και στρατηγική επεξεργασίας και ανάλυσης της διαθέσιμης πληροφορίας. Κατά το στάδιο αυτό οι παράμετροι ελέγχου διαχωρίζονται και συσχετίζονται μεταξύ τους ΄τυφλά’ (π.χ. με νευρωνικά δίκτυα, ασαφή λογική) σύμφωνα με συγκεκριμένα μαθηματικά κριτήρια (π.χ. πιθανοκρατικά, ελάχιστων τετραγώνων κ.α.) χωρίς όμως να λαμβάνουν υπόψη την ‘ευρετική’ (heuristic) του ειδικού με αποτέλεσμα να παρουσιάζουν πεπερασμένη ακρίβεια, μεγάλο χρόνο υλοποίησης, αδυναμία γενίκευσης. Έτσι, η απόδοση των συστημάτων αυτών εξαρτάται από το μέγεθος και ποιότητα (θορυβώδη, ελλιπή δεδομένα κ.α.) των δεδομένων, το πλήθος των συνδυασμών των ποσοτικών χαρακτηριστικών που περιγράφουν τα δεδομένα, τον καθορισμό των πλούσιων σε πληροφορία χαρακτηριστικών, την σημαντικότητα των επιμέρους χαρακτηριστικών και των μαθηματικών κριτηρίων ταξινόμησης. Για παράδειγμα πολλά χαρακτηριστικά περιγράφουν καλύτερα την υπό μελέτη διεργασία αλλά η εξαγωγή των πλούσιων σε προγνωστική πληροφορία χαρακτηριστικών απαιτεί πολλούς συνδυασμούς και μεγάλη υπολογιστική ισχύ. Επίσης πολλά χαρακτηριστικά σημαίνει εξειδίκευση του συστήματος στα δεδομένα εκπαίδευσης και αδυναμία εφαρμογής σε άγνωστα δεδομένα. Η παρούσα διατριβή διαπραγματεύεται τον σχεδιασμό, ανάπτυξη και υλοποίηση νέων μεθόδων επεξεργασίας και ανάλυσης ιατρικών εικόνων, επικεντρώνοντας ειδικότερα στην εφαρμογή των μεθόδων αυτών σε υπολογιστικό σύστημα μικροσκοπίας για την διάγνωση όγκων εγκεφάλου τύπου αστροκυττώματος. / Even though histological diagnosis is fundamentally important for patient's management, the potential of diagnostic errors in astrocytomas grading still remains substantially high, ranging from 25% to 40% in routine conditions. Diagnostic errors originate mainly from the lack of experience of experts; rare cancers low prevalence and their biological complexity hinder the establishment of concrete criteria able to predict tumours' behaviour, and, thus, to administrate proper treatments. The latter might explain the fact that a/ although promising treatments have been proposed, death rates have not been yet reduced and b/ the cost of rare cancers management still remains one of the highest healthcare economic burdens in Europe and worldwide. The aim of this thesis was to design, develop and implement new computerized methods to improve manual and computer-assisted malignancy grading of astrocytomas. Scientific objectives comprised: a/ develop a reliable and accurate segmentation algorithm for nuclei detection in routinely stained with H&E histopathological images of astrocytomas, b/ investigate and quantify modifications in nuclei morphology and texture with respect to the degree of tumour abnormality of astrocytic tumours, c/ evaluate whether quantitative analysis of cell nuclei by computer-assisted image analysis could assist the routinely performed malignancy grading of astrocytomas using conventional means, d/ investigate potential modifications in chromatin distribution, which might be used to improve the diagnostic evaluation of cases that histopathologists have difficulty in reaching definite diagnosis (i.e. 'intermediate' grade tumours), e/ support more reliable separation of high grade tumours into clinically meaningful subgroups of patients with grade III and grade IV tumours. For realizing the above objectives, a computer-assisted microscopy system was designed, built and implemented. The system was developed using novel methodologies that integrated state-of-art pattern recognition algorithms for microscopy image segmentation and classification. In addition, new classification techniques have been introduced. The usefulness of the proposed methods has been validated experimentally. Αστροκυττώματα Αναγνώριση προτύπων 616.075 8 Brain cancer Astrocytomas Computer-aided microscopy Medical image processing and analysis Pattern recognition

Search results