• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 67
  • 3
  • Tagged with
  • 70
  • 68
  • 65
  • 63
  • 19
  • 16
  • 16
  • 14
  • 11
  • 10
  • 9
  • 9
  • 9
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Βελτίωση μετεωρολογικών προγνώσεων με χρήση τεχνητών νευρωνικών δικτύων για τη βελτιστοποίηση συστήματος ενεργειακής διαχείρισης κτιρίων

Θραμπουλίδης, Εμμανουήλ 27 January 2014 (has links)
Σημαντική παράμετρος στο σχεδιασμό των σύγχρονων κτιρίων αποτελεί η ορθολογικότερη διαχείριση της ενέργειας. Η ορθολογικότερη διαχείριση ενέργειας επιτυγχάνεται με το σχεδιασμό κατάλληλων ενεργειακών συστημάτων. Για την αποτελεσματική σχεδίαση αυτών των συστημάτων λαμβάνονται υπόψιν τα μετεωρολογικά δεδομένα, όχι μόνο τα τρέχοντα αλλά και τα προγνωστικά. Τα αριθμητικά πρότυπα πρόγνωσης καιρού παρέχουν εκτιμήσεις των διαφόρων μετεωρολογικών παραμέτρων σε δεδομένα σημεία του χώρου κοντά στην επιφάνεια του εδάφους αλλά και σε διάφορα ύψη. Οι εκτιμήσεις αυτές αποκλίνουν αρκετά από τα πραγματικά δεδομένα γεγονός που παρέχει ένα σημαντικό περιθώριο βελτίωσης της πρόγνωσης. Στην εργασία αυτή προτείνεται μία μέθοδος βελτίωσης της πρόγνωσης μετεωρολογικών δεδομένων με στόχο την αξιοποίηση τους για βελτιστοποίηση της ενεργειακής κατανάλωσης κτιρίου. Η μέθοδος αναπτύχθηκε χρησιμοποιώντας μετρήσεις της ταχύτητας του ανέμου από το μετεωρολογικό σταθμό του Εργαστηρίου Φυσικής της Ατμόσφαιρας του Τμήματος Φυσικής του Πανεπιστημίου Πατρών (ΕΦΑΠ2), καθώς και προγνώσεις του ΕΦΑΠ2 μέσω του αριθμητικού προτύπου πρόγνωσης καιρού WRF (Weather Research and Forecasting model) στο πλησιέστερο δυνατό πλεγματικό σημείο. . Η μέθοδος που προτείνεται, αξιοποιεί τα τεχνητά νευρωνικά δίκτυα και όντας ανεξάρτητη της φύσης της εισόδου μπορεί να χρησιμοποιηθεί για τη βελτίωση της πρόγνωσης μετεωρολογικών παραμέτρων. Επιπλέον, μελετήθηκε η συνεισφορά της μεθόδου στον ακριβέστερο υπολογισμό της ροής αέρα, η οποία υπολογίζεται για ένα πειραματικό θάλαμο δοκιμών, ο οποίος έχει υιοθετηθεί από την Ευρωπαϊκή επιτροπή για την εναρμονισμένη μελέτη ενεργειακών συστημάτων κτιρίων υπό πραγματικές συνθήκες. / An important consideration in the design of modern buildings is the rational use of energy. The rational energy management is achieved by designing appropriate energy systems. For efficient design of these systems we should take into account the meteorological data, not only current but also predictive.Numerical weather prediction models provide estimates of various meteorological parameters to data points of space near the surface and at various heights. These estimates differ considerably from the actual data which provides a significant margin improvement of prognosis. In this work we propose a method of improving the prediction of meteorological data to exploit them to optimize energy consumption in building management systems. The method was developed using measurements of wind speed, from the meteorological station of the Laboratory of Atmospheric Physics of the Department of Physics of the University of Patras (LAPUP), and prognostications LAPUP through numerical weather prediction model WRF (Weather Research and Forecasting model) to the closest possible lattice point. The proposed method utilizes the artificial neural networks and being independent of the nature of the inputs it can be used to improve forecasting meteorological parameters. Furthermore, we studied the contribution of the method to accurately calculate the air flow of an experimental test chamber, which has been adopted by the European Committee for the study of building management systems under real conditions.
42

Ταξινόμηση δεδομένων ραντάρ συνθετικού ανοίγματος (SAR) με χρήση νευρωνικών δικτύων

Μουστάκα, Μαρία 30 April 2014 (has links)
Η χρήση των δεδομένων Ραντάρ Συνθετικού Ανοίγματος (SAR) σε εφαρμογές απομακρυσμένης παρακολούθησης της Γης έχει ήδη αρχίσει να πρωταγωνιστεί τις τελευταίες δεκαετίες. Τα συστήματα SAR με δυνατότητες μεταξύ άλλων συνεχούς λειτουργίας παντός καιρού, ημέρα και νύχτα, προσφέροντας μεγάλη κάλυψη εδάφους και με δυνατότητα λήψης απεικονίσεων πολλαπλών πολώσεων, έχουν αποτελέσει πηγή πολύτιμων πληροφοριών τηλεπισκόπησης. Έτσι, η χρήση των SAR δεδομένων για την ταξινόμηση κάλυψης γης προσελκύει όλο και περισσότερο την προσοχή των ερευνητών και φαίνεται να είναι πολλά υποσχόμενη. Η παρούσα ειδική επιστημονική εργασία έχει στόχο τη μελέτη και ερμηνεία των δεδομένων SAR μέσω επιβλεπόμενης ταξινόμησης, με τη χρήση νευρωνικών δικτύων (Neural Networks). Αφού πρώτα γίνεται εκτενής αναφορά στη τεχνολογία και τα συστήματα SAR, παρουσιάζεται αναλυτικά η πειραματική διαδικασία ταξινόμησης τριών βασικών δομών κάλυψης γης. Τα δεδομένα προέρχονται από το Προηγμένο Ραντάρ Συνθετικού Ανοίγματος (ASAR) του δορυφόρου ENVISAT από τον Ευρωπαϊκό Οργανισμό Διαστήματος και αφορούν στην ευρύτερη περιοχή του Άμστερνταμ. Πριν την διεξαγωγή της ταξινόμησης, τα δεδομένα δέχθηκαν τις απαραίτητες διαδικασίες προ-επεξεργασίας (ραδιομετρική βαθμονόμηση, γεωαναφορά, φιλτράρισμα θορύβου, συμπροσαρμογή). Όσον αφορά τη διαδικασία της ταξινόμησης, εξετάζεται η συμπεριφορά του ταξινομητή του νευρωνικού δικτύου για μεταβολές ποικίλων παραμέτρων, όπως η επιλογή δεδομένων διαφόρων πολώσεων, το πλήθος των νευρώνων κ.α. και ήδη από τα πρώτα πειράματα λαμβάνονται ικανοποιητικά αποτελέσματα. Στη συνέχεια εφαρμόζονται τεχνικές σύνθεσης πληροφορίας (average rule, majority rule) βελτιώνοντας τις επιδόσεις ταξινόμησης. Τέλος, ένα σημαντικό βήμα που εφαρμόζεται στη διαδικασία ταξινόμησης αποτελεί η εξαγωγή χαρακτηριστικών υφής από τις μήτρες συνεμφάνισης φωτεινοτήτων (Gray Level Co-occurrence Matrix-GLCM) και μήκους διαδρομής φωτεινότητας (Gray Level Run Length Matrix-GLRLM). Η χρήση των χαρακτηριστικών αυτών βελτιστοποιεί το σύστημα ταξινόμησης, δίνοντας εξαιρετικά αποτελέσματα. / The use of Synthetic Aperture Radar (SAR) data in remote sensing applications has become a cutting edge technology during the past few decades. The SAR systems have several capabilities, like day & night and all weather operation and they offer large ground coverage with the ability of multi-polarized imagery; therefore, they have proved to be a valuable source of remote sensing data. As a result, the use of SAR data for land cover classification increasingly attracts the attention of researchers and seems to be highly promising. Goal of this master thesis is the study and interpretation of SAR data through supervised classification, with the use of Neural Networks method. First, there is an extensive presentation of SAR systems and technology and then follows the detailed presentation of the experimental classification process for three basic land cover structures. The available data are from the Advanced SAR (ASAR) radar of the ESA ENVISAT satellite and correspond to the Amsterdam city and suburbs. Prior to the classification process, the data have been appropriately pre-processed (radiometric calibration, geocoding, speckle filtering, co-registration). Regarding the classification process, the response of the neural network classifier with the variation of several parameters (e.g. data polarization and number of neurons) is studied and from the initial test already the results were quite satisfactory. Further on, ensemble classifying methods (average rule, majority rule) are applied to improve the classification performance. Finally, as an essential step applied in the classification process is the textural feature extraction from Gray Level Co-occurrence Matrix (GLCM) and Gray Level Run Length Matrix (GLRLM). The use of these texture features optimizes the classification system, resulting to an exceptional performance.
43

Μελέτη με MRI μετακτινικών αλλοιώσεων στα οστά ασθενών με μεταστατικούς ή πρωτοπαθείς όγκους που υποβάλλονται σε ακτινοθεραπεία

Ρωμανός, Οδυσσεύς 10 June 2014 (has links)
Ο μυελός των οστών επηρεάζεται από λεμφοϋπερπλαστικές διαταραχές, μεταστατική νόσο, αλλά και από διάφορες θεραπευτικές προσεγγίσεις. Η μαγνητική τομογραφία είναι η πιο κατάλληλη μέθοδος για την ανίχνευση των μεταστάσεων και την παρακολούθηση μετά τη θεραπεία. Τεχνικές ανάλυσης εικόνας χρησιμοποιούνται επιπλέον προκειμένου να αντλήσουμε πρόσθετες διαγνωστικές πληροφορίες. Η παρούσα μελέτη επικεντρώνεται στις πρώιμες αλλαγές που προκαλούνται στον οστικό μυελό μετά από ακτινοβόληση και συγκρίνει καθιερωμένες μεθόδους για την ταυτοποίηση και τον χαρακτηρισμό αυτών των βλαβών με τη χρήση ενός αυτοματοποιημένου συστήματος ταξινόμησης. ΜΕΘΟΔΟΙ: 36 ασθενείς με ιστολογικά επιβεβαιωμένη πρωτοπαθή κακοήθεια και οστικές μεταστάσεις συμπεριλήφθηκαν στη μελέτη. Όλοι οι ασθενείς υποβλήθηκαν σε ακττινοθεραπεία για την αντιμετώπιση οστικών μεταστάσεων στη σπονδυλική στήλη ή τη λεκάνη. Η μαγνητική τομογραφία πραγματοποιήθηκε ακριβώς πριν, 12 έως 18 ημέρες και 3 μήνες μετά την έναρξη της ακτινοθεραπείας. Ελήφθησαν εικόνες εντός, πλησίον και εκτός του πεδίου ακτινοβόλησης. Η ποιοτική αξιολόγηση πραγματοποιήθηκε ανεξάρτητα από δύο έμπειρους ακτινολόγους. Για την ποσοτική αξιολόγηση, συγκεκριμένες μετρήσεις επιλέχθηκαν και αξιολογήθηκαν με τη μέθοδο της περιοχής ενδιαφέροντος. Επιπλέον, χαρακτηριστικά υφής 1ης και 2ης τάξης εξήχθησαν και τοποθετήθηκαν σε ένα πιθανοτικό νευρωνικό δίκτυο, προκειμένου να δημιουργηθεί ένα σύστημα αυτόματης ταξινόμησης των βλαβών. ΑΠΟΤΕΛΕΣΜΑΤΑ: Σύμφωνα με την ποιοτική και ποσοτική αξιολόγηση, εντός του πεδίου ακτινοβολίας 22.22% και 33.33% των ασθενών αντίστοιχα παρουσίασε λιπώδη μεταστροφή του μυελού, 19.44% και 16.67% των ασθενών παρουσίασε αιμορραγία, ενώ 11.11% και 16.67% των ασθενών εμφάνισε οίδημα του οστικού μυελού. Παρακείμενα του πεδίου ακτινοβόλησης 11.11% και 19.44% των ασθενών παρουσίασε λιπώδη μεταστροφή, 8.33% παρουσίασε αιμορραγία, ενώ 2.78% και 8.33% έδειξε οίδημα του μυελού των οστών. Εκτός του πεδίου ακτινοβολίας 5.56% των ασθενών παρουσίασαν αλλαγές συμβατές με λιπώδη μεταστροφή, ενώ το υπόλοιπο 94.44% δεν έδειξε σημαντικές μεταβολές. Δεν υπήρξε στατιστικά σημαντική μεταβολή του δείκτη σκιαγραφικής ενίσχυσης μετά τη χορήγηση γαδολινίου. Με βάση την πολυπαραγοντική ανάλυση, καμία από τις παραμέτρους που μελετήθηκαν δεν φάνηκε να επηρεάζει στατιστικά σημαντικά την εμφάνιση οποιασδήποτε από τις μετακτινικές αλλοιώσεις. Η μέγιστη συνολική ακρίβεια ταξινόμησης του συστήματός μας, ως προς τη διάκριση μεταξύ προ και μετακτινικών εικόνων ήταν 93.02%, με χρήση του συστήματος ταξινόμησης LSFT - PNN και της μεθόδου ECV. Η ακρίβεια του συστήματος στη διάκριση μεταξύ των τριών κυρίων τύπων των μετακτινικών βλαβών ήταν 86.67% . ΣΥΜΠΕΡΑΣΜΑΤΑ: Η παρούσα μελέτη δείχνει ότι σημαντικό ποσοστό των ασθενών που υποβάλλονται σε ακτινοθεραπεία θα εμφανίσει τουλάχιστον μία από τις κοινές μετακτινικές μεταβολές του οστικού μυελού. Η λιπώδης μεταστροφή του μυελού είναι η πιο συχνά εμφανιζόμενη πρώιμη μεταβολή. Η ποιοτική ανάλυση των εικόνων μαγνητικής τομογραφίας υστερεί σε ευαισθησία σε σύγκριση με τις ποσοτικές μετρήσεις. Το βασζόμενο σε νευρικό δίκτυο προτεινόμενο σύστημα ταξινόμησης μπορεί να αποδειχθεί χρήσιμο εργαλείο για το χαρακτηρισμό αυτών των βλαβών. / Bone marrow can be affected by lymphoproliferative disorders and metastatic disease but also by several therapeutic approaches. MRI is the most suitable method for the detection of metastases and post-treatment follow-up. Image analysis techniques are now used to extract additional diagnostic information. This study focuses on the early radiation-induced changes that can be detected by MRI and compares the established methods for the identification and characterization of these lesions with an automated classification system. METHODS: 36 patients with histologically confirmed primary malignancy and associated bone metastases were included in the study. All patients underwent radiation therapy (RT) to treat bone metastases to the spinal column or the pelvis. Magnetic resonance imaging (MRI) was performed just before the start of RT, 12 to 18 days and up to 3 months after the start of RT. Images were obtained within, adjacent and outside the radiation field. Qualitative assessment was performed independently by two experienced radiologists. For quantitative assessment, specific measurements were selected and evaluated by the method of the region of interest (ROI). In addition, textural features of 1st and 2nd class were exported and inserted into a probabilistic neural network classifier, in order to create an automatic classification system for these lesions. RESULTS: Following qualitative and quantitative assessment, within the radiation field, 22.22% and 33.33% of patients respectively showed fatty conversion of the bone marrow, 19.44% and 16.67% of patients showed haemorrhage, while 11.11% and 16.67% of the patients demonstrated bone marrow oedema. Adjacent to the radiation field, 11.11% and 19.44% of patients showed fatty conversion, 8.33% showed haemorrhage, while 2.78% and 8.33% demonstrated bone marrow oedema. Outside of the radiation field, 5.56% of patients showed changes compatible with fatty conversion, while the remaining 94.44% showed no significant change. There was no statistically significant change of the enhancement index after gadolinium administration. In multivariate analysis, none of the studied parameters did not appear to affect significantly the appearance of any of the radiation-induced lesions. The largest overall classification accuracy of the system designed to distinguish between the pre- radiation and radiation-induced images was 93.02% using the LSFT-PNN classification system of multiple sequences and the ECV method. Discrimination accuracy of the classification system designed to distinguish between the three main types of post-radiation lesions was 86.67%. CONCLUSIONS: This study shows that a significant proportion of patients undergoing RT will experience at least one of the common radiation-induced bone marrow changes. Fatty marrow conversion is the most often featured change in the examined period. Qualitative analysis of the MRI images lacks sensitivity comparing to quantitative measurements. The proposed classification system, based on the neural network, can be used as a very helpful tool for the characterization of these lesions.
44

Σχεδιασμός και υλοποίηση πολυκριτηριακής υβριδικής μεθόδου ταξινόμησης βιολογικών δεδομένων με χρήση εξελικτικών αλγορίθμων και νευρωνικών δικτύων

Σκρεπετός, Δημήτριος 09 October 2014 (has links)
Δύσκολα προβλήματα ταξινόμησης από τον χώρο της Βιοπληροφορικής όπως η πρόβλεψη των microRNA γονιδιών και η πρόβλεψη των πρωτεϊνικών αλληλεπιδράσεων (Protein- Protein Interactions) απαιτούν ισχυρούς ταξινομητές οι οποίοι θα πρέπει να έχουν καλή ακρίβεια ταξινόμησης, να χειρίζονται ελλιπείς τιμές, να είναι ερμηνεύσιμοι, και να μην πάσχουν από το πρόβλημα ανισορροπίας κλάσεων. Ένας ευρέως χρησιμοποιούμενος ταξινομητής είναι τα νευρωνικά δίκτυα, τα οποία ωστόσο χρειάζονται προσδιορισμό της αρχιτεκτονικής τους και των λοιπών παραμέτρων τους, ενώ και οι αλγόριθμοι εκμάθησής τους συνήθως συγκλίνουν σε τοπικά ελάχιστα. Για τους λόγους αυτούς, προτείνεται μία πολυκριτηριακή εξελικτική μέθοδος η οποία βασίζεται στους εξελικτικούς αλγορίθμους ώστε να βελτιστοποιήσει πολλά από τα προαναφερθέντα κριτήρια απόδοσης των νευρωνικών δικτύων, να βρει επίσης την βέλτιση αρχιτεκτονική καθώς και ένα ολικό ελάχιστο για τα συναπτικά τους βάρη. Στην συνέχεια, από τον πληθυσμό που προκύπτει χρησιμοποιούμε το σύνολό του ώστε να επιτύχουμε την ταξινόμηση. / Hard classification problems of the area of Bioinformatics, like microRNA prediction and PPI prediction, demand powerful classifiers which must have good prediction accuracy, handle missing values, be interpretable, and not suffer from the class imbalance problem. One wide used classifier is neural networks, which need definition of their architecture and their other parameters, while their training algorithms usually converge to local minima. For those reasons, we suggest a multi-objective evolutionary method, which is based to evolutionary algorithms in order to optimise many of the aforementioned criteria of the performance of a neural network, and also find the optimised architecture and a global minimum for its weights. Then, from the ensuing population, we use it as an ensemble classifier in order to perform the classification.
45

Αναγνώριση προτύπων από εικόνες

Κωτσιόπουλος, Χάρης 06 November 2014 (has links)
Η παρούσα διπλωματική εργασία ασχολείται με ένα σημαντικό ερευνητικό πρόβλημα του πεδίου της υπολογιστικής όρασης το οποίο είναι η Αναγνώριση Προτύπων (pattern recognition) μέσα από εικόνες. Πιο συγκεκριμένα, θα μελετήσουμε τον σχεδιασμό και την υλοποίηση ενός συστήματος αναγνώρισης αντικειμένων από ψηφιακές εικόνες καθώς και την ταξινόμησή τους σε κατηγορίες (image classification). / This thesis deals with an important research problem field of computer vision which is pattern recognition through images. In particular, we will study the design and implementation of a system to recognize objects from digital images and their classification in categories (image classification).
46

Μελέτη και χρήση τεχνικών τεχνητής νοημοσύνης για διαχείριση ιατρικής πληροφορίας

Σταματοπούλου, Κωνσταντίνα - Μαρία 05 February 2015 (has links)
Η τεχνητή νοημοσύνη στη βιοπληροφορική θεωρείται ένα πολύ σημαντικό βήμα αναφορικά με την κατηγοριοποίηση των ασθενειών, ακόμα και τη θεραπεία αυτών. Μέσω των νευρωνικών δικτύων τεχνητής νοημοσύνης μπορούμε να επεξεργαστούμε ιατρική πληροφορία και να κατηγοριοποιήσουμε μοτίβα καίριας σημασίας όσον αφορά την ιατρική διάγνωση. Βέβαια, καθώς στη λήψη αποφάσεων πάντα εισχωρεί ο παράγοντας της αβεβαιότητας, μία από τις πιο κατάλληλες προσεγγίσεις, η οποία προσομοιώνει τον τρόπο που κάθε άνθρωπος λαμβάνει αποφάσεις, είναι η ασαφής λογική. Συνδιάζοντας την ασαφή λογική με τη γνώση ειδικών μπορούμε να μοντελοποιήσουμε σύνθετα φαινόμενα και να αποφανθούμε για τη φύση αυτών. Σε αυτή τη διπλωματική εργασία υλοποιείται ένα ασαφές έξυπνο σύστημα που έχει ως σκοπό να μοντελοποιήσει πέντα καρδιολογικής φύσεως ασθένειες, χρησιμοποιώντας υλικό το οποίο προέρχεται από τη γνώση ειδικών στον τομέα της καρδιολογίας: στεφανιαία νόσος, υπέρταση, κολπική μαρμαρυγή, καρδιακή ανεπάρκεια, διαβήτης. Επιπλέον, το σύστημα, σε συνεργασία με το αρμόδιο ιατρικό προσωπικό, παραμετροποιήθηκε και στη συνέχεια έγινε προσπάθεια βελτιστοποίησής του μέσω της ενσωμάτωσης νευρωνικών δικτύων. Η αποδοτικότητά του αξιολογήθηκε ευνοϊκά μέσα από μία ομάδα ιατρών, δίνοντας ελπίδες για μία νέα εποχή στον τρόπο διεξαγωγής ιατρικής διάγνωσης. Το συγκεκριμένο σύστημα θα αποτελέσει τμήμα του Cardiosmart365, ενός ολοκληρωμένου συστήματος για τη δια βίου παρακολούθηση ασθενών με καρδιολογικά προβλήματα, την έγκαιρη διάγνωση και τη βέλτιστη διαχείριση περιπτώσεων εκτάκτου ανάγκης. Σε αυτό το έξυπνο ασαφές σύστημα προσαρτάται η γνώση που προκύπτει μέσα από τα νευρωνικά δίκτυα, με την οποία και επιτυγχάνεται αυτόματα η βελτιστοποίησή του. / Arti cial intelligence (AI) in bioinformatics is considered to be a great step towards disease classi cation, or even disease treatment. AI gives the opportunity through arti cial neural networks (ANNs) to process medical information and classify pat- terns, something of great importance, as far as medical diagnosis is conserned. How- ever, since there is always the factor of uncertainty in decision making, fuzzy logic is considered to be one of the most suitable approximations, since it deals with reason- ing that is approximate rather than xed and exact, thus closer to human reasoning. Therefore, based on human expert knowledge they are capable of modeling complex phenomena. In this diploma thesis, we implement a fuzzy expert system, consisting of ve subsystems, concerning ve cariological diseases, incorporating expert knowledge on this particular eld: coronary artery disease, hypertension, atrial brillation, heart failure, and diabetes. Moreover, the parameters were con gured, in cooperation with experts on the eld, and optimization e orts were made through the integration of neural networks. Evaluated by a group of doctors, the e ciency was rated as satisfactory, giving hope for a new era in the way medical diagnosis is conducted. This system will be a part of Cardiosmart365, an integrated system for lifelong cardiologic patient monitoring, early detection of emergency, and optimal process management of the emergency incident. In the fuzzy expert system implemented, knowledge through neural networks is incorporated, thus achieving automatic opti- mization.
47

Σχεδιασμός και ανάπτυξη αλγορίθμου συσταδοποίησης μεγάλης κλίμακας δεδομένων

Γούλας, Χαράλαμπος January 2015 (has links)
Υπό το φάσμα της νέας, ανερχόμενης κοινωνίας της πληροφορίας, η σύγκλιση των υπολογιστών με τις τηλεπικοινωνίες έχει οδηγήσει στην συνεχώς αυξανόμενη παραγωγή και αποθήκευση τεράστιου όγκου δεδομένων σχεδόν για οποιονδήποτε τομέα της ανθρώπινης ενασχόλησης. Αν, λοιπόν, τα δεδομένα αποτελούν τα καταγεγραμμένα γεγονότα της ανθρώπινης ενασχόλησης, οι πληροφορίες αποτελούν τους κανόνες, που τα διέπουν. Και η κοινωνία στηρίζεται και αναζητά διακαώς νέες πληροφορίες. Το μόνο που απομένει, είναι η ανακάλυψη τους. Ο τομέας, που ασχολείται με την συστηματική ανάλυση των δεδομένων με σκοπό την εξαγωγή χρήσιμης γνώσης ονομάζεται μηχανική μάθηση. Υπό αυτό, λοιπόν, το πρίσμα, η παρούσα διπλωματική πραγματεύεται την μηχανική μάθηση ως μια ελπίδα των επιστημόνων να αποσαφηνίσουν τις δομές που διέπουν τα δεδομένα και να ανακαλύψουν και να κατανοήσουν τους κανόνες, που “κινούν” τον φυσικό κόσμο. Αρχικά, πραγματοποιείται μια πρώτη περιγραφή της μηχανικής μάθησης ως ένα από τα βασικότερα δομικά στοιχεία της τεχνητής νοημοσύνης, παρουσιάζοντας ταυτόχρονα μια πληθώρα προβλημάτων, στα οποία μπορεί να βρει λύση, ενώ γίνεται και μια σύντομη ιστορική αναδρομή της πορείας και των κομβικών της σημείων. Ακολούθως, πραγματοποιείται μια όσο το δυνατόν πιο εμπεριστατωμένη περιγραφή, μέσω χρήσης εκτεταμένης βιβλιογραφίας, σχεδιαγραμμάτων και λειτουργικών παραδειγμάτων των βασικότερων κλάδων της, όπως είναι η επιβλεπόμενη μάθηση (δέντρα αποφάσεων, νευρωνικά δίκτυα), η μη-επιβλεπόμενη μάθηση (συσταδοποίηση δεδομένων), καθώς και πιο εξειδικευμένων μορφών της, όπως είναι η ημί-επιβλεπόμενη μηχανική μάθηση και οι γενετικοί αλγόριθμοι. Επιπρόσθετα, σχεδιάζεται και υλοποιείται ένας νέος πιθανοτικός αλγόριθμος συσταδοποίησης (clustering) δεδομένων, ο οποίος ουσιαστικά αποτελεί ένα υβρίδιο ενός ιεραρχικού αλγορίθμου ομαδοποίησης και ενός αλγορίθμου διαμέρισης. Ο αλγόριθμος δοκιμάστηκε σε ένα πλήθος διαφορετικών συνόλων, πετυχαίνοντας αρκετά ενθαρρυντικά αποτελέσματα, συγκριτικά με άλλους γνωστούς αλγορίθμους, όπως είναι ο k-means και ο single-linkage. Πιο συγκεκριμένα, ο αλγόριθμος κατασκευάζει συστάδες δεδομένων, με μεγαλύτερη ομοιογένεια κατά πλειοψηφία σε σχέση με τους παραπάνω, ενώ το σημαντικότερο πλεονέκτημά του είναι ότι δεν χρειάζεται κάποια αντίστοιχη παράμετρο k για να λειτουργήσει. Τέλος, γίνονται προτάσεις τόσο για περαιτέρω βελτίωση του παραπάνω αλγορίθμου, όσο και για την ανάπτυξη νέων τεχνικών και μεθόδων, εναρμονισμένων με τις σύγχρονες τάσεις της αγοράς και προσανατολισμένων προς τις απαιτητικές ανάγκες της νέας, αναδυόμενης κοινωνίας της πληροφορίας. / In the spectrum of a new and emerging information society, the convergence of computers and telecommunication has led to a continuously increasing production and storage of huge amounts of data for almost any field of human engagement. So, if the data are recorded facts of human involvement, then information are the rules that govern them. And society depends on and looking earnestly for new information. All that remains is their discovery. The field of computer science, which deals with the systematic analysis of data in order to extract useful information, is called machine learning. In this light, therefore, this thesis discusses the machine learning as a hope of scientists to elucidate the structures that govern the data and discover and understand the rules that "move" the natural world. Firstly, a general description of machine learning, as one of the main components of artificial intelligence, is discussed, while presenting a variety of problems that machine learning can find solutions, as well as a brief historical overview of its progress. Secondly, a more detailed description of machine learning is presented by using extensive literature, diagrams, drawings and working examples of its major research areas, as is the supervised learning (decision trees, neural networks), the unsupervised learning (clustering algorithms) and more specialized forms, as is the semi-supervised machine learning and genetic algorithms. In addition to the above, it is planned and implemented a new probabilistic clustering algorithm, which is a hybrid of a hierarchical clustering algorithm and a partitioning algorithm. The algorithm was tested on a plurality of different datasets, achieving sufficiently encouraging results, as compared to other known algorithms, such as k-means and single-linkage. More specifically, the algorithm constructs data blocks, with greater homogeneity by majority with respect to the above, while the most important advantage is that it needs no corresponding parameter k to operate. Finally, suggestions are made in order to further improve the above algorithm, as well as to develop new techniques and methods in keeping with the current market trends, oriented to the demanding needs of this new, emerging information society.
48

Discovery of gene interactions in regulatory networks using genomic data mining and computational intelligence methods / Ανακάλυψη των (αιτιώδων) σχέσεων αλληλεπίδρασης στο δίκτυο ρύθμισης γονιδίων, με χρήση προηγμένων μεθόδων τεχνητής νοημοσύνης, βασιζόμενες στην εξόρυξη πληροφορίας από δεδομένα συνολικής γονιδιωματικής κλίμακος

Dragomir, Andrei 16 December 2008 (has links)
The advent of efficient genome sequencing tools and high-throughput experimental biotechnology has lead to an enormous progress in life sciences. Among the most important innovations is the microarray technology. It allows to quantify the expression of thousands of genes simultaneously by measuring the hybridization from a tissue of interest to probes on a small glass or plastic slide. Before launching into microarray research it is important to recall that the characteristics of this data include a fair amount of noise and an atypical dimensionality (which makes difficult the use of classic statistics tools – experimental samples in the order of dozens and measured parameters in thousands or tens of thousands). Therefore, the main goal of this thesis is the development of adequate computational methods and algorithms, capable of extracting valuable biological knowledge from this type of data. Applications of microarray technology as a tool for gene expression analysis range from the assignment of functional categories for genes of unknown biological function (based on the analysis of genes with already established biological role), to precise and early diagnosis of different tumor malignancies. However, the main goal of computational analysis of gene expression data is the extraction of regulatory knowledge at genetic level that may be used to provide a broader understanding on the functioning of complex cellular systems. In this direction, revealing the structures of regulatory networks based of gene expression data becomes a pivotal task. The thesis contributes with a framework for the discovery of biological functional category of genes based on the synergy of ICA and a dynamic SOM-based clustering algorithm, that accurately finds groups of co-regulated genes, while identifying interesting regulatory signals within the data with the help of ICA decomposition. We also pursue the task of molecular characterization of different tumor types using gene expression profiling, by providing a novel method for tissue samples classification, based on an ensemble of classifiers sequentially trained on reweighted versions of the data. The algorithm, known as boosting, is adapted to peculiarities of gene expression data and employed in conjunction with SVMs. Additionally, the novel concept of finding predictive genes whose signatures are significant for phenotype discrimination is treated. Finally, the thesis presents a method developed for reverse-engineering gene regulatory networks based on recurrent neuro-fuzzy networks, which exploits the advantages of fuzzy-based models, in terms of results interpretability, and those of neural systems, in terms of computational power and time series prediction capabilities. / H έλευση ικανών υπολογιστικών εργαλείων για την μελέτη της γενομικής ακολουθίας και της ερευνητικής βιοτεχνολογίας υψηλής ανάλυσης, οδήγησε σε μια τεράστια πρόοδο στις επιστήμες ζωής. Μεταξύ των πιο σημαντικών καινοτομιών είναι η τεχνολογία μικροσυστοιχιών. H τεχνολογία αυτή επιτρέπει την ποσοτικοποίηση της έκφρασης χιλιάδων γονιδίων ταυτόχρονα, μετρώντας τον υβριδισμό από έναν ιστό ενδιαφέροντος έως σε δείγματα σε μικρό γυαλί η σε πλαστικά τσιπ. Πριν ξεκινήσουμε την έρευνα πάνω στις μικροσυστοιχίες είναι σημαντικό να θυμόμαστε ότι τα χαρακτηριστικά των δεδομένων αυτής περιλαμβάνουν αρκετό ποσό θορύβου και ένα μη τυπικό αριθμό διαστάσεων (το οποίο καθιστά δύσκολη την χρήση κλασσικών στατιστικών μεθόδων – μέγεθος δείγματος σε δωδεκάδες και μέγεθος χαρακτηριστικών σε χιλιάδες η δεκάδες η εκατοντάδες). Επομένως, ο κύριος στόχος αυτής της διδακτορικής εργασίας είναι η ανάπτυξη ικανών υπολογιστικών μεθόδων και αλγόριθμων έτσι ώστε να εξάγουν πολύτιμη βιολογική γνώση από τον συγκεκριμένο τύπο δεδομένων. Εφαρμογές της τεχνολογίας μικροσυστοιχιών σαν ένα εργαλείο για την ανάλυση έκφρασης γονιδίων ξεκινούν από την εύρεση και απόδοση λειτουργικών κατηγοριών για γονίδια άγνωστης βιολογικής λειτουργικότητας (βασισμένη στην ανάλυση των γονιδίων ήδη εδραιωμένου βιολογικού ρόλου) έως την ακριβή και πρώιμη διάγνωση διαφορετικών κακοήθων όγκων. Όμως ο κύριος στόχος της υπολογιστικής ανάλυσης της έκφρασης γονιδίων είναι η εξαγωγή ρυθμιζόμενης γνώσης στο γενετικό επίπεδο το οποίο μπορεί να χρησιμοποιηθεί ώστε να παρέχει μία ευρύτερη κατανόηση της λειτουργίας πολύπλοκων κυτταρικών συστημάτων. Σε αυτή την κατεύθυνση, το να αναδεικνύεις τις δομές ρυθμιστικών δικτύων βασισμένων στην έκφραση γονιδίων γίνεται καίριο έργο. Η διδακτορική διατριβή συνεισφέρει στο πλαίσιο για την ανακάλυψη βιολογικά λειτουργικών κατηγοριών γονιδίων βασισμένη στην συνεργία της ΙCA και της δυναμικού βασισμένου στη SOM ομαδοποίηση αλγορίθμου η οποία με ακρίβεια βρίσκει ομάδες γονιδίων που συν-ρυθμίζονται ενώ παράλληλα αναγνωρίζει ενδιαφέροντα ρυθμιστικά σήματα μέσα στα δεδομένα με τη βοήθεια της ΙCA αποδόμησης. Eπίσης, προσανατολιζόμαστε στην εύρεση του μοριακού χαρακτηρισμού διαφορετικών τύπων όγκων χρησιμοποιώντας το προφίλ της γονιδιακής έκφρασης, βασισμένο σε ένα σύνολο κατηγοριοποιητών οι οποίοι εκπαιδεύτηκαν σειριακά σε επανασταθμισμένες παραλλαγές των δεδομένων. Ο αλγόριθμος, γνωστός και σαν boosting, έχει προσαρμοστεί στις ιδιαιτερότητες των δεδομένων έκφρασης γονιδίου και εφαρμόζεται σε συνδυασμό με τα SVMs. Επιπλέον, εξετάζεται η πρωτοποριακή τεχνική της εύρεσης προβλέψιμων τιμών των οποίων οι υπογραφές είναι σημαντικές για τον χαρακτηρισμό φαινότυπου. Τελικά, η παρούσα διδακτορική διατριβή παρουσιάζει μια μέθοδο που αναπτύχθηκε για αντίστροφα μηχανικά ελεγχόμενα από γονίδια νευρωνικά δίκτυα βασισμένα σε αναδρομικά νευρωνικά δίκτυα τύπου fuzzy, τα οποία αξιοποιούν τα πλεονεκτήματα των μοντέλων τύπου fuzzy σε βάση επεξηγηματικότητας αποτελεσμάτων, και αυτών των νευρωνικών δικτύων σε βάση υπολογιστικής δύναμης και ικανότητας πρόβλεψης χρονοσειρών.
49

Computational intelligence methods on biomedical signal analysis and data mining in medical records

Vladutu, Liviu-Mihai 05 May 2009 (has links)
This thesis is centered around the development and application of computationally effective solutions based on artificial neural networks (ANN) for biomedical signal analysis and data mining in medical records. The ultimate goal of this work in the field of Biomedical Engineering is to provide the clinician with the best possible information needed to make an accurate diagnosis (in our case of myocardial ischemia) and to propose advanced mathematical models for recovering the complex dependencies between the variables of a physical process from a set of perturbed observations. After describing some of the types of ANN mainly used in this work, we start designing a model for pattern classification, by constructing several local models, for neighborhoods of the state space. For this task, we use the novel k-windows clustering algorithm, to automatically detect neighborhoods in the state space. This algorithm, with a slight modification (unsupervised k-windows algorithm) has the ability to endogenously determine the number of clusters present in the data set during the clustering process. We used this method together with the other 2 mentioned below (NetSOM and sNet-SOM) for the problem of ischemia detection. Next, we propose the utilization of a statistically extracted distance measure in the context of Generalized Radial Basis Function (GRBF) networks. The main properties of the GRBF networks are retained in a new metric space, called Statistical Distance Metric (SDM). The regularization potential of these networks can be realized with this type of distance. Furthermore, the recent engineering of neural networks offers effective solutions for learning smooth functionals that lie on high dimensional spaces.We tested this solution with an application from bioinformatics, one example from data mining of commercial databases and finally with some examples using medical databases from a Machine Learning Repository. We continue by establishing the network self-organizing map (NetSOM) model, which attempts to generalize the regularization and ordering potential of the basic SOM from the space of vectors to the space of approximating functions. It becomes a device for the ordering of local experts (i.e. independent neural networks) over its lattice of neurons and for their selection and coordination. Finally, an alternative to NetSOM is proposed, which uses unsupervised ordering based on Self-organizing maps (SOM) for the "simple" regions and for the "difficult" ones a two-stage learning process. There are two differences resulted from the comparison with the previous model (NetSOM), one is that we replaced a fixed-size of the SOM with a dinamically expanded map and second, the supervised learning was based this time on Radial Basis Functions (RBF) Networks and Support Vector Machines (SVM). There are two fields in which this tool (called sNet-SOM) was used, namely: ischemia detection and Data Mining. / Η παρούσα διδακτορική διατριβή είναι επικεντρωμένη γύρω από την ανάπτυξη και εφαρμογή, με χαμηλές υπολογιστικές απαιτήσεις, βασισμένες σε Τεχνητά Νευρωνικά Δίκτυα, για την Ανάλυση Βιοϊατρικών σημάτων και Data Mining σε Ιατρικά Δεδομένα. Απώτερος σκοπός της παρούσης διατριβής στον τομέα της Βιοϊατρικής Τεχνολογίας είναι να παρέχει στους ιατρούς με την καλύτερη δυνατή πληροφόρηση για να κάνουν μια ακριβή διάγνωση (στην περίπτωση του ισχαιμικού μυοκαρδίου) και να προτείνει αναπτυγμένα μαθηματικά μοντέλα για να ανακάμψει πολύπλοκες εξαρτήσεις μεταξύ τον μεταβλητών μιας φυσικής διεργασίας από ένα σύνολο διαφορετικών παρατηρήσεων. Μετά την περιγραφή μερικών από τους βασικούς τύπους τεχνητών Νευρωνικών Δικτύων που χρησιμοποιούνται στην παρούσα διατριβή, εμείς αρχίσαμε να σχεδιάζουμε ένα μοντέλο για ταξινόμηση προτύπων κατασκευάζοντας πολλά τοπικά μοντέλα γειτονικά με τον παρόντα χώρο. Για αυτό το σκοπό εμείς χρησιμοποιούμε το αλγόριθμο για clustering k-windows για να ανιχνεύει αυτόματα γειτονιές στον παρόντα χώρο. Αυτός ο αλγόριθμος με μια ελαφριά τροποποίηση έχει την ικανότητα να καθορίζει ενδογενώς την παρουσία του αριθμού τον clusters στο σύνολο τον δεδομένων κατά την διάρκεια της διαδικασίας του clustering. Όταν η διαδικασία του clustering ολοκληρώνεται ένα εκπαιδευμένο Εμπροσθοτροφοδοτούμενο Νευρωνικό Δίκτυο δρα ως ο τοπικός προβλέπτης για κάθε cluster. Εν συνεχεία, προτείνουμε τη χρήση εξαγόμενης στατιστικής μετρητικής απόστασης, μέσα στο γενικότερο πλαίσιο των δικτύων ( GRBF). Οι κύριες λειτουργίες των GRBF (Generalized Radial Basis Functions) δικτύων διατηρούνται στο καινούργιο μετρητικό χώρο. Η δυναμική κανονικοποίηση αυτών των δικτύων μπορεί να πραγματοποιηθεί με αυτό τον τύπο αποστάσεων. Επιπλέον η πρόσφατη τεχνολογία των ΝΝ (Neural Networks) προσφέρει αποτελεσματικές λύσεις για τη μάθηση ομαλών συναρτήσεων που βρίσκεται σε υψηλούς διαστατικούς χώρους. Δοκιμάσαμε αυτή τη λύση σε εφαρμογή βιοπληροφορικής, μία από εμπορικές βάσεις δεδομένων και τέλος με μερικά παραδείγματα χρησιμοποιώντας βάσεις δεδομένων από το UCI (University of California at Irvine) από το ιατρικό πεδίο. Συνεχίζοντας, καθιδρύουμε το δίκτυο NetSOM (network Self-Οrganizing Map), που προσπαθεί να γενικεύσει (generalize) την κανονικοποίηση (regularization) και να δώσει δυναμικές εντολές (ordering) του βασικού SOM από το διανυσματικό χώρο στο χώρο των προσεγγιστικών συναρτήσεων. Αποτελεί μια εντολοδόχο διαδικασία για τους τοπικούς ειδικούς πάνω από το πλέγμα των νευρώνων και για την επιλογή και το συντονισμό τους. Τέλος, αναλύεται μια εναλλακτική λύση του NetSOM, που χρησιμοποιεί μη εκπαιδευμένες εντολές βασισμένες στο SOMs για τις “απλές ” περιοχές και για τις “δύσκολες ” μια διαδικασία μάθησης 2-επιπέδων. Υπάρχουν 2 διαφορές στα αποτελέσματα από την σύγκριση με το προηγούμενο μοντέλο (NetSOM), η πρώτη είναι ότι αντικαταστήσαμε (we replaced) a fixed-size των SOM με ένα πιο δυναμικό ταίριασμα (mapping) και η δεύτερη, η εκπαιδευόμενη εκμάθηση βασίστηκε αυτή τη φορά στην RBF και στις μηχανές υποστήριξης διανυσμάτων (SVM). Αυτό το εργαλείο χρησιμοποιήθηκε στην αναγνώριση των ισχαιμιών και εξόρυξη δεδομένων από βάσεις δεδομένων.
50

Χρήση τεχνολογίας έμπειρων συστημάτων για πρόβλεψη απόδοσης μαθητών

Καρατράντου, Ανθή 03 July 2009 (has links)
Στην εργασία αυτή παρουσιάζεται η χρήση τεχνολογίας Έμπειρων Συστημάτων για την πρόβλεψη της επιτυχίας ενός μαθητή Τ.Ε.Ε. στις εισαγωγικές πανελλαδικές εξετάσεις στα Α.Τ.Ε.Ι. και η απόδοσή της συγκρίνεται με αυτή της Ανάλυσης Λογιστικής Παλλινδρόμησης και των Νευρωνικών Δικτύων. Είναι σημαντικό για τους καθηγητές, αλλά και τη διοίκηση του σχολείου, να είναι σε θέση να εντοπίζουν τους μαθητές με υψηλή πιθανότητα αποτυχίας ή χαμηλής απόδοσης ώστε να τους βοηθήσουν κατάλληλα. Για το σκοπό της παρούσας εργασίας αναπτύσσεται Έμπειρο Σύστημα βασισμένο σε κανόνες, το οποίο υλοποιείται σε δυο εκδοχές: η πρώτη χρησιμοποιεί τους συντελεστές βεβαιότητας του MYCIN και η δεύτερη μια γενικευμένη εκδοχή της σχέσης των συντελεστών αβεβαιότητας του MYCIN με τη βοήθεια αριθμητικών βαρών για κάθε συντελεστή βεβαιότητας (PASS). Ο σχεδιασμός του έμπειρου συστήματος σε κάθε περίπτωση, η ανάλυση Λογιστικής Παλινδρόμησης και η ανάπτυξη Νευρωνικού Δικτύου βασίζονται στην ανάλυση δημογραφικών και εκπαιδευτικών δεδομένων των μαθητών, κυρίως όμως στην ανάλυση δεδομένων της απόδοσής τους κατά τις σπουδές τους (Φύλο, Ηλικία, Ειδικότητα, Βαθμός Α (ο Γενικός Βαθμός της Α’ Τάξης), Βαθμός Β (Γενικός Βαθμός της Β’ τάξης) και Βαθμός ΑΓ (ο Μέσος Όρος των βαθμών στα τρία εξεταζόμενα μαθήματα κατά το Α’ τετράμηνο σπουδών). Με δεδομένο το ότι η πρόβλεψη της επιτυχίας ή μη ενός μαθητή στις εισαγωγικές εξετάσεις εμπεριέχει ένα μεγάλο βαθμό αβεβαιότητας, η αβεβαιότητα αυτή έχει καθοριστικό ρόλο στη σχεδίαση του έμπειρου συστήματος σε κάθε εκδοχή του. Το Έμπειρο Σύστημα PASS, η Ανάλυση Λογιστικής Παλινδρόμησης και τα Νευρωνικά Δίκτυα έχουν περίπου την ίδια ακρίβεια στην πρόβλεψή τους ενώ το MYCIN μικρότερη. Το MYCIN εμφανίζει την υψηλότερη ευαισθησία. Το Έμπειρο Σύστημα PASS, η Ανάλυση Λογιστικής Παλινδρόμησης και τα Νευρωνικά Δίκτυα έχουν περίπου την ίδια ειδικότητα, με το PASS να έχει ελαφρώς υψηλότερη τιμή ενώ το MYCIN έχει την χαμηλότερη τιμή. / In this paper, the use of the technology of the Expert Systems is presented in order to predict how certain is that a student of a specific type of high school in Greece will pass the national exams for entering a higher education institute, and the results are compared with that of Logistic Regression Analysis and Neural Networks. Predictions are based on various types of student’s student (sex, subject of studies, general degree of class A, general degree of class B, mean degree of the three basic lessons of class C). The aim is to use the predictions to provide suitable support to the students during their studies towards the national exams. The expert system is a rule-based system that uses a type of certainty factors and is developed based on two versions. The first one uses the MYCIN certainty factors combination to produce the final prediction based on rules with the same conclusion. The second one (PASS) introduces a parameterized linear formula for combining the certainty factors of two rules with the same conclusion. The values of the parameters (weights) are determined via training, before the system is used. Experimental results show that the accuracy of the predictions of the expert system PASS is comparable to that of Logistic Regression Analysis and Neural Networks approach. The accuracy of the predictions of the expert system MYCIN is lower than the accuracy of the other methods. The sensitivity of the MYCIN results is the highest and the specificity is the lowest. The specificity of the PASS, Logistic Regression Analysis and Neural Networks results are similar with the one of the PASS Expert System to be higher.

Page generated in 0.0284 seconds