Global ETD Search

1	Μοντελοποίηση γραφημάτων σε μπλοκ Μπέκας, Σταύρος 25 May 2009 (has links) Στόχος της παρούσας διπλωματικής εργασίας είναι να παρουσιάσει τις τεχνικές και τις μεθόδους που πρέπει να ακολουθηθούν για να διαμεριστούν οι κορυφές ενός απλού γραφήματος σε ομάδες κορυφών, οι οποίες κατέχουν όμοιες ή παρόμοιες δομές σύνδεσης με άλλες ομάδες. Η διπλωματική εργασία αποτελείται από τέσσερα μέρη. Στο πρώτο μέρος της εργασίας δίνεται ο ορισμός του απλού γραφήματος, της ομαδοποίησης, του μπλοκ και του μοντέλου των μπλοκ, έννοιες οι οποίες είναι απαραίτητες για την συνέχεια. Στο δεύτερο μέρος περιγράφονται δύο τύποι ισοδυναμίας, που χρησιμοποιούνται για την ομαδοποίηση των κορυφών ενός γραφήματος, καθώς επίσης και δύο μέθοδοι για την επίτευξη της ομαδοποίησης των κορυφών. Στο τρίτο μέρος δίνεται μια πιο γενική ιδέα για την ομαδοποίηση των κορυφών ενός γραφήματος, η οποία βασίζεται σε μια από τις δυο προηγούμενες μεθόδους προσέγγισης της ομαδοποίησης. Στο τέταρτο και τελευταίο μέρος δίδεται μια επέκταση της ομαδοποίησης πάνω σε διμερή δεδομένα και παρουσιάζονται ατα αποτελέσματα, από την εφαρμογή αυτής της επέκτασης σε ένα εμπειρικό παράδειγμα. / - Μπλοκ Ομαδοποίηση 511.5 Block Clustering
2	Η σχέση της ανάλυσης χωροθέτησης με τους αλγορίθμους ομαδοποίησης Χατζηθωμά, Ανδρούλα 02 May 2008 (has links) Γίνετε ανασκόπηση των πιο σημαντικών προβλημάτων της Ανάλυσης Χωροθέτησης. Παρατίθονται συγκρίσεις των προβλημάτων της Ανάλυσης Χωροθέτησης με τους Αλγορίθμους Ομαδοποίησης. Ακολούθως αναγράφεται μια αριθμητική εφαρμογή μιας σύγκρισης. / This project is a review of the more important algorithms of the Locational Analysis. The main theme is the comparison of the algorithms of Location Analysis against the algorithms of Clustering. Ομαδοποίηση Ανάλυση χωροθέτησης 511.8 Clustering Location analysis
3	Υπολογιστική νοημοσύνη και ομαδοποίηση Κανδηλιώτης, Στέφανος 17 September 2008 (has links) Η εργασία ασχολείται με την ομαδοποίηση δεδομένων ανθρώπινου γονιδιόματος με την χρήση αλγόριθμων ομαδοποίοησης και νευρωνικών δικτύων για τον διαχωρισμό του δείγματος σε ομάδες με βάση το αν έχουν κάποιο είδος ασθένειας ή όχι ή για τον καθορισμό του τύπου της ασθένειας. Παρουσιάζονται κάποια πειράματα που έγιναν με την χρήση και των δύο μεθόδων. / This master thesis is an application of clustering algorithms and artificial neural networks on human dna data in order to cluster the data in groups depending on wether a person has or hasn't an illness or what type of ilness one has. The thesis shows the results of some experiments conducted using either technique (clustering, ANNs) and a combination of both. Ομαδοποίηση Νευρωνικά δύκτια 006.3 Clustering Neural networks
4	Σύγχρονοι αλγόριθμοι ομαδοποίησης για ροές δεδομένων Χατζημιχαήλ, Σπύρος 03 August 2009 (has links) Σε αυτή την πτυχιακή εργασία γίνεται μελέτη του προβλήματος της ομαδοποίησης δεδομένων και πιο συγκεκριμένα οnline ομαδοποίηση σε ροές δεδομένων. Στην αρχή παρουσιάζεται η απλή offline εκδοχή του προβλήματος, όπου όλα τα δεδομένα προς ομαδοποίηση είναι γνωστά εκ των προτέρων. Παρουσιάζονται οι πιο βασικοί αλγόριθμοι και στοιχειώδεις εφαρμογές που καταδεικνύουν ότι η εύρεση αποδοτικών αλγορίθμων μπορεί να δώσει ώθηση σε νέα περιβάλλοντα που η ομαδοποίηση αποτελεί υπολογιστικό πυρήνα. Στη συνέχεια γίνεται εισαγωγή στο μοντέλο ροών δεδομένων, όπου εκεί η γνώση του αλγορίθμου για τη φύση των δεδομένων αποκτάται σταδιακά, όσο παρουσιάζονται νέα στοιχεία. Ο περιορισμός της διαθέσιμης μνήμης και η ανάγκη μας για αποδοτικούς αλγορίθμους μας οδηγεί σε κατασκευή προσεγγιστικών ευρετικών. Παρουσιάζονται ανοιχτά προβλήματα που έχουν τεθεί στη βιβλιογραφία καθώς και διάφορες εφαρμογές που προκύπτουν από δεδομένα που σχηματίζουν ροές. Συνεχίζοντας γίνεται μια εκτενής μελέτη της σύγχρονης βιβλιογραφίας και παρουσιάζονται οι πιο αντιπροσωπευτικοί αλγόριθμοι από κάθε βασική τεχνική προσέγγισης, όπως η ομαδοποίηση με βάση την πυκνότητα, ομαδοποίηση με γραμμική παλινδρόμηση, ομαδοποίηση δύο σταδίων κα. Παρουσιάζεται επίσης και ένας νέος αλγόριθμος που συνδυάζει προεπεξεργασία των δεδομένων της ροής με έναν online αλγόριθμο ομαδοποίησης και παραγωγή της τελικής ομαδοποίησης με μία παραλλαγή του LocalSearch. Τέλος ακολουθούν διάφορα πειραματικά αποτελέσματα που πραγματοποιήθηκαν επί αυτών των αντιπροσωπευτικών αλγορίθμων και γίνεται σύγκριση μεταξύ τους. Παρατηρούμε ότι τα νέα σχήματα που που προκύπτουν με βάση τον αλγόριθμο Localsearch πετυχαίνουν πολύ καλύτερα τελικά αποτελέσματα σε σχέση με τον αλγόριθμο Birch. / - Αλγόριθμοι Ομαδοποίηση Ροές δεδομένων 004.35 Algorithms Grouping Data flow
5	Ανάλυση συστάδων (cluster analysis) Καράγεωργα, Ισμήνη 12 April 2013 (has links) Στη συγκεκριμένη διπλωματική εργασία αναλύεται το πρόβλημα της ανάλυσης συστάδων. Σκοπός της ανάλυσης συστάδων είναι να ομαδοποιεί τα στοιχεία σε cluster έτσι ώστε τα στοιχεία που ανήκουν στο ίδιο cluster να έχουν μεγαλύτερη ομοιότητα από τα στοιχεία που ανήκουν σε διαφορετικά cluster. / In the current diplomatic thesis is analyzed the problem of cluster analysis. The purpose of cluster analysis is to group items in clusters, so that items belonging to the same cluster have a greater similarity than the items belonging to different clusters. Ανάλυση συστάδων 519.53 Cluster analysis Clustering
6	Χρήση υβριδικών, εξελικτικών αλγορίθμων σε on line προβλήματα ομαδοποίησης / Use of hybrid, evolutionary algorithms for on line clustering problems Δανελάτος, Ευάγγελος 17 May 2007 (has links) Υλοποιούμε οχτώ αλγορίθμους που επιλύουν on line προβλήματα ομαδοποίησης. Αναπτύσουμε τρεις νέες μορφές υβριδικών αλγορίθμων. Εφαρμόζουμε όλους τους παραπάνω αλγορίθμους σε τεχνητά δεδομένα και καταγράφουμε την αποτελεσματικότητά τους. Μεταβαίνουμε από την ομαδοποίηση στην ταξινόμηση. Επιλύουμε δύο προβλήματα ταξινόμησης του πραγματικού κόσμου και βλέπουμε πως κυμαίνονται τα ποσοστά επιτυχούς ταξινόμησης. Παραθέτουμε τα συγκριτικά γραφήματα των αποτελεσμάτων όλων των αλγορίθμων. / We implement eight algorithms that solve on line problems of clustering and we develope three new forms of hybrid algorithms. We apply these algorithms in artificial data and we record their effectiveness. Also we go from clustering to classification. Finally we solve two problems of classification from the real world and we appose the comparative graphs of the results of our algorithms. On line ομαδοποίηση Υβριδικοί αλγόριθμοι 511.8 On line clustering Hybrid algorithms Clustering to classification
7	Ομαδοποιημένη οπτικοποίηση γεωγραφικών δεδομένων με χρήση web τεχνολογιών Χαρπαντίδης, Βασίλειος 05 February 2015 (has links) Στις μέρες μας ο κόσμος αναζητά συνεχώς νέες πληροφορίες. Η αναζήτηση αυτή πολλές φορές εξαρτάται ή/και βασίζεται σε γεωγραφικά δεδομένα. Για αυτόν το σκοπό η αποτύπωση της πληροφορίας στο χάρτη είναι μια κλασική μέθοδος που ακολουθείται. Αυτή η διπλωματική ξεκίνησε από την παρατήρηση ότι ενώ από τη μία υπάρχει μεγάλος όγκος πληροφορίας, η αποτύπωσή της στο χάρτη είναι πολύ φτωχή. Σχεδόν όλες οι εφαρμογές με εξαίρεση τους κολοσσούς της πληροφορικής (Microsoft και Google) αναπαριστούν περιορισμένη ποσότητα πληροφορίας. Αυτή η παρατήρηση προήλθε από λεπτομερή έρευνα των πρακτικών που ακολουθούνται τόσο από εμπορικές εφαρμογές, όσο και από αντίστοιχες ερευνητικές δραστηριότητες. Έτσι, χρησιμοποιώντας κάποιος αυτές τις υπηρεσίες δυσκολεύεται να κατανοήσει τη συνολική πληροφορία της γεωγραφικής περιοχής που εξετάζει. Σε αυτήν την εργασία προσπαθούμε να δώσουμε λύση στο παραπάνω πρόβλημα, δηλαδή στην αποτύπωση της συνολικής πληροφορίας σε κάποια μη ορισμένη εξ αρχής γεωγραφική περιοχή. Το σύνολο της πληροφορίας, επίσης, δεν είναι στατικό, αλλά αλλάζει σύμφωνα με διάφορα κριτήρια που μπορεί να επιλέξει ο χρήστης. Η εργασία θα κινηθεί σε δύο βασικούς πυλώνες. Αρχικά, θα δοθεί λύση στο απλούστερο πρόβλημα της παρουσίασης στο χρήστη της ποσότητας της πληροφορίας στις αντίστοιχες γεωγραφικές περιοχές. Στη συνέχεια, αφού χρησιμοποιηθεί η λύση αυτού του προβλήματος θα γίνει μια προσπάθεια να λυθεί το πιο σύνθετο πρόβλημα της ομαδοποίησης της εμφανιζόμενης στοιχείων πληροφορίας στις γεωγραφικές περιοχές που εξετάζονται από το χρήστη. Οι λύσεις των δύο αυτών προβλημάτων θα βασιστούν στην ομαδοποίηση. Το πρώτο πρόβλημα θα λυθεί με τη χρήση του αλγορίθμου ομαδοποίησης σε πλέγμα και το δεύτερο θα βασιστεί στη χρήση μερικών παραλλαγών του αλγορίθμου Minimum Description Length (MDL). Παρόλο που φαίνεται ότι θα ακολουθηθούν κλασικοί αλγόριθμοι η διπλωματική αυτή θα τους χρησιμοποιήσει με πρωτοφανή τρόπο (δε βρέθηκε αντίστοιχη χρήση στη βιβλιογραφία) και σε πολλά λεπτά σημεία θα δοθούν καινοτόμες λύσεις. Οι δύο αυτές λύσεις δε θα υλοποιηθούν απλά σε ένα εργαστηριακό σύστημα, όπου κάποιος έμπειρος χρήστης (ο ερευνητής) θα μπορεί να πραγματοποιεί πειράματα, αλλά σε μία σύγχρονη web εφαρμογή. Απόρροια αυτής της επιλογής είναι η εφαρμογή που θα παραχθεί από την υλοποίηση αυτής της διπλωματικής να είναι άμεσα προσπελάσιμη από όλον τον κόσμο. Αυτό είναι ένα ακόμη προτέρημα αυτής της εργασίας. Συνοψίζοντας η εργασία θα ολοκληρωθεί με ένα συνοπτικό σχολιασμό των λύσεων και των αποτελεσμάτων τους σε ένα πραγματικό σύνολο δεδομένων. Σε αυτά τα αποτελέσματα θα παρατηρηθεί η λογική συσχέτιση των αποτελεσμάτων των ομαδοποιημένων σημείων σε σχέση με τις γεωγραφικές περιοχές. / Nowadays information is produced everywhere. So a great amount of data exists. Spatial data analysis and visualization is a hot trend and a dynamic map like google maps is the best so far solution. The problem is that the combination of the massive amount of data and the limited size of the map instead of helping the user may confuse him/her. Now, consider a web application with a dynamic map, presenting the whole information of each place without confusing the user with the huge amount of information. This paper proposes some techniques to present the quantity and the quality of information in any place of the dynamic map. The common factor of all the proposed techniques is the grouping via some algorithms like grid clustering. Ομαδοποίηση Οπτικοποίηση Γεωγραφικά δεδομένα 001.422 Spatial data Clustering Visualization Web application
8	Σημασιολογική προσωποποίηση στον παγκόσμιο ιστό / Semantic personalization in the world wide web Βόπη, Αγορίτσα 07 February 2008 (has links) Η αναζήτηση πληροφορίας στο Παγκόσμιο Ιστό λόγω της ραγδαίας αύξησης του όγκου του αποτελεί ένα δύσκολο και χρονοβόρο εγχείρημα. Επιπρόσθετα, η συνωνυμία και η πολυσημία συμβάλλουν στη δυσκολία εύρεσης πληροφορίας. Στα πλαίσια αυτής της διπλωματικής εργασίας αναπτύχθηκε μια μεθοδολογία για την προσωποποίηση των αποτελεσμάτων μιας μηχανής αναζήτησης ώστε αυτά να ανταποκρίνονται στα ενδιαφέροντα των χρηστών. Η μεθοδολογία αποτελείται από δύο τμήματα, το εκτός σύνδεσης τμήμα και το συνδεδεμένο τμήμα. Στο εκτός σύνδεσης τμήμα χρησιμοποιώντας τα αρχεία πρόσβασης της μηχανής αναζήτησης και εξάγεται πληροφορία για τις επιλογές του χρήστη. Στη συνέχεια πραγματοποιείται η σημασιολογική κατηγοριοποίηση των προηγούμενων επιλογών των χρηστών με χρήση μιας οντολογίας, που αναπτύχθηκε με βάση τους καταλόγους του ODP. Κατόπιν, αναπτύσσεται το προφίλ του χρήστη με βάση την οντολογία αναφοράς που χρησιμοποιήθηκε και στη φάση της σημασιολογικής αντιστοίχισης. Στη συνέχεια, με χρήση αλγορίθμου ομαδοποίησης γίνεται ομαδοποίηση των χρηστών με βάση τα ενδιαφέροντά τους. Στο συνδεδεμένο τμήμα ο αλγόριθμος προσωποποίησης χρησιμοποιεί τις ομάδες που δημιουργήθηκαν στο μη συνδεδεμένο τμήμα και τη σημασιολογική αντιστοίχηση των αποτελεσμάτων της μηχανής αναζήτησης και αναδιοργανώνει τα αποτελέσματά της προωθώντας στις πρώτες θέσεις επιλογής τα αποτελέσματα που είναι περισσότερο σχετικά με τις προτιμήσεις της ομάδας στην οποία ανήκει ο χρήστης. Η μεθοδολογία που προτείνεται έχει εφαρμοστεί σε πειραματική υλοποίηση δίνοντας τα επιθυμητά αποτελέσματα για την προσωποποίηση σύμφωνα με τις σημασιολογικές ομάδες χρηστών. / During the recent years the World Wide Web has been developed rapidly making the efficient searching of information difficult and time-consuming. In this work, we propose a web search results personalization methodology by coupling data mining techniques with the underlying semantics of the web content. To this purpose, we exploit reference ontologies that emerge from web catalogs (such as ODP), which can scale to the growth of the web. Our methodology uses ontologies to provide the semantic profiling of users’ interests based on the implicit logging of their behavior and the on-the-fly semantic analysis and annotation of the web results summaries. Following this the logged web clickthrough data are submitted to offline processing in order to form semantic clusters of interesting categories according to the users’ perspective. Finally, profiles of semantic clusters are combined with the emerging profile of the active user in order to apply a sophisticated re-ranking of search engines results. Experimental evaluation of our approach shows that the objectives expected from semantic users’ clustering in search engines are achievable. Προσωποποίηση Σημασιολογικός ιστός Οντολογίες Ομαδοποίηση 025.04 Personalization Semantic web Ontologies Clustering
9	Ανάκτηση κειμένου και εξαγωγή κανόνων από κείμενα με βιολογικό περιεχόμενο / Text retrieval and rule extraction from documents with biological concept Γαϊτάνου, Ευφροσύνη 01 October 2008 (has links) Η ραγδαία ανάπτυξη του Παγκόσμιου Ιστού προσέφερε σε όλους τους χρήστες ανά τον κόσμο τη δυνατότητα άμεσης, γρήγορης και αποτελεσματικής προσπέλασης κάθε είδους πληροφορίας. Καθημερινά πραγματοποιούνται εκατομμύρια καταχωρήσεις πληροφοριών στο Διαδίκτυο με αποτέλεσμα ο όγκος της διακινούμενης πληροφορίας να αυξάνει με εκθετικούς ρυθμούς. Με το πάτημα ενός κουμπιού, μια πληθώρα πληροφοριών, ακόμη και για το πιο εξειδικευμένο θέμα, βρίσκεται μπροστά στην οθόνη του χρήστη, έτοιμη προς ανάγνωση και επεξεργασία. Αυτή ακριβώς η «υπερδιάθεση» πληροφοριών καθιστά πολύ δύσκολη έως αδύνατη οποιουδήποτε είδους επεξεργασία των δεδομένων από το χρήστη, έστω και σε επίπεδο απλής ανάγνωσης. Η ύπαρξη ενός εργαλείου ανάκτησης κειμένου και εξαγωγής όρων και κανόνων από μια υπερμεγέθη συλλογή κειμένων θα έδινε τη δυνατότητα στο χρήστη να ανακτήσει χρήσιμες πληροφορίες γρήγορα, χωρίς να είναι απαραίτητη η ανάγνωση και η φυσική επεξεργασία όλων αυτών των κειμένων. Ειδικότερα στο ευαίσθητο πεδίο των Βιο-Επιστημών όπου η αδυναμία επεξεργασίας της διαθέσιμης πληροφορίας και της εξαγωγής χρήσιμων συνδέσεων και συμπερασμάτων επηρεάζει αρνητικά την επιστημονική έρευνα, είναι επιτακτική η ανάγκη παρουσίας εργαλείων που θα διευκολύνουν τη διαδικασία εξόρυξης γνώσης από κείμενα με βιολογικό περιεχόμενο. Στην παρούσα διπλωματική εργασία γίνεται μια παρουσίαση τεχνικών με τις οποίες είναι δυνατή η εξαγωγή γνώσης και κανόνων από κείμενα ηλεκτρονικής μορφής στο Διαδίκτυο τα οποία αφορούν στο επιστημονικό πεδίο της Βιολογίας. Η προσπάθειά μας επικεντρώνεται κυρίως στη δυνατότητα εξόρυξης γνώσης από κείμενα που αναφέρονται σε ένα συγκεκριμένο θέμα Βιολογίας (π.χ. μεταγραφικοί παράγοντες) και που η πραγματοποίηση του στόχου αυτού θα ήταν διαφορετικά από δύσκολη έως αδύνατη καθώς το πλήθος των κειμένων είναι απαγορευτικό για την αναλυτική μελέτη τους από ειδικό ή ομάδα ειδικών, πόσο μάλλον από έναν απλό χρήστη. Αρχικά, περιγράφουμε τον τρόπο ανάκτησης των κειμένων που αναφέρονται στο συγκεκριμένο θέμα του ενδιαφέροντός μας από την ηλεκτρονική βιβλιοθήκη National Library of Medicine και τη δημιουργία της προς επεξεργασία συλλογής κειμένων. Η συλλογή αυτή υπόκειται σε λεξικολογική ανάλυση και επεξεργασία κατά τη διάρκεια της οποίας διατηρούνται από κάθε κείμενο οι πιο σημαντικοί όροι, ενώ οι υπόλοιποι απορρίπτονται. Με τον τρόπο αυτό δημιουργείται ένα σύνολο από τους πιο αντιπροσωπευτικούς όρους ανά κείμενο με τη συχνότητα εμφάνισής τους σε αυτά. Στη συνέχεια, εφαρμόζουμε τεχνικές ομαδοποίησης δεδομένων με στόχο τη δημιουργία ομάδων όρων, αλλά και ομάδων κειμένων. Στα πλαίσια της προσπάθειας αυτής, πειραματιστήκαμε με διάφορες γνωστές τεχνικές ομαδοποίησης (αλγόριθμοι k-means και ιεραρχικός μονής σύνδεσης), ενώ υλοποιήσαμε εκ νέου τον αλγόριθμο ISODATA σε περιβάλλον ανάπτυξης Matlab. Η έρευνά μας ολοκληρώνεται με την εφαρμογή της τεχνικής του Latent Semantic Indexing πριν τη ομαδοποίηση των δεδομένων και τη σύγκριση των αποτελεσμάτων. Μέσα από τις ομάδες που δημιουργούνται με αυτή τη διαδικασία, διαπιστώνουμε την παρουσία συνδέσεων μεταξύ όρων και κειμένων και, ακόμη περισσότερο, τη δυνατότητα εξαγωγής συμπερασμάτων, αλλά και εξόρυξης πραγματικά νέας γνώσης επάνω σε συγκεκριμένα πεδία της επιστήμης της Βιολογίας. / The rapid growth of World Wide Web offered every user around the globe the ability to have immediate, quick and effective access to every kind of information. Daily, millions of records of information about every subject are added on Internet, giving the volume of available information an exponential boost. Simply by pressing only one single button, a plethora of information – even about the most sophisticated topic - is laid out in front of user’s screen ready to be read and processed. This plethora is exactly the reason that makes it difficult or even impossible for a simple user to process all the available data, or even just read it. It is clear that the presence of a tool that will make feasible the retrieval of documents and the extraction of terms and rule-associations from a huge document collection would give users the ability to retrieve valuable information quickly, without even reading or pre-processing all these documents. Especially in Bio-sciences, the inability of processing the available information and extracting useful connections and assumptions is an obstacle in scientific research. Therefore, there is a crying need for tools that will facilitate the process of text mining from documents with biological concept. In the present master thesis we present techniques for extracting knowledge and rules from documents in a digital format retrieved from Internet, with special reference to the scientific field of Biology. Our attempt is mainly focused on knowledge extraction from documents with specific biological concept (e.g. transcription factors), which is a really difficult – in some cases even impossible – task to accomplish due to the huge amount of available documents that an expert or a group of experts should read and process – imagine what a simple user could do. First, we describe the retrieval of documents referring to the specific biological concept we are interested about, from the National Library of Medicine and the construction of our document set. This set will be lexicological processed and only the most important term from each document will be kept while the rest will be ignored. This way, a set of the most representative terms per document will be created, along with the frequency in which the terms appear in each document. Secondly, we apply clustering techniques over this terms-by-document set in order to produce clusters of terms as well as clusters of documents. During this step, many well known clustering techniques are being tested, such as the k-means algorithm and the hierarchical-single linkage algorithm. We also describe our implementation, the ISODATA algorithm. The implementation of all clustering algorithms tested here was done on Matlab 6p5. Our research ends with the application of Latent Semantic Indexing (LSI) technique over our terms-by-documents set before the clustering step; we compare the resulting clusters with those taken without performing LSI before clustering. It is in those clusters that we find many connections between terms and documents and - even more – we discover the ability of extracting not only conclusions about the concept of the documents in each cluster but also truly new knowledge referring to specific scientific fields of Biology. Καρκίνος Ομαδοποίηση Βιολογικά δεδομένα 025.04 lsi Clustering Isodata Cancer Biological terms
10	Εφαρμογή μεθόδων εξόρυξης δεδομένων σε βαρομετρικούς χάρτες Βαρσάμη, Ευθυμία 27 December 2010 (has links) Η παρούσα Διπλωματική εργασία ασχολείται με τον τομέα της Eξόρυξης Δεδομένων (Data Mining) από Βαρομετρικούς Χάρτες. Οι τεχνικές του Data Mining έχουν εφαρμογές σε πλήθος δεδομένων, όπως αυτά που προκύπτουν κάθε στιγμή από το διαδίκτυο, τις συναλλαγές και άλλες πηγές. Η εφαρμογή των μεθόδων του Data Mining έχει ως σκοπό την εξόρυξη χρήσιμης και εύχρηστης "κρυφής" γνώσης από διαφορετικά μη αξιοποιήσιμες πηγές. Η εργασία είναι διαρθρωμένη σε τρία κεφάλαια. Το πρώτο κεφάλαιο εισάγει τον αναγνώστη στην γλώσσα του Data Mining, αναλύει τους τομείς εφαρμογής του, καθώς και τα είδη των δεδομένων στα οποία είναι εφαρμόσιμο. Έπειτα γίνεται μια εκτενής αναφορά στις τρεις κυριότερες τεχνικές Data Mining, την κατηγοριοποίηση, τους κανόνες συσχέτισης και την ομαδοποίηση. Το δεύτερο κεφάλαιο αναφέρεται στην ομαδοποίηση, που είναι η τεχνική που θα εφαρμοστεί στην παρούσα εργασία. Αναλύονται οι κυριότεροι τύποι δεδομένων καθώς και τα διάφορα είδη αλγορίθμων που εφαρμόζονται. Επιπλέον, παρουσιάζονται οι βασικοί ορισμοί του πεδίου και αναλύεται η σπουδαιότητα λήψης συγκεκριμένων αποφάσεων όπως η επιλογή του αλγορίθμου, του μέτρου ομοιότητας και της αναπαράστασης των δεδομένων. Το τρίτο και τελευταίο κεφάλαιο αναφέρεται στην προτεινόμενη μεθοδολογία. Στην συγκεκριμένη εργασία χρησιμοποιούνται μέθοδοι μη επιβλεπόμενου Data Mining για την επεξεργασία βαρομετρικών δεδομένων τού ευρύτερου Μεσόγειου χώρου, με σκοπό να εντοπιστούν περιοχές κυκλογενέσεων. Έτσι στο κεφάλαιο αυτό αναλύεται το προς εξέταση πρόβλημα, και αναφέρονται οι στόχοι της εργασίας. Γίνεται αναφορά στο χρησιμοποιούμενο λογισμικό (WEKA) και έπειτα αναλύεται διεξοδικά όλη η προτεινόμενη μεθοδολογία και παρουσιάζονται οι χάρτες των αποτελεσμάτων, ενώ γίνεται σύγκριση αυτών με τα πραγματικούς βαρομετρικούς χάρτες. Τέλος, στα συμπεράσματα διαπιστώνεται η πρακτική αξία της μεθόδου και παρουσιάζονται κάποιες προτάσεις για περαιτέρω εξέλιξή της. / The present project deals with Data Mining to Barometric Maps Data. Data Mining techniques apply on several types of data, as those that emerge daily from internet, transactions and many other sources. Data Mining methods aim at finding useful, handy "hidden" knowledge in otherwise non-reclaimable sources. The project is structured in three chapters. The first chapter familiarizes the reader with the Data Mining language, analyzes the fields to which it is applicable and the kind of data that can be used. Afterwards the three most important Data Mining Techniques (Association Rules, Categorization, and Clustering) are deeply analyzed. The second chapter refers to Clustering, the technique in use here. The most important types of algorithms are mentioned and explained. Furthermore there is a brief reference to the most important field definitions and the importance of certain decision making issues (as the algorithm choice) is analyzed The last chapter presents the proposed method in this project. Non – supervised Data Mining methods are used to process barometric data of the wider Mediterranean space in order to detect cyclogenetic regions. So, here, the problem under examination is analyzed and the goals of this project are presented. After a brief reference to the software used (WEKA), the whole proposed methodology is deeply analyzed, the result maps are presented while at the same time are compared to the real maps. Finally, the practical value of this method is noted and are given a few proposals for future work. Εξόρυξη δεδομένων Ομαδοποίηση Βαρομετρικοί χάρτες Κυκλογένεση 005.74 Data mining Clustering Barometric maps Cyclogenesis

Search results