Spelling suggestions: "subject:"γνώση""
11 |
Αλγόριθμοι εξαγωγής κανόνων συσχέτισης και εφαρμογέςΜουσουρούλη, Ιωάννα 24 October 2008 (has links)
Η παρούσα μεταπτυχιακή εργασία έχει στόχο τη μελέτη προβλημάτων «κρυμμένης γνώσης» από συστήματα και εφαρμογές ηλεκτρονικού εμπορίου (e-commerce) και ηλεκτρονικής μάθησης (e-learning) με κύριο στόχο τη βελτίωση της ποιότητας και της απόδοσης των παρεχόμενων υπηρεσιών προς τους τελικούς χρήστες.
Στο πρώτο κεφάλαιο παρουσιάζεται ένα σενάριο για σημασιολογικά εξατομικευμένο e-learning. Ο προτεινόμενος αλγόριθμος βασίζεται σε μια οντολογία (ontology) η οποία βοηθά στη δόμηση και στη διαχείριση του περιεχομένου που σχετίζεται με μια δεδομένη σειρά μαθημάτων, ένα μάθημα ή ένα θεματικό. Η διαδικασία χωρίζεται σε δύο στάδια: στο offline στάδιο το οποίο περιλαμβάνει τις ενέργειες προετοιμασίας των δεδομένων, δημιουργίας της οντολογίας και εξόρυξης από δεδομένα χρήσης (usage mining) και στο online στάδιο το οποίο περιλαμβάνει την εξαγωγή των εξατομικευμένων συστάσεων. Το προτεινόμενο σύστημα σε πρώτη φάση βρίσκει ένα αρχικό σύνολο συστάσεων βασισμένο στην οντολογία του πεδίου και στη συνέχεια χρησιμοποιεί τα frequent itemsets (συχνά εμφανιζόμενα σύνολα στοιχείων) για να το εμπλουτίσει, λαμβάνοντας υπόψη την πλοήγηση άλλων παρόμοιων χρηστών (similar users). Με τον τρόπο αυτό, μειώνεται ο χρόνος που απαιτείται για την ανάλυση όλων των frequent itemsets και των κανόνων συσχέτισης. Η ανάλυση εστιάζεται μόνο σε εκείνα τα σύνολα που προέρχονται από το συνδυασμό της ενεργούς συνόδου (current session) του χρήστη και των συστάσεων της οντολογίας. Αν και η εξατομίκευση απαιτεί αρκετά βήματα επεξεργασίας και ανάλυσης, στη συγκεκριμένη προσέγγιση το εμπόδιο αυτό αποφεύγεται με την εκτέλεση σημαντικού μέρους της διαδικασίας offline.
Στο δεύτερο κεφάλαιο μελετάται το πρόβλημα της παραγωγής προτάσεων σε μια εφαρμογή e-commerce. Η προτεινόμενη υβριδική προσέγγιση στοχεύει στην παραγωγή αποτελεσματικών συστάσεων για τους πελάτες ενός online καταστήματος που ενοικιάζει κινηματογραφικές ταινίες. Η γνώση για τους πελάτες και τα προϊόντα προκύπτει από τα δεδομένα χρήσης και τη δομή της οντολογίας σε συνδυασμό με τις εκτιμήσεις-βαθμολογίες των πελατών για τις ταινίες καθώς και την εφαρμογή τεχνικών ταιριάσματος «όμοιων» πελατών. Όταν ένα ή περισσότερα κριτήρια ταιριάσματος ικανοποιούνται, τότε άλλες ταινίες μπορούν να προσδιοριστούν σύμφωνα με το οντολογικό σχήμα που έχουν παρόμοια χαρακτηριστικά με αυτές που ο πελάτης έχει ήδη νοικιάσει. Στην περίπτωση ενός νέου πελάτη όπου το ιστορικό του είναι κενό, αναλύονται πληροφορίες από την αίτηση εγγραφής του ώστε να ταξινομηθεί σε μια συγκεκριμένη κλάση πελατών και να παραχθούν προτάσεις με βάση το οντολογικό σχήμα. Αυτή η ενοποίηση παρέχει πρόσθετη γνώση για τις προτιμήσεις των πελατών και επιτρέπει την παραγωγή επιτυχημένων συστάσεων. Ακόμη και στην περίπτωση του «cold-start problem» όπου δεν είναι διαθέσιμη αρχική πληροφορία για τη συμπεριφορά του πελάτη, η προσέγγιση προβαίνει σε σχετικές συστάσεις.
Στο τρίτο κεφάλαιο παρουσιάζεται μία νέα προσέγγιση στο πρόβλημα της δημιουργίας συστάσεων. Οι προηγούμενες προσεγγίσεις δεν λαμβάνουν υπόψη τους τη σειρά με την οποία ο χρήστης προσπελαύνει τα δεδομένα, είτε πρόκειται για e-learning είτε πρόκειται για e-commerce δεδομένα. Στο κεφάλαιο αυτό προτείνεται μία τεχνική η οποία λαμβάνει υπόψη τη σειρά με την οποία ο χρήστης προσπελαύνει τα δεδομένα (ordering). Πιο συγκεκριμένα μελετάται η τεχνική αυτή σε e-commerce συστήματα και καλάθια αγορών. Παρουσιάζεται και αναλύεται η υλοποίηση του προτεινόμενου αλγορίθμου. Επιπλέον γίνεται αξιολόγηση των αποτελεσμάτων του αλγορίθμου σε testing input data τα οποία και δείχνουν την ποιότητα των παραγόμενων συστάσεων. / -
|
12 |
Μελέτη της ατομικής και συνεργατικής οικοδόμησης της γνώσης μαθητών μέσω της εννοιολογικής χαρτογράφησης σε υπολογιστικό περιβάλλονΚουφού, Ανδρεάννα 03 April 2012 (has links)
Η συστηματική καταγραφή, μελέτη και αξιολόγηση της πορείας οικοδόμησης της γνώσης είναι καθοριστικής σημασίας για την εκπαίδευση και την εκπαιδευτική έρευνα. Ιδιαίτερα όταν η μαθησιακή διαδικασία
λαμβάνει χώρα σε συνεργατικό περιβάλλον, προκύπτει η ανάγκη για διαρκή αξιολόγηση της οικοδόμησης της γνώσης τόσο της ομάδας όσο και του ατόμου. Μια ομάδα αποτελείται από μέλη, που έχουν τη δυνατότητα μέσω της συνεργατικής μάθησης να μοιραστούν μαθησιακές εμπειρίες, να αλληλοσυμπληρωθούν και να οικοδομήσουν νέα γνώση. Σε ένα ιδανικό
συνεργατικό περιβάλλον μάθησης το κάθε μέλος συμμετέχει ενεργά στην ομάδα και συμβάλει ισότιμα στην ολοκλήρωση των στόχων της. Στα
πραγματικά μαθησιακά περιβάλλοντα, όμως θα πρέπει συστηματικά να καταγραφεί και να μελετηθεί η εξατομικευμένη και συνεργατική μάθηση και ο τρόπος που αυτές αλληλοεπηρεάζονται, καθ’ όλη τη διαδικασία
οικοδόμησης της γνώσης.
Στόχο της έρευνας αποτέλεσε η μελέτη της πορείας της ατομικής και συνεργατικής οικοδόμησης της γνώσης μαθητών, η καταγραφή των παραγόντων που τις επηρεάζουν και η διερεύνηση πιθανών αλληλεπιδράσεών τους. Στην προσπάθεια αναζήτησης πιο ευαίσθητων, σε
σχέση με τα παραδοσιακά τεστ, καταγραφέων της μαθησιακής διαδικασίας και των αλλαγών που διαδραματίζονται καθώς αυτή συντελείται,
επιλέχθηκαν οι εννοιολογικοί χάρτες. Οι εννοιολογικοί χάρτες θεωρούνται κατάλληλο εργαλείο για την παρακολούθηση και καταγραφή της μαθησιακής διαδικασίας τόσο της ομάδας όσο και των μελών που την αποτελούν. Η
κατασκευή τους δε, με κατάλληλο λογισμικό εννοιολογικής χαρτογράφησης προσφέρει μεταξύ άλλων τα πλεονεκτήματα της εύκολης αναθεώρησης, αποθήκευσης και διευκόλυνσης της συνεργατικής μάθησης. Τέλος ιδιαίτερης
σημασίας θεωρείται ο τρόπος αξιολόγησης των χαρτών. Για να είναι αποτελεσματικός απαιτείται ένα συστηματικό, ποιοτικά προσανατολισμένο και παράλληλα απλό και αξιόπιστο στην εφαρμογή πρωτόκολλο ανάλυσης
των εννοιολογικών χαρτών.
Στην εργασία που ακολουθεί παρουσιάζεται η ερευνητική διαδικασία, μελέτης περίπτωσης, που διεξήχθη με ενδεκάχρονους μαθητές της έκτης τάξης του δημοτικού σχολείου. Σε συνθήκες πραγματικής τάξης, και με τη χρήση
λογισμικού εννοιολογικής χαρτογράφησης, οι μαθητές αναπαρέστησαν τις εννοιολογικές τους δομές και την πορεία που η οικοδόμηση της γνώσης τους ακολούθησε σε ατομικό και ομαδικό επίπεδο, κατασκευάζοντας εννοιολογικούς χάρτες εξατομικευμένα και συνεργατικά πριν, κατά τη διάρκεια και μετά τη διδασκαλία μιας διδακτικής παρέμβασης με θέμα: «Ενέργεια, Περιβάλλον και Ζωντανοί Οργανισμοί». Οι ακολουθίες ατομικά και συνεργατικά κατασκευασμένων εννοιολογικών χαρτών αναλύθηκαν με τη χρήση ενός πρότυπου πρωτόκολλου ανάλυσης εννοιολογικών χαρτών που
αναπτύχθηκε στο πλαίσιο της παρούσας έρευνας και αναλυτικά θα παρατεθεί παρακάτω, ώστε να καλύψει τις ανάγκες μια πλήρους, ποσοτικής και ποιοτικής αποτίμησης των εννοιολογικών χαρτών.
Η ερευνητική διαδικασία οδήγησε πρώτα απ’ όλα στο συμπέρασμα ότι οι ακολουθίες ατομικά και συνεργατικά κατασκευασμένων εννοιολογικών
χαρτών, αξιολογημένων με ποιοτικά κατά κύριο λόγο κριτήρια μπορούν να παράσχουν μια λεπτομερή καταγραφή της οικοδόμησης της γνώσης μιας ομάδας, των μελών της αλλά και των αλληλεπιδράσεων αυτών. Επίσης
αναδείχθηκε ο ρόλος των νοητικών αναπαραστάσεων, οι οποίες τόσο ατομικά
όσο και συνεργατικά συχνά επηρέασαν την πορεία της οικοδόμησης της γνώσης, καθορίζοντας τον τρόπο διαχείρισης της νέας γνώσης. Τέλος καταγράφηκαν και άλλοι παράγοντες που επηρέασαν την οικοδόμησης της
γνώσης, όπως το φύλο, η προσωπικότητα και οι σχέσεις των μελών μιας ομάδας. / The systematic recording and evaluation of knowledge construction is of critical importance in learning studies. In particular, when the learning process takes place in a collaborative environment, then a permanent evaluation of knowledge construction is needed both for group members and the group as a whole. Group members interact and share learning experiences
aiming to construct new knowledge. In an ideal collaborative environment each member would participate actively and contribute equivalently to the fulfilling of the group aims. In real learning environments, however, this remains to be proven by the systematic recording both of the individual and
group knowledge construction, as well as the evaluation of contribution of each member to the collaborative learning process and vice versa.
The aim of the present research was to study the individual and collaborative knowledge construction of students, searching for the factors that influence the interaction of those during the learning process. Concept
maps were selected as recorders of knowledge construction, as these are considered a suitable and sensitive tool for revealing the participants’ conceptual structures and for recording the learning process of both group
and group members. Their construction, with suitable concept mapping software offers among others the advantages of easy revision, storage and facilitation of collaborative learning. In addition, we considered assessment methods of concept maps in order to develop a protocol of analysis that
would allow an effective and systematic assessment, both qualitative and
quantitative and at the same time simple and reliable in the application.
In the thesis that follows a case study research is presented, which was carried out with the participation of eleven years old students of sixth class of Greek elementary school. In real class conditions and with the use of concept mapping software the students represented their cognitive structures in various phases of a course in individual and collaborative level, constructing concept maps individually and collaboratively, before, during and after teaching on the subject: “Energy and Environment”. Sequences of individually and collaboratively constructed concept maps were evaluated with the use of a model protocol of analysis of conceptual maps that was developed in the frame of present research in order to have a complete, quantitative and qualitative assessment of concept maps.
The analysis of concept maps of group members and groups have led us to conclude that first of all individual and collaborative learning process and their interaction is revealead through the evaluation of concept map
consequences, especially when a qualitatively oriented assessment protocol is used. Also, we led to the conclusion that the conceptual representations of a group and of its members often influences the process of collaborative and individual learning by defining the way which they manage new knowledge.
In addition, other factors such as gender, personality and relation of group members also influence the knowledge structure process.
|
13 |
Μελέτη εφαρμογών μεθόδων εξόρυξης γνώσης σε κοινωνικά δίκτυαΧριστακοπούλου, Ευαγγελία 03 October 2011 (has links)
Ένα βασικό ανοιχτό ερώτημα στην ανάλυση των online κοινωνικών δικτύων είναι η κατανόηση του φαινομένου της ομοφιλίας. Οι χρήστες τους είναι όμοιοι με τους φίλους τους, όσον αφορά τα ενδιαφέροντά τους. Στη διπλωματική αυτή εργασία, επιχειρείται η διερεύνηση του φαινομένου της ομοφιλίας στο Facebook και στο Twitter. Τα datasets τα οποία εξορύχθηκαν για αυτήν τη διπλωματική εργασία αφορούν τους Έλληνες χρήστες. Ακόμη, εισάγεται ένα νέο μοντέλο για τη μέτρηση της ομοιότητας μεταξύ των χρηστών , ως προς τα κοινά τους ενδιαφέροντα – το προσαρμοσμένο vector space μοντέλο. Το μοντέλο αυτό συγκρίνεται με τη διαδεδομένη μέθοδο των κοινών γειτόνων. Τέλος, προτείνεται η δημιουργία recommendations βάσει των κοινών ενδιαφερόντων των χρηστών και όχι μόνο βάσει των κοινών φίλων . Μάλιστα, κατασκευάζεται μια web application η οποία δείχνει το πώς μπορεί να πραγματοποιηθεί αυτό, κάνοντας homophily-based recommendations και χρησιμοποιώντας το προσαρμοσμένο vector space μοντέλο. / A fundamental open question in social networking analysis is the research of the phenomenon of homophily. The users of the social networking sites are similar to their friends, regarding their interests, their hobbies and their topics of discussion. In this diploma thesis, the study of the phenomenon of homophily is attempted in two main and popular networking sites- Facebook and Twitter. The datasets that were mined for the purpose of this diploma thesis concern the Greek users of the two above-mentioned social networking sites.Moreover, a new method for measuring similarity between users regarding their common interests is introduced- the so-called “adapted vector-space model”. This model is compared to the popular method of common neighbors. Finally, the creation of recommendations based on the common interests of users (and not only based on the existence of common friends, as is the case with the existing situation) is suggested. What is more, a web application is constructed that shows how this can be implemented. This application makes homophily-based recommendations and it uses the adapted vector-space model.
|
14 |
Εξόρυξη πληροφορίας από βιοϊατρική βιβλιογραφία : εφαρμογή στην ανάλυση κειμένων (text mining) από πηγές στον παγκόσμιο ιστόΙωάννου, Ζαφειρία - Μαρίνα 23 January 2012 (has links)
Τα τελευταία χρόνια, υπάρχει ένα αυξανόμενο ενδιαφέρον για την αυτόματη εξόρυξη κειμένων (Text Mining) με βιοϊατρικό περιεχόμενο, λόγω της ραγδαίας αύξησης των δημοσιεύσεων που είναι αποθηκευμένες σε ηλεκτρονική μορφή σε Βάσεις Δεδομένων του Παγκόσμιου Ιστού, όπως το PubMed και το Springerlink.
Το βασικό πρόβλημα που κάνει αυτό τον στόχο περισσότερο προκλητικό και δύσκολο είναι η αδυναμία της επεξεργασίας της διαθέσιμης αυτής πληροφορίας και της εξαγωγής χρήσιμων συνδέσεων και συμπερασμάτων. Κρίνεται, επομένως, επιτακτική η ανάπτυξη νέων εργαλείων που θα διευκολύνουν την εξόρυξη γνώσης από κείμενα βιολογικού περιεχομένου.
Σκοπός της παρούσας διπλωματικής εργασίας είναι αρχικά η παρουσίαση γνωστών μεθόδων εξόρυξης δεδομένων από κείμενα αλλά και η ανάπτυξη ενός εργαλείου για την αποδοτική και αξιόπιστη ανακάλυψη γνώσεων από βιοϊατρική βιβλιογραφία που να βασίζεται σε προηγμένες τεχνικές εξόρυξης γνώσης από κείμενα.
Πιο συγκεκριμένα, η προσπάθειά μας επικεντρώνεται στην ανάπτυξη ενός αποδοτικού αλγόριθμου συσταδοποίησης και τη χρήση αποδοτικών τεχνικών που αξιολογούν τα αποτελέσματα της συσταδοποίησης, έτσι ώστε να παρέχεται βοήθεια στον χρήστη στην προσπάθεια αναζήτησης του για πληροφορία βιολογικού περιεχομένου.
Ο προτεινόμενος αλγόριθμος βασίζεται σε διαφορετικές τεχνικές συσταδοποίησης, όπως ο Ιεραρχικός Αλγόριθμος και ο Spherical K-means Αλγόριθμος και εφαρμόζει μια τελική ταξινόμηση με βάση το Impact Factor των κειμένων που ανακτήθηκαν.
Τα βασικά βήματα που περιλαμβάνει ο αλγόριθμος είναι: η προεπεξεργασία των κειμένων, η αναπαράσταση των κειμένων σε διανυσματική μορφή με χρήση του Διανυσματικού Μοντέλου (Vector Space Model), η εφαρμογή της Λανθάνουσας Σημασιολογικής Δεικτοδότησης (Latent Semantic Indexing), η Ασαφής Συσταδοποίηση (Fuzzy Clustering), ο Ιεραρχικός Αλγόριθμος (Hierarchical Algorithm), o Spherical K-means Αλγόριθμος, η επιλογή της καλύτερης συστάδας και τέλος η ταξινόμηση με βάση το Impact Factor των κειμένων που ανακτήθηκαν.
Η εφαρμογή που υλοποιούμε βασίζεται στον παραπάνω αλγόριθμο και προσφέρει δύο τρόπους αναζήτησης: 1) σε τρέχοντα ερωτήματα του χρήστη, τα οποία αποθηκεύονται στη βάση δεδομένων και επομένως λειτουργεί ως μέσο συμπιεσμένης αποθήκευσης των προηγούμενων ερωτημάτων του χρήστη, 2) αναζήτηση μέσα από μία λίστα προκαθορισμένων Topic βιολογικού περιεχομένου και επομένως παρέχει στο χρήστη μια επιπλέον βοήθεια σε ένα ευρύ φάσμα ερωτημάτων. Επιπλέον, η εφαρμογή εξάγει χρήσιμες συσχετίσεις όρων χρησιμοποιώντας τις τελικές συστάδες. / There is an increasing interest in automatic text mining in biomedical texts due to the increasing number of electronically available publications stored in databases such as PubMed and SpringerLink.
The main problem that makes this goal more challenging and difficult is the inability of processing the available information and extracting useful connections and assumptions. Therefore, there is an urgent need for new text-mining tools to facilitate the process of text mining from biomedical documents.
The goal of the present diploma thesis is to present known methods of text mining, and to develop an application that provides reliable knowledge from biomedical literature based on efficient text mining techniques.
In particular, our attempt is mainly focused on developing an efficient clustering algorithm and using techniques for evaluating the results of clustering, in order to assist the users in their biological information seeking activities.
The proposed algorithm involves different clustering techniques, such as Hierarchical Algorithm, Spherical K-means Algorithm and employs a final ranking according to Impact Factor of retrieved documents.
The basic steps of our algorithm are: preprocessing of text’s content, representation with the vector space model, applying Latent Semantic Indexing (LSI), fuzzy clustering, hierarchical clustering, spherical k-means clustering, selection of the best cluster and ranking of biomedical documents according to their impact factor.
The application that we implement is based on the above algorithm and provides two search methods: 1) search with user’s queries, which are saved in the database and thus playing the role of a compacted storage of his past search activities, 2) search through a list of pre-specified biological Topics, and thus providing the user with an extra assistance in his various queries. Moreover the whole scheme can mine useful associations between terms by exploiting the nature of the formed clusters.
|
15 |
Εφαρμογές και τεχνικές εξόρυξης και οπτικοποίησης γνώσης σε βιοϊατρικά δεδομέναΜερίδου, Δέσποινα 08 May 2013 (has links)
Η οπτικοποίηση των δεδομένων (data visualization) αποτελεί τη διαδικασία αναπαράστασης αφαιρετικών ή επιστημονικών δεδομένων με τη μορφή εικόνας, η οποία μπορεί να συμβάλει στην καλύτερη και βαθύτερη κατανόηση της σημασίας των δεδομένων και των μεταβλητών ή των μονάδων που συνιστούν τα δεδομένα αυτά. Λόγω των τεράστιων και συνεχώς αυξανόμενων ποσοτήτων και πηγών πληροφορίας, η ανάγκη για οπτικοποίηση είναι μεγάλη. Εφαρμόζοντας διάφορα μέσα οπτικοποίησης, η μελέτη των δεδομένων γίνεται πιο αποδοτική: τα δεδομένα εξετάζονται μαζικά και γρήγορα. Επίσης, η οπτικοποίηση των δεδομένων συμβάλλει στην ουσιαστική κατανόηση ενός ορισμένου προβλήματος και μπορεί να οδηγήσει στην ανακάλυψη νέων εννοιών και λύσεων.
Η τεχνική της οπτικοποίησης δεδομένων βρίσκει ιδιαίτερη εφαρμογή στον τομέα της Βιοπληροφορικής. Συγκεκριμένα, η οπτικοποίηση εφαρμόζεται σε δεδομένα αλληλουχιών, γονιδιωμάτων, μακρομοριακών δομών, συστημικής βιολογίας, μαγνητικής τομογραφίας, κλπ. Η πρόσφατη και ολοένα μεγαλύτερη πρόοδος στη διαθεσιμότητα δεδομένων και στις μεθόδους ανάλυσης έχει δημιουργήσει νέες ευκαιρίες για τους ερευνητές, έτσι ώστε αυτοί να είναι σε θέση να βελτιώσουν τις μεθόδους καταγραφής νόσων σε εθνικό ή τοπικό επίπεδο.
Η HELPIDA (HELlenic ePIdemiological DAtabase) αποτελεί την πρώτη προσπάθει καταγραφής ενός μεγάλου αριθμού επιδημιολογικών μελετών από τον χώρο της ελλάδας, συνδυασμού αυτών με γεωγραφικές και στατιστικές παραμέτρους και οπτικοποίησης των αποτελεσμάτων με σκοπό την εξόρυξη πολύτιμης πληροφορίας. Σε ό,τι αφορά την πρώτη έκδοσή της, η HELPIDA αναπτύχθηκε με τη χρήστη των γλωσσών προγραμματισμού ASP.NET και Visual C#. Στην εργασία αυτή, παρουσιάζεται η δεύτερη έκδοση της HELPIDA, η οποία σχεδιάστηκε με τη βοήθεια του εργαλείου Microsoft Lightswitch και εμπλουτίστηκε με γραφήματα και οπτικοποιήσεις δεδομένων.
Εφαρμόζοντας ορισμένα εργαλεία οπτικοποίησης, στοχεύουμε στον χαρακτηρισμό της HELPIDA ως ένα πολύτιμο εργαλείο στον τομέα της Δημόσιας Υγείας και ελπίζουμε ότι θα χρησιμοποιηθεί από ερευνητές σε ακαδημαϊκό επίπεδο αλλά και σε άλλους τομείς. / Data visualization is the study of the visual representation of data, meaning "information that has been abstracted in some schematic form, including attributes or variables for the units of information". The ability to visualize the implications of data is as old as humanity itself. Yet due to the vast quantities, sources, and sinks of data being pumped around our global economy at an ever increasing rate, the need for superior visualization is great and growing. Data visualization is efficient: vast quantities of data are processed in a simple and quick manner. Furthermore, visualizations can help an analyst or a group achieve more insight into the nature of a problem and discover new understanding.
Data Visualization is often applied in the field of Bioinformatics. Specifically, software tools are used for the visualization of sequences, genomes, alignments, phylogenies, macromolecular structures, systems biology, microscopy, and magnetic resonance imaging data.
HELPIDA (HELlenic ePIdemiological DAtabase) is the first attempt to register a large number of epidemiological studies from Greece, to combine them with geographical and statistical parameters and to visualize the results in order to mine valuable information. As fas as the first version of the application is concerned, HELPIDA was developed using the programming languages ASP.NET and Visual C#. In this thesis, the second version of HELPIDA, which was designed using the tool Microsoft Lightswitch and was enhanced with charts and data visualizations, is presented.
Being enhanced with certain data visualization tools, HELPIDA is aiming at being used as an invaluable tool for Public Health decisions and we hope that it will be exploited by decision makers in academic and political level.
|
16 |
Εφαρμογή τεχνικών εξόρυξης γνώσης στην εκπαίδευσηΠαπανικολάου, Δονάτος 31 May 2012 (has links)
Σε αυτή την Διπλωματική εργασία μελετήσαμε με ποιο τρόπο μπορούν να εφαρμοστούν οι διάφορες τεχνικές Εξόρυξης Γνώσης (Data Mining) στην εκπαίδευση. Αυτός ο επιστημονικός τομέας o οποίος ερευνά και αναπτύσσει τεχνικές προκειμένου να ανακαλύψει γνώση από δεδομένα τα οποία προέρχονται από την εκπαίδευση ονομάζεται Εξόρυξη Γνώσης από Εκπαιδευτικά Δεδομένα (Educational Data Mining –EDM. Στην εργασία αυτή εκτός από την θεωρητική μελέτη των αλγορίθμων και των τεχνικών που διέπουν την εξόρυξη γνώσης από δεδομένα γενικά, έγινε και μια λεπτομερέστερη μελέτη και παρουσίαση της κατηγορίας των αλγορίθμων κατηγοριοποίησης (Classification), διότι αυτοί οι αλγόριθμοι χρησιμοποιήθηκαν στην φάση της υλοποίησης/αξιολόγησης. Στην συνέχεια η εργασία επικεντρώθηκε στον τρόπο με τον οποίο μπορούν να εφαρμοστούν αυτοί οι αλγόριθμοι σε εκπαιδευτικά δεδομένα, τι εφαρμογές έχουμε στην εκπαίδευση, ενώ αναφερόμαστε και σε μια πληθώρα ερευνών που έχουν πραγματοποιηθεί πάνω στο συγκεκριμένο αντικείμενο. Στην συνέχεια διερευνήσαμε την εφαρμογή τεχνικών κατηγοριοποίησης στην πρόγνωση της επίδοσης μαθητών Δευτεροβάθμιας Εκπαίδευσης στα μαθήματα της Γεωγραφίας Α’ και Β’ Γυμνασίου. Συγκεκριμένα υλοποιήσαμε και θα αξιολογήσαμε έξι αλγορίθμους οι οποίοι ανήκουν στην ομάδα των αλγορίθμων κατηγοριοποίησης(Classification) και είναι αντιπροσωπευτικοί των σημαντικότερων τεχνικών κατηγοριοποίησης. Από την οικογένεια των ταξινομητών με χρήση δένδρων απόφασης (Decision Tree Classifiers) υλοποιήσαμε τον J48, από τους αλγορίθμους κανόνων ταξινόμησης (Rule-based Classification ) τον Ripper, από τους αλγόριθμους στατιστικής κατηγοριοποίησης τον Naïve Bayes, από την μέθοδο των Κ πλησιέστερων γειτόνων (KNN) τον 3-ΝΝ, από την κατηγορία των τεχνητών νευρωνικών δικτύων τον Back Propagation και τέλος από τις μηχανές διανυσμάτων υποστήριξης (Support Vector Machines SVM) τον SMO (Sequental Minimal Optimazation). Όλες οι παραπάνω υλοποιήσεις και αξιολογήσεις έγιναν με το ελεύθερο λογισμικού Weka το οποίο είναι υλοποιημένο σε Java και το οποίο προσφέρει μια πληθώρα αλγορίθμων μηχανικής μάθησης για να κάνουμε εξόρυξη γνώσης. / In this work we will study the way the misc data mining techniques can be applied to the misc fields of the education. This new scientific field is commonly named Educational Data Mining. In this study we will study the theoretical analysis of the data mining techniques focussing to the classification techniques as those are the most commonly used for prediction purpose. We also intend to predict student performance in secondary education using data mining techniques. The data we collect are concerned the class of Geography and we apply to them six data mining models with the help of the open source machine learning software Weka. We use supervised machine learning algorithms from the Classification field (Decision Tree Classifiers, Rule-based Classification, Neural Networks, k-Nearest Neighbour Algorithm, Bayesian and Support Vector Machines). After we have evaluate the algorithms we build a java tool, that uses the 3-KNN algorithm, to help us predict the performance of a student at the end of the year.
|
17 |
Εξαγωγή γνώσης από αποθήκες υπηρεσιών Παγκόσμιου Ιστού / Knowledge extraction from Web services repositoriesΚιούφτης, Βασίλειος 16 May 2014 (has links)
Με την αυξανόμενη χρήση του Παγκόσμιου Ιστού και των Συστημάτων Προσανατολισμένων στις Υπηρεσίες , οι υπηρεσίες παγκόσμιου ιστού έχουν γίνει μίας ευρέως διαδεδομένη ως προς τη χρήση τεχνολογία. Οι αποθήκες υπηρεσιών παγκόσμιου ιστού αναπτύσσονται με ραγδαίους ρυθμούς , δημιουργώντας την ανάγκη ανάπτυξης προηγμένων εργαλείων για την οργάνωση και δεικτοδότησή τους. Η ομαδοποίηση των υπηρεσιών παγκόσμιου ιστού, οι οποίες συνήθως αναπαρίστανται από έγγραφα Γλώσσας Περιγραφής Υπηρεσιών Παγκόσμιου Ιστού (Web Service Description Language - WSDL) , καθιστά τις μηχανές αναζήτησης υπηρεσιών παγκόσμιου ιστού αλλά και τους χρήστες ικανούς να οργανώνουν και να επεξεργάζονται μεγάλες αποθήκες υπηρεσιών σε ομάδες με παρόμοια λειτουργικότητα και χαρακτηριστικά. Σε αυτή την εργασία προτείνουμε μια νέα τεχνική για την ομαδοποίηση των WSDL εγγράφων. Η προτεινόμενη μέθοδος θεωρεί τις υπηρεσίες παγκόσμιου ιστού ως κατηγορικά δεδομένα όπου κάθε υπηρεσία περιγράφεται από ένα σύνολο τιμών που εξάγονται από το περιεχόμενο και τη δομή του αντίστοιχου αρχείου περιγραφής και ως μέτρο ποιότητας της ομαδοποίησης ορίζεται η αμοιβαία πληροφορία μεταξύ των ομάδων και των τιμών τους. Περιγράφουμε τον τρόπο με τον οποίο οι υπηρεσίες παγκόσμιου ιστού αναπαρίστανται ως κατηγορικά δεδομένα και ομαδοποιούνται, χρησιμοποιώντας τον αλγόριθμο ομαδοποίησης κατηγορικών δεδομένων LIMBO , ελαχιστοποιώντας συγχρόνως την απώλεια πληροφορίας στις τιμές που εξάγονται από τα γνωρίσματα. Κατά την πειραματική αξιολόγηση , η δική μας προσέγγιση υπερέχει σε απόδοση F-Measure τις τεχνικές που χρησιμοποιούν εναλλακτικές μετρικές ομοιότητας και μεθόδους για την ομαδοποίηση WSDL εγγράφων. / With the increasing use of web and Service Oriented Systems, web-services have become a widely adopted technology. Web services repositories are growing fast, creating the need for advanced tools for organizing and indexing them. Clustering web services, usually represented by Web Service Description Language (WSDL) documents, enables the web service search engines and users to organize and process large web service repositories in groups with similar functionality and characteristics. In this paper, we propose a novel technique of clustering WSDL documents. The proposed method considers web services as categorical data and each service is described by a set of values extracted from the content and structure of its description file and as quality measure of clustering is defined the mutual information of the clusters and their values. We describe the way to represent web services as categorical data and how to cluster them by using LIMBO algorithm, minimizing at the same time the information loss in features values. In experimental evaluation, our approach outperforms in terms of F-Measure the approaches which use alternative similarity measures and methods for clustering WSDL documents.
|
18 |
Εξόρυξη γνώσης από δεδομέναΟικονομάκης, Εμμανουήλ Κ. 20 October 2009 (has links)
Στη συγκεκριμένη διπλωματική εργασία αναλύεται το πρόβλημα του εντοπισμού ομάδων σε σύνολα δεδομένων (ομαδοποίηση δεδομένων).
Δίνεται μια σύντομη ανασκόπηση των μεθόδων που χρησιμοποιούνται σήμερα στην ομαδοποίηση δεδομένων και ιδιαίτερα στην ολοένα και αυξανόμενη χρήση Εξελικτικών Αλγόριθμων (ΕΑ) στην ομαδοποίηση. Οι ΕΑ έχουν αποδειχθεί ιδιαίτερα αποτελεσματικοί σε μια πληθώρα προβλημάτων βελτιστοποίησης. Η χρήση ΕΑ είναι αναμενόμενη, καθώς η ομαδοποίηση δεδομένων μπορεί να εκφραστεί και ως πρόβλημα
βελτιστοποίησης. Επιπρόσθετα, παρουσιάζεται μια μέθοδος αντιμετώπισης της (συνήθως) μεγάλης διάστασης των προβλημάτων ομαδοποίησης, κάτι που επιβαρύνει ιδιαίτερα τους ΕΑ.
Αναλυτικότερα, το πρώτο μέρος της διπλωματικής εργασίας παρέχει μια σφαιρική εικόνα του προβλήματος της ομαδοποίησης καθώς και των κατηγοριών των αλγορίθμων, που έχουν προταθεί για τον εντοπισμό ομάδων. Επιπλέον, παρουσιάζονται δομές δεδομένων που χρησιμοποιούνται από αλγόριθμους ομαδοποίησης για την επιτάχυνσή τους, όπως είναι τα Range Trees και τα BBD Trees.
Εν συνεχεία, παρουσιάζονται αναλυτικά οι ΕΑ και ο τρόπος εφαρμογής τους σε προβλήματα ομαδοποίησης δεδομένων, αναλύοντας τρόπους αναπαράστασης του προβλήματος ομαδοποίησης, έτσι ώστε να είναι δυνατή η χρήση ΕΑ καθώς επίσης και οι μορφές των αντικειμενικών συναρτήσεων. Εισάγεται μια νέα προσέγγιση της εφαρμογής των ΕΑ σε προβλήματα ομαδοποίησης με σκοπό την πλήρη αποδέσμευση της διαδικασίας από εκτιμήσεις του πλήθους των ομάδων. Η διπλωματική εργασία κλείνει με τη σύγκριση υπάρχοντων αλγορίθμων ομαδοποίησης, που εφαρμόζουν την καθιερωμένη προσέγγιση της εφαρμογής των ΕΑ σε προβλήματα ομαδοποίησης, ένα νέο τρόπο εφαρμογής των ΕΑ, καθώς και κλασικούς αλγόριθμους όπως ο k-means και ο DBSCAN. Η σύγκριση γίνεται σε τεχνητά σύνολα δεδομένων, το κάθε ένα με διαφορετικές ιδιαιτερότητες. / In this master thesis, the problem of finding groups in data sets (data clustering) is analyzed. Data clustering methods in general and, more specifically, Evolutionary Algorithms (EA) based methods are shortly reviewed. EA's have proven to be effective in a extensive number of optimization problems. Since data clustering can be formulated as an optimization problem, EA can be utilized. Additionally, a method of reducing the (usually) large dimensionality of clustering problems is presented, since this hinders the performance and stability of EAs.
The first part of this thesis provides an introduction to clustering as well as to existing clustering algorithms. Additionally, data structures used by clustering algorithms such as Range trees and BBD trees are described. After that, EA is described thoroughly as well as approaches of applying them on clustering problems, by analyzing forms of presenting a clustering problem in a way than an EA can be used, as well as and possible objective functions. A new approach of applying EAs on clustering problems is introduced, in an attempt to automatically determine the number of clusters present in a data set. Finally, an existing EA-based method and well known clustering algorithms such as k-means and DBSCAN are compared to the proposed approach. This comparison is made on artificial data sets, each one with its own characteristics.
|
19 |
Προηγμένες τεχνικές και αλγόριθμοι εξόρυξης γνώσης για την προσωποποίηση της πρόσβασης σε δικτυακούς τόπους / Advanced techniques and algorithms of knowledge mining from Web SitesΓιαννακούδη, Θεοδούλα 16 May 2007 (has links)
Η προσωποποίηση του ιστού είναι ένα πεδίο που έχει κερδίσει μεγάλη προσοχή όχι μόνο στην ερευνητική περιοχή, όπου πολλές ερευνητικές μονάδες έχουν ασχοληθεί με το πρόβλημα από διαφορετικές μεριές, αλλά και στην επιχειρησιακή περιοχή, όπου υπάρχει μία ποικιλία εργαλείων και εφαρμογών που διαθέτουν ένα ή περισσότερα modules στη διαδικασία της εξατομίκευσης. Ο στόχος όλων αυτών είναι, εξερευνώντας τις πληροφορίες που κρύβονται στα logs του εξυπηρετητή δικτύου να ανακαλύψουν τις αλληλεπιδράσεις μεταξύ των επισκεπτών των ιστότοπων και των ιστοσελίδων που περιέχονται σε αυτούς. Οι πληροφορίες αυτές μπορούν να αξιοποιηθούν για τη βελτιστοποίηση των δικτυακών τόπων, εξασφαλίζοντας έτσι αποτελεσματικότερη πλοήγηση για τον επισκέπτη και διατήρηση του πελάτη στην περίπτωση του επιχειρηματικού τομέα. Ένα βασικό βήμα πριν την εξατομίκευση αποτελεί η εξόρυξη χρησιμοποίησης από τον ιστό, ώστε να αποκαλυφθεί τη γνώση που κρύβεται στα log αρχεία ενός web εξυπηρετητή. Εφαρμόζοντας στατιστικές μεθόδους και μεθόδους εξόρυξης δεδομένων στα web log δεδομένα, μπορούν να προσδιοριστούν ενδιαφέροντα πρότυπα που αφορούν τη συμπεριφορά πλοήγησης των χρηστών, όπως συστάδες χρηστών και σελίδων και πιθανές συσχετίσεις μεταξύ web σελίδων και ομάδων χρηστών. Τα τελευταία χρόνια, γίνεται μια προσπάθεια συγχώνευσης του περιεχομένου του ιστού στη διαδικασία εξόρυξης χρησιμοποίησης, για να επαυξηθεί η αποτελεσματικότητα της εξατομίκευσης. Το ενδιαφέρον σε αυτή τη διπλωματική εργασία εστιάζεται στο πεδίο της εξόρυξης γνώσης για τη χρησιμοποίηση δικτυακών τόπων και πώς η διαδικασία αυτή μπορεί να επωφεληθεί από τα χαρακτηριστικά του σημασιολογικού ιστού. Αρχικά, παρουσιάζονται τεχνικές και αλγόριθμοι που έχουν προταθεί τα τελευταία χρόνια για εξόρυξη χρησιμοποίησης από τα log αρχεία των web εξυπηρετητών. Έπειτα εισάγεται και ο ρόλος του περιεχομένου στη διαδικασία αυτή και παρουσιάζονται δύο εργασίες που λαμβάνουν υπόψη και το περιεχόμενο των δικτυακών τόπων: μία τεχνική εξόρυξης χρησιμοποίησης με βάση το PLSA, η οποία δίνει στο τέλος και τη δυνατότητα ενοποίησης του περιεχομένου του ιστού και ένα σύστημα προσωποποίησης το οποίο χρησιμοποιεί το περιεχόμενο του ιστοτόπου για να βελτιώσει την αποτελεσματικότητα της μηχανής παραγωγής προτάσεων. Αφού αναλυθεί θεωρητικά το πεδίο εξόρυξης γνώσης από τα logs μέσα από την περιγραφή των σύγχρονων τεχνικών, προτείνεται το σύστημα ORGAN-Ontology-oRiented usaGe ANalysis- το οποίο αφορά στη φάση της ανάλυσης των log αρχείων και την εξόρυξη γνώσης για τη χρησιμοποίηση των δικτυακών τόπων με άξονα τη σημασιολογία του ιστοτόπου. Τα σημασιολογικά χαρακτηριστικά του δικτυακού τόπου έχουν προκύψει με τεχνικές εξόρυξης δεδομένων από το σύνολο των ιστοσελίδων και έχουν σχολιαστεί από μία OWL οντολογία. Το ORGAN παρέχει διεπαφή για την υποβολή ερωτήσεων σχετικών με την επισκεψιμότητα και τη σημασιολογία των σελίδων, αξιοποιώντας τη γνώση για το site, όπως αναπαρίσταται πάνω στην οντολογία. Περιγράφεται διεξοδικά ο σχεδιασμός, η ανάπτυξη και η πειραματική αξιολόγηση του συστήματος και σχολιάζονται τα αποτελέσματα του. / Web personalization is a domain which has gained great momentum not only in the research area, where many research units have addressed the problem form different perspectives, but also in the industrial area, where a variety of modules for the personalization process is available. The objective is, researching the information hidden in the web server log files to discover the interactions between web sites visitors and web sites pages. This information can be further exploited for web sites optimization, ensuring more effective navigation for the user and client retention in the industrial case. A primary step before the personalization is the web usage mining, where the knowledge hidden in the log files is revealed. Web usage mining is the procedure where the information stored in the Web server logs is processed by applying statistical and data mining techniques such as clustering, association rules discovery, classification, and sequential pattern discovery, in order to reveal useful patterns that can be further analyzed. Recently, there has been an effort to incorporate Web content in the web usage mining process, in order to enhance the effectiveness of personalization. The interest in this thesis is focused on the domain of the knowledge mining for usage of web sites and how this procedure can get the better of attributes of the semantic web. Initially, techniques and algorithms that have been proposed lately in the field of web usage mining are presented. After, the role of the context in the usage mining process is introduced and two relevant works are presented: a usage mining technique based on the PLSA model, which may integrate attributes of the site content, and a personalization system which uses the site content in order to enhance a recommendation engine. After analyzing theoretically the usage mining domain, a new system is proposed, the ORGAN, which is named after Ontology-oRiented usaGe ANalysis. ORGAN concerns the stage of log files analysis and the domain of knowledge mining for the web site usage based on the semantic attributes of the web site. The web site semantic attributes have resulted from the web site pages applying data mining techniques and have been annotated by an OWL ontology. ORGAN provides an interface for queries submission concerning the average level of visitation and the semantics of the web site pages, exploiting the knowledge for the site, as it is derived from the ontology. There is an extensive description of the design, the development and the experimental evaluation of the system.
|
20 |
Ολοκλήρωση συστημάτων υποστήριξης ομαδικών αποφάσεων και διαχείρισης οργανωσιακής γνώσης / Ιntegration of group decision support and organizational knowledge management systemsΕυαγγέλου, Χριστίνα 25 June 2007 (has links)
Αυτή η διδακτορική διατριβή αφορά στην εννοιολογική και λειτουργική ολοκλήρωση των Συστημάτων Υποστήριξης Ομαδικών Αποφάσεων και Διαχείρισης Οργανωσιακής Γνώσης. Η προτεινόμενη προσέγγιση αποτελεί μια καινοτόμο προσπάθεια συγκερασμού και διεύρυνσης των δυνατοτήτων που παρέχονται από υπάρχουσες τεχνικές και των δύο παραπάνω επιστημονικών περιοχών, με στόχο τόσο την πληρέστερη κάλυψη των ολοένα αυξανόμενων αναγκών των χρηστών που εμπλέκονται σε σχετικά προβλήματα, όσο και την αποτελεσματικότερη αξιοποίηση της γνώσης ενός οργανισμού. Λαμβάνοντας υπόψη τη διατυπωμένη ανάγκη για μια ολοκληρωμένη προσέγγιση, η διατριβή επιχειρεί τη σύνθεση αρχών και τεχνικών από διάφορα πεδία έρευνας, υποστηρίζοντας ότι η διαχείριση γνώσης και η λήψη αποφάσεων δε θα πρέπει να αντιμετωπίζονται ως χωριστές διαδικασίες. Προς αυτή την κατεύθυνση, προτείνεται ένα πλαίσιο ολοκλήρωσής τους. Αναγνωρίζοντας ότι σε αυτού του είδους τα περιβάλλοντα σημαντικό ρόλο παίζει η ενεργή συμμετοχή των ληπτών αποφάσεων στις διαδικασίες διανομής της γνώσης, η προτεινόμενη προσέγγιση προτείνει επίσης ένα πλαίσιο ενίσχυσης της συμμετοχής τους στις σχετικές διαδικασίες. Το προτεινόμενο πλαίσιο ολοκλήρωσης υποστηρίζεται από ένα πρωτότυπο εργαλείο λογισμικού, το οποίο αναπτύχθηκε στα πλαίσια της διατριβής. Στο προτεινόμενο εργαλείο, η ολοκλήρωση των διαδικασιών λήψης ομαδικών αποφάσεων και διαχείρισης οργανωσιακής γνώσης επιτυγχάνεται μέσω ενός Γράφου Συζήτησης, ο οποίος απεικονίζει το διάλογο που αναπτύσσεται μεταξύ των εμπλεκομένων στη λήψη μιας απόφασης. Ο βασισμένος σε επιχειρηματολογία διάλογος δομείται και αξιολογείται βάσει κοινά αποδεκτών Πλαισίων Λήψης Αποφάσεων και Μηχανισμών Αξιολόγησης. Οι λειτουργίες του προτεινόμενου εργαλείου, καθώς και η οργάνωση των σχετικών δεδομένων και γνώσης βασίζονται σε ένα πρωτότυπο μοντέλο οντολογίας, το οποίο επίσης αναπτύχθηκε στα πλαίσια της διατριβής. Η συνολική προσέγγιση υποστηρίζει και διευκολύνει τόσο την ομαδική λήψη αποφάσεων, όσο και την απόκτηση, εκμαίευση, επεξεργασία, αποθήκευση και διανομή της οργανωσιακής γνώσης. / Decision making is widely considered as a fundamental organizational activity that comprises a series of knowledge management tasks. Admitting that the quality of a decision depends on the quality of the knowledge used to make it, it has been widely argued that the enhancement of the decision making efficiency and effectiveness is strongly related to the appropriate exploitation of all possible organizational knowledge resources. Taking the above remarks into account, this PhD thesis presents a human-centred, multidisciplinary approach for the integration of Group Decision Support and Organizational Knowledge Management Systems. Towards this end, a conceptual framework that properly interweaves concepts, theories and practices from the Knowledge Management, Argumentation Theory, Decision Making and Multicriteria Decision Aid disciplines is first introduced. Acknowledging that in collaborative settings the decision makers’ active participation in the knowledge sharing processes is of major importance, the proposed approach also introduces a framework for the leveraging of their participation in the related processes. Furthermore, in order to functionally integrate the decision support and knowledge management processes, a software tool that fully supports the above two frameworks was developed. The core component of the proposed tool is a Discourse Graph that serves the visualization of the argumentative discourses taking place between the involved parties. In order to better support decision making, these discourses are structured and evaluated according to a set of commonly accepted Decision Making Frameworks and a set of Scoring Mechanisms that comply with broadly used Multicriteria Decision Aid models and techniques. Being based on a well-defined ontology model, the proposed approach enables the members of a group to collaborate and accomplish a common understanding. Furthermore, it facilitates the capturing of the organizational knowledge in order to augment teamwork in terms of knowledge acquisition, elicitation, processing, storage and sharing, thus further enhancing the decision making quality.
|
Page generated in 0.0389 seconds