Global ETD Search

1	Ανάπτυξη έμπειρου συστήματος λήψης αποφάσεων ναυτιλιακής επιχειρηματικότητας Χαντζάρα, Αικατερίνη 03 March 2008 (has links) Η Τεχνολογία της Γνώσης, και πιο συγκεκριμένα τα Έμπειρα Συστήματα (expert systems) ή αλλιώς Συστήματα Γνώσης (knowledge based systems) αποτελούν τους κλάδους της Τεχνητής Νοημοσύνης που αποδεδειγμένα έχουν προσφέρει τα πιο αξιοσημείωτα αποτελέσματα στην πρακτική τους εφαρμογή. Ως έμπειρα συστήματα θεωρούνται προγράμματα τα οποία επιδεικνύουν νοήµονα συµπεριφορά σε συγκεκριµένους τοµείς και διαδικασίες, ανάλογη με εκείνη ενός ανθρώπου εµπειρογνώµονα µε ειδικότητα στον ίδιο τοµέα. Η λειτουργία των έμπειρων συστημάτων βασίζεται τόσο στην κωδικοποίηση της γνώσης και της συλλογιστικής του ανθρώπου-ειδικού σε έναν εξειδικευμένο τομέα όσο και στο χειρισμό αυτής της γνώσης, με κυριότερους στόχους τη διόρθωση βλαβών, την πρόβλεψη, παρακολούθηση και ερμηνεία καταστάσεων, τη διαμόρφωση και τον έλεγχο συστημάτων. Κατά τις τελευταίες δεκαετίες, η σημαντική πρακτική επιτυχία της εφαρμογής έμπειρων συστημάτων σε εξειδικευμένους τομείς όπως η φαρμακευτική διάγνωση (MYCIN), η ανάλυση γεωλογικών δεδομένων για εντοπισμό πετρελαίου (DIPMETER) και μετάλλων (PROSPECTOR), και η διαμόρφωση υπολογιστικών συστημάτων (XCON), έχουν οδηγήσει σε μία έκρηξη ενδιαφέροντος ως προς τη χρήση έμπειρων συστημάτων σε πολύ ευρύτερο φάσμα εφαρμογών. Το αντικείμενο της παρούσας διπλωματικής εργασίας είναι η ανάπτυξη ενός έμπειρου συστήματος που θα συνάγει στον έλεγχο της κατάστασης λειτουργίας της κύριας μηχανής φορτηγών πλοίων τύπου container, με στόχο την πρόληψη ή έγκαιρη διόρθωση βλαβών και εν τέλει την επίτευξη αποδοτικότερης και ασφαλέστερης λειτουργίας της μηχανής, λιγότερων φθορών και μεγαλύτερου χρόνου ζωής. Η ανάγκη εφαρμογής ενός τέτοιου συστήματος, που θα παρέχει αντικειμενικά και συνεπή συμπεράσματα, από τις εταιρείες διαχείρισης των πλοίων γίνεται όλο και μεγαλύτερη. Όχι μόνο γιατί αποτελεί βασικό μέρος του συστήματος διαχείρισης της ποιότητας (quality management system) των παρεχόμενων υπηρεσιών της εταιρείας προς τους πελάτες – ναυλωτές των πλοίων τύπου container, αλλά κυρίως γιατί μπορεί να αποτελέσει βασικό αρωγό στην προσπάθεια της εταιρείας για συμμόρφωση με διεθνή πρότυπα και κανονισμούς περιβαλλοντικής διαχείρισης (environmental management) για την προστασία εκείνων του στοιχείων του περιβάλλοντος στα οποία έχει επιπτώσεις η δραστηριότητα της εταιρείας. Για τη διαδικασία απόκτησης της γνώσης που θα αποτελέσει την εμπειρογνωμοσύνη του συστήματος ή αλλιώς τη βάση γνώσης του συστήματος (knowledge base) θα χρησιμοποιηθεί η μέθοδος των μη-δομημένων και ημιδομημένων συνεντεύξεων με μηχανολόγους μηχανικούς, εξειδικευμένους σε θέματα μηχανών του συγκεκριμένου τύπου. Τα δεδομένα πάνω στα οποία θα εφαρμοστεί η βάση γνώσης του συστήματος (working memory), ώστε να εξαχθούν τα συμπεράσματα για τη λειτουργία της μηχανής προέρχονται από μετρήσεις πάνω στα όργανα της μηχανής ανά τακτά χρονικά διαστήματα καθώς και δεδομένα-αναφοράς που αντιπροσωπεύουν την ιδανική κατάσταση λειτουργίας της μηχανής. Το κέλυφος του συστήματος (expert system shell) θα αποτελέσει η μηχανή JBoss Rules, η οποία στο επίπεδο του μηχανισμού εξαγωγής συμπερασμάτων (inference engine) υλοποιεί μία αντικειμενοστραφή παραλλαγή του αλγορίθμου Rete, ενώ επιπλέον παρέχει σύστημα διαχείρισης της βάσης γνώσης που καθιστά την ανάπτυξη, τροποποίηση και τον έλεγχό της δυνατό ακόμα και από τους ίδιους τους εμπειρογνώμονες. / Knowledge Technology, and more concretely Expert Systems or Knowledge Based Systems, constitute the sectors of Artificial Intelligence that are proved to have succeeded the most remarkable results in their practical application. Expert Systems are considered to be the programs that demonstrate intelligent behaviour in specific areas and processes, proportional to that of a human expert with speciality in same area. The operation of Expert Systems is based so much on the coding of knowledge and reasoning of a human expert specialized in the specific area, as in the handling of this knowledge, with main objectives the correction of damage, the provision, monitor and interpretation of conditions, the configuration and the inspection of systems. At the last decades, the important practical success of application of Expert Systems in specialised areas such as pharmaceutical diagnosis (MYCIN), the analysis of geological data on location of oil (DIPMETER) and metals (PROSPECTOR), and the configuration of computer systems (XCON), have led to an explosion of interest as for the use of Expert Systems to much wider spectrum of applications. The object of the present thesis is the implementation of an Expert System that will assist in the inspection of the condition of operation of Container Ships Main Engines, aiming at the prevention or on time correction of damage, and finally at achieving more efficient and secure operation of the main engine, less deteriorations and effectively greater life span. The need of such a system, which will provide objective and reliable conclusions, being applied by the shipping management companies becomes even greater. Not only because it constitutes basic part of the quality management system of the provided by the company services to the customers - freighters of the container ships, but mainly because it can constitute basic helper in the company effort to conform with international models and regulations of environmental management on the protection of those aspects of the environment that are affected by the company’s activity. For the process of acquiring the knowledge that will constitute the expertise of the system or differently the knowledge base of the system we will use the method of non-structured and semi-structured interviews with mechanical engineers, specialised on issues regarding the specific engines. The data, on which the working memory of the system will be applied, so that the conclusions on the function of the engine will be exported, emanate from measurements on the different parts of the engine per regular time intervals as well as benchmark data that represent the ideal condition of the engine. The expert system shell will be constituted by the JBoss Rules Engine, which in the level of the inference engine implements an object-oriented variant of the Rete algorithm, while moreover it provides an administration system for the knowledge base that makes its evolution, modification and inspection possible even for the experts themselves. Τεχνητή νοημοσύνη Έμπειρο σύστημα Κανόνες παραγωγής 006.33 Artificial intelligence Expert system Production rules
2	Αλγόριθμοι εξαγωγής κανόνων συσχέτισης και εφαρμογές Μουσουρούλη, Ιωάννα 24 October 2008 (has links) Η παρούσα μεταπτυχιακή εργασία έχει στόχο τη μελέτη προβλημάτων «κρυμμένης γνώσης» από συστήματα και εφαρμογές ηλεκτρονικού εμπορίου (e-commerce) και ηλεκτρονικής μάθησης (e-learning) με κύριο στόχο τη βελτίωση της ποιότητας και της απόδοσης των παρεχόμενων υπηρεσιών προς τους τελικούς χρήστες. Στο πρώτο κεφάλαιο παρουσιάζεται ένα σενάριο για σημασιολογικά εξατομικευμένο e-learning. Ο προτεινόμενος αλγόριθμος βασίζεται σε μια οντολογία (ontology) η οποία βοηθά στη δόμηση και στη διαχείριση του περιεχομένου που σχετίζεται με μια δεδομένη σειρά μαθημάτων, ένα μάθημα ή ένα θεματικό. Η διαδικασία χωρίζεται σε δύο στάδια: στο offline στάδιο το οποίο περιλαμβάνει τις ενέργειες προετοιμασίας των δεδομένων, δημιουργίας της οντολογίας και εξόρυξης από δεδομένα χρήσης (usage mining) και στο online στάδιο το οποίο περιλαμβάνει την εξαγωγή των εξατομικευμένων συστάσεων. Το προτεινόμενο σύστημα σε πρώτη φάση βρίσκει ένα αρχικό σύνολο συστάσεων βασισμένο στην οντολογία του πεδίου και στη συνέχεια χρησιμοποιεί τα frequent itemsets (συχνά εμφανιζόμενα σύνολα στοιχείων) για να το εμπλουτίσει, λαμβάνοντας υπόψη την πλοήγηση άλλων παρόμοιων χρηστών (similar users). Με τον τρόπο αυτό, μειώνεται ο χρόνος που απαιτείται για την ανάλυση όλων των frequent itemsets και των κανόνων συσχέτισης. Η ανάλυση εστιάζεται μόνο σε εκείνα τα σύνολα που προέρχονται από το συνδυασμό της ενεργούς συνόδου (current session) του χρήστη και των συστάσεων της οντολογίας. Αν και η εξατομίκευση απαιτεί αρκετά βήματα επεξεργασίας και ανάλυσης, στη συγκεκριμένη προσέγγιση το εμπόδιο αυτό αποφεύγεται με την εκτέλεση σημαντικού μέρους της διαδικασίας offline. Στο δεύτερο κεφάλαιο μελετάται το πρόβλημα της παραγωγής προτάσεων σε μια εφαρμογή e-commerce. Η προτεινόμενη υβριδική προσέγγιση στοχεύει στην παραγωγή αποτελεσματικών συστάσεων για τους πελάτες ενός online καταστήματος που ενοικιάζει κινηματογραφικές ταινίες. Η γνώση για τους πελάτες και τα προϊόντα προκύπτει από τα δεδομένα χρήσης και τη δομή της οντολογίας σε συνδυασμό με τις εκτιμήσεις-βαθμολογίες των πελατών για τις ταινίες καθώς και την εφαρμογή τεχνικών ταιριάσματος «όμοιων» πελατών. Όταν ένα ή περισσότερα κριτήρια ταιριάσματος ικανοποιούνται, τότε άλλες ταινίες μπορούν να προσδιοριστούν σύμφωνα με το οντολογικό σχήμα που έχουν παρόμοια χαρακτηριστικά με αυτές που ο πελάτης έχει ήδη νοικιάσει. Στην περίπτωση ενός νέου πελάτη όπου το ιστορικό του είναι κενό, αναλύονται πληροφορίες από την αίτηση εγγραφής του ώστε να ταξινομηθεί σε μια συγκεκριμένη κλάση πελατών και να παραχθούν προτάσεις με βάση το οντολογικό σχήμα. Αυτή η ενοποίηση παρέχει πρόσθετη γνώση για τις προτιμήσεις των πελατών και επιτρέπει την παραγωγή επιτυχημένων συστάσεων. Ακόμη και στην περίπτωση του «cold-start problem» όπου δεν είναι διαθέσιμη αρχική πληροφορία για τη συμπεριφορά του πελάτη, η προσέγγιση προβαίνει σε σχετικές συστάσεις. Στο τρίτο κεφάλαιο παρουσιάζεται μία νέα προσέγγιση στο πρόβλημα της δημιουργίας συστάσεων. Οι προηγούμενες προσεγγίσεις δεν λαμβάνουν υπόψη τους τη σειρά με την οποία ο χρήστης προσπελαύνει τα δεδομένα, είτε πρόκειται για e-learning είτε πρόκειται για e-commerce δεδομένα. Στο κεφάλαιο αυτό προτείνεται μία τεχνική η οποία λαμβάνει υπόψη τη σειρά με την οποία ο χρήστης προσπελαύνει τα δεδομένα (ordering). Πιο συγκεκριμένα μελετάται η τεχνική αυτή σε e-commerce συστήματα και καλάθια αγορών. Παρουσιάζεται και αναλύεται η υλοποίηση του προτεινόμενου αλγορίθμου. Επιπλέον γίνεται αξιολόγηση των αποτελεσμάτων του αλγορίθμου σε testing input data τα οποία και δείχνουν την ποιότητα των παραγόμενων συστάσεων. / - Προσωποποίηση Εξόρυξη γνώσης Κανόνες συσχέτισης 025.04 Personalization Data mining Association rules A-priori
3	Η υπηρεσιοστραφής αρχιτεκτονική (Service Oriented Architecture) και η εφαρμογή της για τον σχεδιασμό και ανάπτυξη προσβάσιμων επιχειρησιακών συστημάτων Βότης, Κωνσταντίνος 03 November 2011 (has links) Το αντικείμενο που πραγματεύεται είναι η χρήση τεχνικών και τεχνολογιών υπηρεσιοστραφούς αρχιτεκτονικής και σημασιολογικού ιστού περιλαμβάνοντας κανόνες σημασιολογίας και κατανεμημένου λογισμικού για την κάθετη ολοκλήρωση και ανάπτυξη προσβάσιμων επιχειρησιακών συστημάτων. Επομένως, η παρούσα διατριβή εστιάζει αφενός με την ολοκλήρωση ετερογενών συστημάτων μέσω της χρήσης μεθόδων και τεχνικών σημασιολογικής ολοκλήρωσης και υπηρεσιοστραφούς αρχιτεκτονικής και αφετέρου με την εισαγωγή μιας πρωτότυπης μεθοδολογίας για την ολοκλήρωση προτύπων και τεχνικών προσβασιμότητας προκειμένου να παραχθούν προσβάσιμα διαδικτυακά συστήματα για άτομα με κάθε μορφής αναπηρία. Μέρος της διατριβής αυτή έγινε στα πλαίσια του FP7 Ερευνητικού Προγράμματος με τίτλο ‘Accessibility Assessment Simulation Environment for New Applications Design and Development (ACCESSIBLE) καθώς και στα πλαίσια σχετικών συμβάσεων με την Νομαρχιακή Αυτοδιοίκηση Αχαΐας. / This Phd Thesis presents the usage of Service Oriented Technologies and techniques for the development of an hybrid top-down integrated framework that can be utilized for the integration of heterogeneous systems and the introduction of accessibility features. Taking into account the requirements of the successful deployment of semantic Web technologies regarding off-the-shelf and easy to use semantic SWRL and SPARQL rules and querry tools, the proposed muti-dimensional Framework should be capable of meeting the demands of different users. With the presented Framework, which allows for the selection of suitable matching approaches between well known tools and methodologies, we intend to contribute to the tackling of real world challenges and scenarios, with the aim of ensuring seamless interoperability and integration of different systems. Furthermore, the presented framework facilitates, for the first time, the development of an innovative methodology for the integration of international standards and appropriate techniques, in order to create accessible Web applications and systems. This thesis was partially supported by the European FP7 Research project ACCESSIBLE - Accessibility Assessment Simulation Environment for New Applications Design and Development as well as different contracts with prefecture of Achaia. Ετερογενή συστήματα Οντολογίες 004.654 Service oriented architecture Heterogenous systems Semantic rules Ontologies
4	Υπολογιστικά ζητήματα σε συμβιβαστικές ψηφοφορίες / Approximation algorithms and mechanism design for minimax approval voting Καλαϊτζής, Δημήτριος 11 January 2011 (has links) Στην εργασία αυτή ασχολούμαστε με θέματα κοινωνικής επιλογής και πιο συγκεκριμένα με συμβιβαστικές ψηφοφορίες στις οποίες κάθε ψηφοφόρος ψηφίζει ένα (πιθανόν κενό) σύνολο υποψηφίων και το αποτέλεσμα είναι ένα σύνολο υποψηφίων πλήθους k, για δεδομένο k (π.χ. εκλογή επιτροπής). Εξετάζουμε τον κανόνα minimax σε συμβιβαστικές ψηφοφορίες, στις οποίες το αποτέλεσμα αντιπροσωπεύει ένα συμβιβασμό μεταξύ των προτιμήσεων των ψηφοφόρων, με την έννοια ότι η μέγιστη απόσταση μεταξύ των προτιμήσεων οποιουδήποτε ψηφοφόρου και του αποτελέσματος είναι όσο το δυνατό μικρότερη. Αυτός ο κανόνας έχει δύο μειονεκτήματα. Πρώτον, ο υπολογισμός του αποτελέσματος που ελαχιστοποιεί τη μέγιστη απόσταση από κάθε ψηφοφόρο είναι ένα υπολογιστικά δύσκολο πρόβλημα και δεύτερον, οποιοσδήποτε αλγόριθμος που πάντα επιστρέφει ένα τέτοιο αποτέλεσμα, δίνει στους ψηφοφόρους κίνητρο να πουν ψέματα για την πραγματική τους προτίμηση, με σκοπό να βελτιώσουν την απόσταση τους από το τελικό αποτέλεσμα. Για να ξεπεράσουμε αυτά τα μειονεκτήματα χρησιμοποιούμε προσεγγιστικούς αλγορίθμους, δηλαδή αλγορίθμους που παράγουν αποτέλεσμα που αποδεδειγμένα προσεγγίζει την minimax απόσταση για κάθε δοσμένο στιγμιότυπο. Τέτοιοι αλγόριθμοι μπορούν να χρησιμοποιηθούν σαν εναλλακτικοί κανόνες ψηφοφορίας. Παρουσιάζουμε ένα 2-προσεγγιστικό αλγόριθμο πολυωνυμικού χρόνου, ο οποίος υπολογίζει το αποτέλεσμα στρογγυλοποιώντας ντετερμινιστικά τη λύση του χαλαρωμένου γραμμικού προγράμματος μέσω του οποίου εκφράζουμε το πρόβλημά μας. Ο καλύτερος προηγούμενος προσεγγιστικός αλγόριθμος επιτύγχανε λόγο απόδοσης 3 και συνεπώς το παραπάνω αποτέλεσμα αποτελεί σημαντική βελτίωση. Επιπλέον ασχολούμαστε με προσεγγιστικούς αλγορίθμους που είναι ανθεκτικοί σε χειραγώγηση είτε από μεμονωμένους ψηφοφόρους είτε από ομάδες ψηφοφόρων. Τέτοιοι αλγόριθμοι δεν προσφέρουν κίνητρο στους ψηφοφόρους να δηλώσουν ψευδώς τις προτιμήσεις τους με σκοπό να βελτιώσουν την απόστασή τους από το τελικό αποτέλεσμα. Μια τέτοια μελέτη εντάσσεται στα πλαίσια της έρευνας που γίνεται τα τελευταία χρόνια πάνω στο σχεδιασμό προσεγγιστικών αλγοριθμικών μηχανισμών χωρίς χρήματα. Συμπληρώνουμε προηγούμενα αποτελέσματα με νέα πάνω και κάτω φράγματα για strategyproof και group-strategyproof αλγορίθμους. / We consider approval voting elections in which each voter votes for a (possibly empty) set of candidates and the outcome consists of a set of k candidates for some fixed k, e.g., committee elections. We are interested in the minimax approval voting rule in which the outcome represents a compromise among the preferences of the voters, in the sense that the maximum distance between the preference of any voter and the outcome is as small as possible. This voting rule has two main drawbacks. First, computing an outcome that minimizes the maximum distance is computationally hard. Furthermore, any algorithm that always returns such an outcome provides incentives to voters to misreport their true preferences. In order to circumvent these drawbacks, we consider approximation algorithms, i.e., algorithms that produce an outcome that approximates the minimax distance for any given instance. Such algorithms can be considered as alternative voting rules. We present a polynomial-time 2-approximation algorithm that uses a natural linear programming relaxation for the underlying optimization problem and deterministically rounds the fractional solution in order to compute the outcome; this result improves upon the previously best known algorithm that has an approximation ratio of 3. We are furthermore interested in approximation algorithms that are resistant to manipulation by (coalitions of) voters, i.e., algorithms that do not motivate voters to misreport their true preferences in order to improve their distance from the outcome. This study falls within the recently initiated line of research on approximate mechanism design without money. We complement previous results in the literature with new upper and lower bounds on strategyproof and group-strategyproof algorithms. Κανόνες ψηφοφορίας 324.650 285 Approval voting Approximation algorithms Strategy proofness Voting rules
5	Διαχωριστική ανάλυση, ταξινόμηση και ομαδοποίηση δεδομένων με εφαρμογές στο SPSS Λούκινα, Βίκυ 12 April 2013 (has links) Αρχικά, στο πρώτο μέρος της διπλωματικής εργασίας μελετώνται οι πολυδιάστατες στατιστικές τεχνικές της Διαχωριστικής Ανάλυσης και της Ταξινόμησης δεδομένων, με σκοπό το διαχωρισμό διαφορετικών ομάδων αντικειμένων και τη κατάταξη νέων αντικειμένων σε προκαθορισμένο σύνολο ομάδων με τη χρήση ενός κανόνα, αντίστοιχα. Η διαδικασία κατασκευής και αξιολόγησης των κανόνων Ταξινόμησης βασίζεται στη κανονικότητα των δεδομένων. Ενώ ο σχηματισμός των γραμμικών συναρτήσεων Fisher για το διαχωρισμό των δεδομένων, υποθέτει ίσους πίνακες διασποράς. Στη συνέχεια παρατίθεται παράδειγμα εφαρμογής των δύο παραπάνω στατιστικών τεχνικών μέσω του στατιστικού πακέτου SPSS. Στο δεύτερο μέρος, εξετάζεται η διερευνητική τεχνική της Ομαδοποίησης δεδομένων, όπου στοχεύει στην οργάνωση των τιμών των αντικειμένων σε συστάδες. Έτσι ώστε να επιτυγχάνεται η μέγιστη ομοιότητα μεταξύ των παρατηρήσεων μέσα σε κάθε ομάδα και η μέγιστη ανομοιότητα μεταξύ των συστάδων, όπου αρχικά θεωρούνται άγνωστες σε αντίθεση με τη Διαχωριστικής Ανάλυση και της Ταξινόμηση όπου θεωρούνται γνωστές. Ο πιο δημοφιλής τρόπος για τον υπολογισμό της ομοιότητας είναι η απόσταση, όμως η εφαρμογή των αλγορίθμων συσταδοποίησης είναι πιο αποδοτικοί για την ομαδοποίηση των δεδομένων. Τέλος, εφόσον οι αλγόριθμοι ομαδοποίησης χωριστούν σε δυο κατηγορίες επιδιώκεται η σύγκριση μεταξύ τους, ως προς την αποτελεσματικότητα τους, με τη χρήση του στατιστικού πακέτου SPSS. / - Διαχωρισμός Ταξινόμηση Κανόνες κατάταξης Ρυθμός σφάλματος Συνάρτηση Fisher 519.53 Regression Classification Clustering algorithms
6	Text mining : μια νέα προτεινόμενη μέθοδος με χρήση κανόνων συσχέτισης Νασίκας, Ιωάννης 14 September 2007 (has links) Η εξόρυξη κειμένου (text mining) είναι ένας νέος ερευνητικός τομέας που προσπαθεί να επιλύσει το πρόβλημα της υπερφόρτωσης πληροφοριών με τη χρησιμοποίηση των τεχνικών από την εξόρυξη από δεδομένα (data mining), την μηχανική μάθηση (machine learning), την επεξεργασία φυσικής γλώσσας (natural language processing), την ανάκτηση πληροφορίας (information retrieval), την εξαγωγή πληροφορίας (information extraction) και τη διαχείριση γνώσης (knowledge management). Στο πρώτο μέρος αυτής της διπλωματικής εργασίας αναφερόμαστε αναλυτικά στον καινούριο αυτό ερευνητικό τομέα, διαχωρίζοντάς τον από άλλους παρεμφερείς τομείς. Ο κύριος στόχος του text mining είναι να βοηθήσει τους χρήστες να εξαγάγουν πληροφορίες από μεγάλους κειμενικούς πόρους. Δύο από τους σημαντικότερους στόχους είναι η κατηγοριοποίηση και η ομαδοποίηση εγγράφων. Υπάρχει μια αυξανόμενη ανησυχία για την ομαδοποίηση κειμένων λόγω της εκρηκτικής αύξησης του WWW, των ψηφιακών βιβλιοθηκών, των ιατρικών δεδομένων, κ.λ.π.. Τα κρισιμότερα προβλήματα για την ομαδοποίηση εγγράφων είναι η υψηλή διαστατικότητα του κειμένου φυσικής γλώσσας και η επιλογή των χαρακτηριστικών γνωρισμάτων που χρησιμοποιούνται για να αντιπροσωπεύσουν μια περιοχή. Κατά συνέπεια, ένας αυξανόμενος αριθμός ερευνητών έχει επικεντρωθεί στην έρευνα για τη σχετική αποτελεσματικότητα των διάφορων τεχνικών μείωσης διάστασης και της σχέσης μεταξύ των επιλεγμένων χαρακτηριστικών γνωρισμάτων που χρησιμοποιούνται για να αντιπροσωπεύσουν το κείμενο και την ποιότητα της τελικής ομαδοποίησης. Υπάρχουν δύο σημαντικοί τύποι τεχνικών μείωσης διάστασης: οι μέθοδοι «μετασχηματισμού» και οι μέθοδοι «επιλογής». Στο δεύτερο μέρος αυτής τη διπλωματικής εργασίας, παρουσιάζουμε μια καινούρια μέθοδο «επιλογής» που προσπαθεί να αντιμετωπίσει αυτά τα προβλήματα. Η προτεινόμενη μεθοδολογία είναι βασισμένη στους κανόνες συσχέτισης (Association Rule Mining). Παρουσιάζουμε επίσης και αναλύουμε τις εμπειρικές δοκιμές, οι οποίες καταδεικνύουν την απόδοση της προτεινόμενης μεθοδολογίας. Μέσα από τα αποτελέσματα που λάβαμε διαπιστώσαμε ότι η διάσταση μειώθηκε. Όσο όμως προσπαθούσαμε, βάσει της μεθοδολογίας μας, να την μειώσουμε περισσότερο τόσο χανόταν η ακρίβεια στα αποτελέσματα. Έγινε μια προσπάθεια βελτίωσης των αποτελεσμάτων μέσα από μια διαφορετική επιλογή των χαρακτηριστικών γνωρισμάτων. Τέτοιες προσπάθειες συνεχίζονται και σήμερα. Σημαντική επίσης στην ομαδοποίηση των κειμένων είναι και η επιλογή του μέτρου ομοιότητας. Στην παρούσα διπλωματική αναφέρουμε διάφορα τέτοια μέτρα που υπάρχουν στην βιβλιογραφία, ενώ σε σχετική εφαρμογή κάνουμε σύγκριση αυτών. Η εργασία συνολικά αποτελείται από 7 κεφάλαια: Στο πρώτο κεφάλαιο γίνεται μια σύντομη ανασκόπηση σχετικά με το text mining. Στο δεύτερο κεφάλαιο περιγράφονται οι στόχοι, οι μέθοδοι και τα εργαλεία που χρησιμοποιεί η εξόρυξη κειμένου. Στο τρίτο κεφάλαιο παρουσιάζεται ο τρόπος αναπαράστασης των κειμένων, τα διάφορα μέτρα ομοιότητας καθώς και μια εφαρμογή σύγκρισης αυτών. Στο τέταρτο κεφάλαιο αναφέρουμε τις διάφορες μεθόδους μείωσης της διάστασης και στο πέμπτο παρουσιάζουμε την δικιά μας μεθοδολογία για το πρόβλημα. Έπειτα στο έκτο κεφάλαιο εφαρμόζουμε την μεθοδολογία μας σε πειραματικά δεδομένα. Η εργασία κλείνει με τα συμπεράσματα μας και κατευθύνσεις για μελλοντική έρευνα. / Text mining is a new searching field which tries to solve the problem of information overloading by using techniques from data mining, natural language processing, information retrieval, information extraction and knowledge management. At the first part of this diplomatic paper we detailed refer to this new searching field, separated it from all the others relative fields. The main target of text mining is helping users to extract information from big text resources. Two of the most important tasks are document categorization and document clustering. There is an increasing concern in document clustering due to explosive growth of the WWW, digital libraries, technical documentation, medical data, etc. The most critical problems for document clustering are the high dimensionality of the natural language text and the choice of features used to represent a domain. Thus, an increasing number of researchers have concentrated on the investigation of the relative effectiveness of various dimension reduction techniques and of the relationship between the selected features used to represent text and the quality of the final clustering. There are two important types of techniques that reduce dimension: transformation methods and selection methods. At the second part of this diplomatic paper we represent a new selection method trying to tackle these problems. The proposed methodology is based on Association Rule Mining. We also present and analyze empirical tests, which demonstrate the performance of the proposed methodology. Through the results that we obtained we found out that dimension has been reduced. However, the more we have been trying to reduce it, according to methodology, the bigger loss of precision we have been taking. There has been an effort for improving the results through a different feature selection. That kind of efforts are taking place even today. In document clustering is also important the choice of the similarity measure. In this diplomatic paper we refer several of these measures that exist to bibliography and we compare them in relative application. The paper totally has seven chapters. At the first chapter there is a brief review about text mining. At the second chapter we describe the tasks, the methods and the tools are used in text mining. At the third chapter we give the way of document representation, the various similarity measures and an application to compare them. At the fourth chapter we refer different kind of methods that reduce dimensions and at the fifth chapter we represent our own methodology for the problem. After that at the sixth chapter we apply our methodology to experimental data. The paper ends up with our conclusions and directions for future research. Εξόρυξη κειμένου Ανάκτηση πληροφορίας Στάθμιση όρων Ομαδοποίηση κειμένων Κανόνες συσχέτισης 006.312 Text mining Information retrieval Feature selection Term weighting Text clustering Association rules
7	Υλοποίηση εφαρμογής εξόρυξης δεδομένων σε αποτελέσματα εντοπισμού της θέσης κινητού χρήστη και αξιοποίηση της πληροφορίας σε M-commerce εφαρμογές Μεττούρης, Χρίστος 07 November 2008 (has links) Στην παρούσα διπλωματική υλοποιείται εφαρμογή, η οποία χρησιμοποιεί τεχνικές εξόρυξης δεδομένων σε αποτελέσματα εντοπισμού της θέσης κινητού χρήστη για παραγωγή πληροφορίας σε μορφή κανόνων συσχέτισης, ενώ παράλληλα γίνεται αξιοποίηση των αποτελεσμάτων εντοπισμού της θέσης σε M-commerce εφαρμογές. Η εφαρμογή υλοποιήθηκε για χρήση της σε μια υπεραγορά, στην οποία οι πελάτες θα ανιχνεύονται στα διάφορα τμήματά της, κατά την πραγματοποίηση των αγορών τους. Από τα αποτελέσματα εντοπισμού της θέσης του χρήστη, παράγονται κανόνες συσχέτισης, οι οποίοι αφορούν τις ανιχνεύσεις των πελατών στα τμήματα αυτά. Επίσης παρουσιάζεται η πορεία των χρηστών στην υπεραγορά, ενώ τελικά αποστέλονται σε αυτούς M-commerce σχετικά μηνύματα. / In this thesis, we present an application that utilizes Data Mining techniques on data collected by a user positioning application, to extract useful information in the form of association Rules. Furthermore, user positioning results are being used for M-commerce purposes. The application is developed to be used by a supermarket, in which all customers are detected, so that their location becomes known. By using the positioning results, association rules are extracted. Apart from the extraction of association rules, the application presents each customer’s route in the supermarket. Finally, M-commerce related messages are being sent to the customers, according to their preferences, concerning the areas of the supermarket. Εξόρυξη δεδομένων Κανόνες συσχέτισης Κινητό εμπόριο 005.74 Data mining Association rules User positioning Mobile commerce Mobile advertising
8	Ανάπτυξη και υλοποίηση δικτυακής πύλης αναζήτησης και εύρεσης βιβλίων βασισμένη σε τεχνολογίες Web 2.0 και σε οντολογίες με χαρακτήρα εξατομίκευσης Καλού, Αικατερίνη 13 July 2010 (has links) Στη παρούσα διπλωματική εργασία, πραγματοποιείται μία ποιοτική επισκόπηση του όρου Σημαντικός Ιστός και των τεχνολογιών αναπαράστασης γνώσης και συμπερασμού που υπόκεινται σε αυτόν, όπως οντολογίες, μέθοδοι και εργαλεία ανάπτυξης οντολογιών, γλώσσες αναπαράστασης οντολογιών καθώς και η επέκταση της εκφραστικότητας των οντολογιών με την προσθήκη κανόνων. Επίσης, γίνεται εκτενής αναφορά σε μία άλλη εξελικτική τάση, που κυριαρχεί στο χώρο του Web, το Web 2.0. Στα πλαίσια του Web 2.0, αναλύονται έννοιες όπως mashups και Web APIs. Ειδικά για την έννοια των Web APIs, γίνεται αναφορά και ανάλυση συγκεκριμένων APIs, όπως αυτά της Amazon και του EBay. Οι έννοιες του Σημαντικού Ιστού και του Web 2.0 παρουσιάζονται πολλές φόρες ως ανταγωνιστικές για το μέλλον του Ιστού. Εντούτοις, γίνεται σαφές όλο και περισσότερο ότι οι δύο αυτές έννοιες είναι συμπληρωματικές. Στα πλαίσια της διπλωματικής εργασίας, αναπτύχθηκε μια εφαρμογή η οποία θα συνδυάζει αυτές τις δύο κυρίαρχες τεχνολογικές τάσεις. Πιο συγκεκριμένα, η εφαρμογή αποτελεί ένα πλαίσιο αναζήτησης βιβλίων από το Amazon και το Half eBay με χαρακτήρα εξατομίκευσης. Για την εφαρμογή, κάθε χρήστης αποτελεί μία αυτόνομη οντότητα. Συνεπώς, το περιεχόμενο της εφαρμογής προσαρμόζεται ανάλογα με το προφίλ του χρήστη κάθε φορά. Η υλοποίηση της εφαρμογής στηρίζεται αποκλειστικά στην ανάπτυξη οντολογιών, στη συγγραφή κανόνων (για την εξατομίκευση), στη δημιουργία ενός mashup και στα Web APIs. Τέλος, να σημειωθεί ότι η εφαρμογή στηρίζεται σε μία κατανεμημένη αρχιτεκτονική 3-επιπέδων. / In the present diploma thesis, one qualitative review is realised for the concepts of Semantic Web and of technologies of representation of knowledge and reasoning that being in this, such as ontologies, methods and tools for ontology development, representation languages of ontologies as well as the extension of expressiveness of ontologies with the addition of rules. Also, it becomes an extensive report in an other evolutionary tendency, that dominates in the space of Web, Web 2.0. In the scope of Web 2.0, concepts such as mashups and Web APIs are analyzed. Specifically for the concept of Web APIs, we make a report and an analysis of concrete APIs, as those of Amazon and EBay. The concepts of Semantic Web and Web 2.0 are presented a lot of times as competitive for the future of Web. Nevertheless, it becomes more and more obvious that these two concepts are complemental. In the scope of these diploma thesis, was developed an application which combines these two dominant technological tendencies. In particular, the application constitutes a framework of searching books from Amazon and Half eBay with a personalised character. For the application, each user constitutes an autonomous entity. Consequently, the content of application is adapted depending on the profile of user each time. The implementation of application is supported exclusively in the ontology development, in the writing of rules (for the personalisation), in the creation of a mashup and in Web APIs. Finally, it is marked that the application is supported in a distributed 3-tier architecture. Σημαντικός ιστός Αναπαράσταση γνώσης Οντολογίες Κανόνες Εξατομίκευση 005.72 Semantic web Knowledge representation Ontologies Rules SWRL Personalisation Web 2.0 Mashups Web APIs Amazon API eBay API OWL 3-tier architecture

Search results