Spelling suggestions: "subject:"εξόρυξη"" "subject:"εξέλιξης""
1 |
Ανάλυση οικονομικών δεδομένων με χρήση τεχνικών εξόρυξηςΖαβουδάκης, Γεώργιος 19 May 2015 (has links)
Μετά την μεγάλη έξαρση της τεχνολογικής ανάπτυξης ο όγκος των δεδομένων-πληροφοριών σήμερα είναι τεράστιος και όσο περνάνε τα χρόνια θα μεγαλώνει ακόμα περισσότερο. Είναι βέβαιο λοιπόν ότι ζούμε στην κοινωνία της πληροφορίας, όπου η μετατροπή των δεδομένων σε πληροφορία απαιτείται να οδηγεί στη μετατροπή της πληροφορίας σε γνώση. Έτσι δημιουργήθηκε η ανάγκη επεξεργασίας αυτών των δεδομένων και η μετατροπή τους σε χρήσιμες πληροφορίες που θα βοηθήσουν στην λήψη αποφάσεων. Οι τεχνικές εξόρυξης αποτελούν ένα σημαντικό εργαλείο που μας βοηθά να αντλήσουμε γνώση από μεγάλους όγκους δεδομένων και αν σκεφτούμε ότι όλα αυτά μπορούν να συνδυαστούν με στατιστικές μεθόδους τότε εύκολα μπορούμε να κάνουμε ανάκτηση πληροφορίας. Η συνύπαρξη ετερόκλητων επιστημονικών πεδίων όπως της στατιστικής, της μηχανικής εκμάθησης, της θεωρίας της πληροφορίας και των υπολογιστικών διαδικασιών, έχει δημιουργήσει μια νέα επιστήμη με δυναμικά εργαλεία.
Η επιστήμη αυτή καλείται «Εξόρυξη Δεδομένων (ΕΔ)» (Data Mining) και είναι μέρος της διαδικασίας «Ανακάλυψης Γνώσης από Βάσεις Δεδομένων» (Knowledge Discovery in Databases - KDD). Τα εργαλεία της ΕΔ είναι οι αλγόριθμοί της, οι οποίοι επιχειρούν να βρουν χρήσιμα και κατανοητά πρότυπα στα δεδομένα.
Κύριος στόχος της παρούσας Διπλωματικής Εργασίας είναι η συγκέντρωση βασικών αλγορίθμων και μεθόδων που επιλέγουν και καθαρίζουν δεδομένα, αναγνωρίζουν πρότυπα, βελτιστοποιούν ένα σύστημα διαχείρισης και συσταδοποιούν δεδομένα. Θα δώσουμε έμφαση σε αλγορίθμους που είναι κατάλληλοι για χρονικά οικονομικά δεδομένα.
Εκτός από την καταγραφή των μεθόδων και εφαρμογών της Εξόρυξης δεδομένων και της KDD, θα εφαρμόσουμε τεχνικές συσταδοποίησης σε ένα σύνολο δεδομένων, το οποίο περιλαμβάνει οικονομικά δεδομένα από τρεις διαφορετικές κατηγορίες: τιμές των μετοχών υψηλής κεφαλαιοποίησης του δείκτη Nasdaq , η διαχρονική ισοτιμία Ευρώ/δολλαρίου και η διαχρονική διαμόρφωση των τιμών του πετρελαίου/ανα βαρέλι στις διεθνείς αγορές.Η εργασία αυτή χωρίζεται σε πέντε κεφάλαια: Εισαγωγή, θεωρητικό υπόβαθρο, μεθοδολογία, υλοποίηση πρακτικής εφαρμογής και συμπεράσματα. Στο κεφάλαιο 1 κάνουμε μια πρώτη γνωριμία με την Εξόρυξη γνώσης από Δεδομένα ,στο κεφάλαιο 2 γίνεται η βιβλιογραφική ανασκόπηση και παρουσιάζεται αναλυτικά όλο το θεωρητικό υπόβαθρο των μεθόδων που θα χρησιμοποιηθούν. Στο κεφάλαιο 3 παρουσιάζονται οι μεθοδολογίες (μέθοδοι εξόρυξης για συσταδοποίηση, κατηγοριοποίηση και πρόβλεψη) που χρησιμοποιήθηκαν για τη μελέτη, ενώ στο επόμενο κεφάλαιο παρουσιάζεται μια πρακτική εφαρμογή των παραπάνω ως αποτελέσματα των μεθοδολογιών αυτών. Και τέλος, στο κεφάλαιο 5 παρουσιάζονται κάποια συμπεράσματα που μπορούμε να εξάγουμε από την υλοποίηση της πρακτικής εφαρμογής.
Η εργασία αυτή έχει ως στόχο να αναδείξει την σχέση που μπορεί να υπάρξει ανάμεσα στην Οικονομική επιστήμη και σε αυτήν της Τεχνητής Νοημοσύνης, εστιάζοντας κυρίως στο κατά πόσο η δεύτερη μπορεί να δώσει λύσεις σε καίρια ζητήματα, προβλήματα αλλά και προκλήσεις που παρουσιάζονται στο σύγχρονο οικονομικό περιβάλλον. Το μέσο για την εκπλήρωση αυτού του στόχου είναι οι τεχνικές Data Mining, που στα ελληνικά σαν όρος, αποδίδονται ως Τεχνικές Εξόρυξης Δεδομένων. Για την υλοποίηση της εργασίας αυτής, σαν πηγές χρησιμοποιήθηκαν πολλά επιστημονικά βιβλία που σχετίζονται με την Οικονομία, τα Χρηματοοικονομικά, την Τεχνητή Νοημοσύνη και τις μεθόδους Data Mining, τις Πολυκριτήριες Τεχνικές Ταξινόμησης αλλά και την Στατιστική. Το αποτέλεσμα από τον συνδυασμό των παραπάνω θα παρουσιαστεί στις σελίδες που θα ακολουθήσουν. / After the great upsurge of technological development the volume of currently-information data is huge and as the years pass will grow even more. It is certain, therefore, that we live in the information society, where the transformation of data into information needed to drive the conversion of information into knowledge. This created the need to process this data and turn them into useful information that will help in decision making. The mining techniques are an important tool that helps us to draw knowledge from large volumes of data and if we think that all this can be combined with statistical methods then we can easily retrieve information. The disparate disciplines such as statistics, machine learning, information theory and computational procedures, has created a new science with powerful tools.
This science is called "Data Mining (DM)» and is part of the 'Knowledge Discovery from Databases ». The tools of DM are the algorithms that are trying to find useful and understandable patterns in data.
The main objective of this thesis is the concentration of basic algorithms and methods chosen and cleanse data, recognize patterns, optimize a management system and clustering data. Will emphasize algorithms that are suitable for time economic data.
Besides recording the methods and applications of data mining and KDD, we apply clustering techniques to a data set, which includes financial data from three different categories: price-cap stock index Nasdaq, the timeless rate Euro / dollar and the configuration of oil prices / per barrel in international markets.
This paper is divided into five chapters: Introduction, theoretical background, methodology, implementation of practical application and conclusions. In Chapter 1, we make a first acquaintance with the Mining Data, in Chapter 2 is the literature review and presented in detail all the theoretical background of the methods used. Methodologies presented in Chapter 3 (mining methods for clustering, classification and prediction) used for the study, while the next chapter presents a practical application of the above as a result of these methodologies. Finally, Chapter 5 presents some conclusions can be drawn from the implementation of the practice.This paper aims to highlight the relationship that can exist between economic science and that of Artificial Intelligence, focusing mainly on whether the latter can provide solutions to key issues, problems and challenges presented in today's economic environment . The means to achieve this objective are the technical Data Mining, which in Greek as term, rendered as Technical Data Mining. For the realization of this work, as sources used many scientific books related to the Economy, Finance, Artificial Intelligence and methods Data Mining, the Multicriteria Classification Techniques and Statistics. The result from the combination of the above will be presented in the pages that follow.
|
2 |
Εφαρμογή τεχνικών εξόρυξης γνώσης σε οικονομικά δεδομέναΡαυτόπουλος, Γιώργος 04 December 2012 (has links)
Τα συστήματα υποστήριξης αποφάσεων αποτελούν το πιο σημαντικό κομμάτι στην υποδομή ενός επιχειρησιακού πληροφοριακού συστήματος,
επειδή δίνουν τη δυνατότητα στις εταιρίες να μετατρέψουν μεγάλες ποσότητες επιχειρηματικών πληροφοριών σε επικερδή αποτελέσματα.
Ο κύριος σκοπός της παρούσας διπλωματικής εργασίας είναι να μελετήσουμε με ποιο τρόπο μπορούν να χρησιμοποιηθούν αλγόριθμοι
Εξόρυξης Γνώσης (Data Mining) για την έγκριση τραπεζικών προϊόντων βασιζόμενη σε στοιχεία των αιτούντων.
Ειδικότερα, στην εργασία αυτή προσπαθούμε να αποδείξουμε την αποτελεσματικότητα των εργαλείων εξόρυξης γνώσης για την έγκριση
πιστωτικών καρτών. Αρχικά γίνεται παρουσίαση και θεωρητική μελέτη των μεθόδων της Μηχανικής Μάθησης, που διέπουν την εξόρυξη
γνώσης από δεδομένα. Στην συνέχεια η εργασία επικεντρώνεται στη μοντελοποίηση του προβλήματος και στην ανάδειξη των ιδιαιτεροτήτων του. Επόμενος στόχος είναι να υλοποιήσουμε και να αξιολογήσουμε
την συμπεριφορά των αλγορίθμων Μηχανικής Μάθησης σε εφαρμογές έγκρισης πιστωτικών καρτών. Συγκεκριμένα θα συγκριθούν γνωστοί
και αντιπροσωπευτικοί αλγόριθμοι των σημαντικότερων τεχνικών
κατηγοριοποίησης, όπως είναι οι Naïve Bayes, ο C4.5, οι Μηχανές Διανυσμάτων Υποστήριξης (SVMs). Και στο τέλος θα κατασκευαστεί
πρωτότυπο λογισμικό εργαλείο υποστήριξης για την έγκριση πιστωτικών καρτών. / Decision support systems are the most important piece of the infrastructure of an information system because they enable companies to convert large volumes of information into profitable business results.
The main purpose of this thesis is to study how data mining algorithms can be used for the approval of banking products based on data of the applicants.
Specifically, in this work we try to prove the effectiveness of mining tools for approval credit cards. Initially we present a theoretical study of machine learning methods. Then the thesis focuses on modeling the problem. The next goal was to implement and evaluate the behavior of machine learning algorithms in credit card approval. We compared known and representative algorithms of the most important classification algorithms, such as Naïve Bayes, the C4.5, Support Vector Machines are (SVMs). Finally, we built a prototype software tool support for the approval of credit cards.
|
3 |
Novel frequent itemset hiding techniques and their evaluation / Σύγχρονες μέθοδοι τεχνικών απόκρυψης συχνών στοιχειοσυνόλων και αξιολόγησή τουςΚαγκλής, Βασίλειος 20 May 2015 (has links)
Advances in data collection and data storage technologies have given way to the establishment of transactional databases among companies and organizations, as they allow enormous volumes of data to be stored efficiently. Most of the times, these vast amounts of data cannot be used as they are. A data processing should first take place, so as to extract the useful knowledge. After the useful knowledge is mined, it can be used in several ways depending on the nature of the data.
Quite often, companies and organizations are willing to share data for the sake of mutual benefit. However, these benefits come with several risks, as problems with privacy might arise, as a result of this sharing. Sensitive data, along with sensitive knowledge inferred from these data, must be protected from unintentional exposure to unauthorized parties. One form of the inferred knowledge is frequent patterns, which are discovered during the process of mining the frequent itemsets from transactional databases. The problem of protecting such patterns is known as the frequent itemset hiding problem.
In this thesis, we review several techniques for protecting sensitive frequent patterns in the form of frequent itemsets. After presenting a wide variety of techniques in detail, we propose a novel approach towards solving this problem. The proposed method is an approach that combines heuristics with linear-programming. We evaluate the proposed method on real datasets. For the evaluation, a number of performance metrics are presented. Finally, we compare the results of the newly proposed method with those of other state-of-the-art approaches. / Η ραγδαία εξέλιξη των τεχνολογιών συλλογής και αποθήκευσης δεδομένων οδήγησε στην καθιέρωση των βάσεων δεδομένων συναλλαγών σε οργανισμούς και εταιρείες, καθώς επιτρέπουν την αποδοτική αποθήκευση τεράστιου όγκου δεδομένων. Τις περισσότερες φορές όμως, αυτός ο τεράστιος όγκος δεδομένων δεν μπορεί να χρησιμοποιηθεί ως έχει. Μια πρώτη επεξεργασία των δεδομένων πρέπει να γίνει, ώστε να εξαχθεί η χρήσιμη πληροφορία. Ανάλογα με τη φύση των δεδομένων, αυτή η χρήσιμη πληροφορία μπορεί να χρησιμοποιηθεί στη συνέχεια αναλόγως.
Αρκετά συχνά, οι εταιρείες και οι οργανισμοί είναι πρόθυμοι να μοιραστούν τα δεδομένα μεταξύ τους με στόχο το κοινό τους όφελος. Ωστόσο, αυτά τα οφέλη συνοδεύονται με διάφορους κινδύνους, καθώς ενδέχεται να προκύψουν προβλήματα ιδιωτικής φύσης, ως αποτέλεσμα αυτής της κοινής χρήσης των δεδομένων. Ευαίσθητα δεδομένα, μαζί με την ευαίσθητη γνώση που μπορεί να προκύψει από αυτά, πρέπει να προστατευτούν από την ακούσια έκθεση σε μη εξουσιοδοτημένους τρίτους. Μια μορφή της εξαχθείσας γνώσης είναι τα συχνά μοτίβα, που ανακαλύφθηκαν κατά την εξόρυξη συχνών στοιχειοσυνόλων από βάσεις δεδομένων συναλλαγών. Το πρόβλημα της προστασίας συχνών μοτίβων τέτοιας μορφής είναι γνωστό ως το πρόβλημα απόκρυψης συχνών στοιχειοσυνόλων.
Στην παρούσα διπλωματική εργασία, εξετάζουμε διάφορες τεχνικές για την προστασία ευαίσθητων συχνών μοτίβων, υπό τη μορφή συχνών στοιχειοσυνόλων. Αφού παρουσιάσουμε λεπτομερώς μια ευρεία ποικιλία τεχνικών απόκρυψης, προτείνουμε μια νέα προσέγγιση για την επίλυση αυτού του προβλήματος. Η προτεινόμενη μέθοδος είναι μια προσέγγιση που συνδυάζει ευρετικές μεθόδους με γραμμικό προγραμματισμό. Για την αξιολόγηση της προτεινόμενης μεθόδου χρησιμοποιούμε πραγματικά δεδομένα. Για τον σκοπό αυτό, παρουσιάζουμε επίσης και μια σειρά από μετρικές αξιολόγησης. Τέλος, συγκρίνουμε τα αποτελέσματα της νέας προτεινόμενης μεθόδου με άλλες κορυφαίες προσεγγίσεις.
|
4 |
Διάγνωση, πρόγνωση και υποστήριξη θεραπευτικής αγωγής κακοηθών λεμφωμάτων με χρήση τεχνητής νοημοσύνηςΔράκος, Ιωάννης 13 July 2010 (has links)
Η παρούσα διδακτορική διατριβή έχει ως στόχο τη δημιουργία ενός αποδοτικού μοντέλου για το Λειτουργικό Συνδυασμό Βιο-Ιατρικών δεδομένων (BioMedical data integration).
Ξεκινώντας από τη σχεδιαστική ανάλυση της ιατρικής γνώσης και των προβλημάτων που προκύπτουν από τον τρόπο παραγωγής των ιατρικών δεδομένων, προχωρεί στην επίλυση των επιμέρους θεμάτων Λειτουργικού Συνδυασμού εντός ενός συγκεκριμένου ιατρικού πεδίου και καταλήγει στον ολοκληρωμένο Λειτουργικό Συνδυασμό ιατρικών δεδομένων προερχόμενων από διαφορετικές πηγές και πεδία γνώσης.
Συνεχίζει με τη σχεδίαση ενός μοντέλου βάσεων δεδομένων που ακολουθεί «οριζόντια» λογική και είναι αρκετά αποδοτικό ώστε να αποκρίνεται σε πολύπλοκα και ευρείας κλίμακας ερωτήματα σε πραγματικό χρόνο.
Καταλήγει με την παρουσίαση μίας ολοκληρωμένης εφαρμογής η οποία εκμεταλλευόμενη τα πλεονεκτήματα του Λειτουργικού Συνδυασμού και της οριζόντιας δομής των δεδομένων είναι σε θέση να διαχειριστεί εξετάσεις προερχόμενες από κάθε κυτταρομετρητή ροής και συνδυάζοντάς αυτές με τις υπόλοιπες αιματολογικές κλινικοεργαστηριακές εξετάσεις να απαντά σε καθημερινά και σύνθετα ερευνητικά, ιατρικά ερωτήματα.
Τα πρωτότυπα ερευνητικά αποτελέσματα που προέκυψαν στα πλαίσια της παρούσης εργασίας δημοσιεύτηκαν σε έγκυρα διεθνή περιοδικά και σε διεθνή και ελληνικά συνέδρια με κριτές. / Current dissertation focuses on the creation of an efficient model for Bio-medical data integration.
Starting with an analytical approach of the medical knowledge and the problems that may occur cause of the way that medical data are produced, continues with the necessary solutions for single domain data integration and concludes with the proposal of a working framework for mass data integration, originating from multiple medical domains.
The proposed integration model is based on the “horizontal” logic of a database design and it’s efficient enough to produce query results in real time, even for complex real-life medical questions.
The proof of concept of the working framework and its goals for mass data integration is achieved through the presentation of a medical information system. The presented system, by taking advantage of the “horizontal” database design, is able to manage Flow Cytometry measurements, originating for any available hardware and by integrating the cytometric data with other types of hematological data is able to give answers to everyday and research medical questions.
All original research results that produced within the scope of this dissertation were published in international research journals and medical conferences.
|
5 |
Ανάπτυξη σύνθετων εναποθέσεων για την βελτίωση μηχανικών ιδιοτήτων κοκκώδων υλικώνΧάβεζ, Ιωσήφ 09 March 2009 (has links)
Ένα σημαντικό πρόβλημα που αντιμετωπίζουν οι εταιρείες άντλησης πετρελαίου στα φρεάτια εξόρυξης είναι η συμπαραγωγή άμμου μαζί με το πετρέλαιο. Το φαινόμενο παρατηρείται κυρίως σε περιοχές άντλησης όπου το πετρέλαιο βρίσκεται εγκλωβισμένο σε αμμώδεις περιοχές (ψαμμιτικοί ταμιευτήρες). Το αντλούμενο πετρέλαιο συμπαρασύρει μαζί του κόκκους άμμου, οι οποίοι εισχωρούν στον μηχανολογικό εξοπλισμό της εξόρυξης προκαλώντας βλάβες. Αυτό έχει ως αποτέλεσμα την επιβράδυνση της παραγωγής πετρελαίου καθώς επίσης και την αύξηση του κόστους. Σε μερικές περιπτώσεις έχουν καταγραφεί και φαινόμενα κατάρρευσης των τοιχωμάτων του φρεατίου λόγω υπερβολικής διείσδυσης άμμου στα φρεάτια. Το κίνητρο της παρούσας εργασίας είναι η ανάπτυξη μιάς εναλλακτικής και ταυτόχρονα οικονομικής μεθόδου ελέγχου συμπαραγωγής της άμμου. Η μέθοδος στηρίζεται στην εναπόθεση, μέσω της επιτόπου καταβύθισης, ενός δυσδιάλυτου ανόργανου άλατος επάνω στην επιφάνεια των κόκκων άμμου, οι οποίοι μέσω της κρυσταλλικής τους ανάπτυξης σχηματίζουν «γέφυρες» με γειτονικούς κόκκους με αποτέλεσμα την συσσωμάτωση τους. Ένα πολύμορφο του φωσφορικού ασβεστίου, ο υδροξυαπατίτης (ΗΑΡ, Ca10(PO4)6(OH)2) σε συνδυασμό με φορτισμένα οργανικά μακρομόρια (κολλαγόνο, πρωτείνες), είναι το κύριο συστατικό των οστών και των δοντιών, δηλαδή περιοχών του σώματος όπου απαιτούνται υψηλές μηχανικές ιδιότητες. Για τον λόγο αυτό, το φωσφορικό ασβέστιο επιλέχθηκε ως το πλέον κατάλληλο γι’αυτή την διεργασία. Προκειμένου να μειώσουμε το κόστος καθώς επίσης και να προσεγγίσουμε περισσότερο της συνθήκες σχηματισμού του στους έμβιους οργανισμούς, αντί για κολλαγόνο ή πρωτείνες εισάγαγαμε χαμηλού κόστους πολυηλεκτρολύτες οι οποίοι περιέχουν στη δομή τους τις ίδιες χαρακτηριστικές ομάδες (αμινομάδες, καρβοξυλομάδες). Οι πολυηλεκτρολύτες που επιλέχθηκαν ήταν το πολυακρυλικό οξύ (ΡΑΑ), η πολυαλλυλαμίνη (ΡΑΗ) και η πολυαιθυλενιμίνη (ΡΕΙ). Η παρούσα έρευνα εστιάστηκε κυρίως στον προσδιορισμό των συνθηκών καταβύθισης του ΗΑΡ, καθώς επίσης και στην επίδραση που επιφέρει η παρουσία των τριών πολυηλεκτρολυτών (ΡΑΑ, ΡΑΗ, ΡΑΗ) στην δυνατότητα εναπόθεσης του στην επιφάνεια των κόκκων άμμου. Οι πολυηλεκτρολύτες αλληλεπιδρούν και με την επιφάνεια του υποστρώματος (πυριτική άμμος) και με το σχηματιζόμενο φωσφορικό ασβέστιο. Οι αλληλεπιδράσεις αυτές μελετήθηκαν κυρίως μέσω πειραμάτων ρόφησης και πειραμάτων διαλείποντος έργου σε συνθήκες χαμηλού υπερκορεσμού προκειμένου να ερευνηθεί ο μηχανισμός επίδρασης των πολυηλεκτρολυτών στον σχηματισμό του φωσφορικού ασβεστίου. Η επίδραση των πολυηλεκτρολυτών στις μηχανικές ιδιότητες των καταβυθιζόμενων κρυστάλλων μελετήθηκε μέσω πειραμάτων διαλείποντος έργου σε συνθήκες υψηλού υπερκορεσμού. Τέλος, με βάση τα εξαγόμενα συμπεράσματα σχετικά με την επίδραση των πολυηλεκτρολυτών στην εναπόθεση του φωσφορικού ασβεστίου στους κόκκους άμμου, πραγματοποιήθηκαν πειράματα συσσωμάτωσης σε κλίνες πληρωμένες με άμμο προκειμένου να διαπιστώσουμε την αποτελεσματικότητα της παρούσας μεθόδου. / The objective goal of the present work is the formation of complex deposits of calcium phosphate salts and polymers on grain surfaces of a nonconsolidated material in order a strong consolidated medium to be obtained. In nature, interactions between calcium phosphate salts and organic macromolecules control important functions such as formation of bones and teeth. These organic macromolecules primarily consist of proteins, which usually contain carboxyl and amino groups on their molecular structure. In a series of laboratory experiments the nature mechanisms are mimed by replacing the proteins with a typical polyelectrolyte, such us polyacrylic acid and polyethylenimine, which contain carboxyl and amino groups respectively, phosphate salts and. As unconsolidated porous medium a granular sandpack was used. The effect polyacrylic acid, polyallylamine hydrochloride and polyethylenimine on the formation kinetics as well as the effect on the morphology of the precipitated crystals was investigated through a series of batch experiments. The kinetic study was performed via an in-situ monitoring of the pH, because the formation of calcium phosphate is accompanied with changes of the pH value. The morphology as well as the crystallinity of the precipitated crystals where analyzed using different techniques, such us powder XRD and SEM. Study of the mechanical properties of the precipitated salts at high concentration batch experiments, where performed in a mechanical stress device (MTS) and compressive strengths up to 500 atm were observed.
|
Page generated in 0.0993 seconds