Global ETD Search

21	Ανάπτυξη δυναμικής web based εφαρμογής με σκοπό την απεικόνιση της βιοϊατρικής πληροφορίας στον παγκόσμιο χάρτη, μέσω φορητών συσκευών / Developing dynamic web based application for visualization of biomedical information on the world map through mobile devices Μαντιδάκης, Γεώργιος 15 May 2012 (has links) Ο σκοπός της διπλωματικής εργασίας είναι η απεικόνιση της βιοϊατρικής πληροφορίας με πρωτότυπο τρόπο, δίνοντας έμφαση τόσο στον σχεδιασμό και στην ανάπτυξη μίας φιλικής διεπαφής για τον χρήστη όσο και στην απόκτηση τεχνικής γνώσης από μέρους μου. Έτσι, μελετήθηκαν υπάρχουσες εφαρμογές-τεχνολογίες και οι αντίστοιχες δυνατότητες που προσέφεραν, σε συνδυασμό πάντα με τις απαιτήσεις και τις ανάγκες των ιατρών. / The subject of the present diploma is the imaging of biomedical information in an original way, emphasizing both the design and development of a user friendly interface and the acquisition of technical knowledge for me. Thus, studied existing applications and technologies and their respective capabilities offered, I tried to make a system always in combination with the demands and the needs of the doctors. Απεικόνιση δεδομένων Βιοϊατρικά δεδομένα Βάσεις δεδομένων 025.042 2 Biodatabases Mapping data JQuery JVector Javascript PHP HTML MySQL server
22	Ερωτήματα συνένωσης και βαθμολογημένης συνένωσης σε κατανεμημένα συστήματα Πατλάκας, Ιωάννης 28 February 2013 (has links) Η ανάπτυξη των peer-to-peer βάσεων δεδομένων και η δυναμική εισαγωγή των συστημάτων αποθήκευσης σε νέφη υπολογιστών (cloudstores) ως τα κυρίαρχα μεγάλης κλίμακας συστήματα διαχείρισης δεδομένων, έχουν οδηγήσει τους ερευνητές να εξετάσουν το πρόβλημα της υποστήριξης πολύπλοκων ερωτημάτων με ένα πλήρως αποκεντρωμένο τρόπο. Περίπλοκα ερωτήματα επιλογής (select), συνένωσης join, καθώς και βαθμολογημένα ερωτήματα έχουν κεντρίσει το ενδιαφέρον της κοινότητας διαχείρισης δεδομένων. Ανάμεσα στις τάξεις των ερωτημάτων αυτών είναι το κεντρικής σημασίας top-k join. To κατανεμημένο top-k join, δεν έχει μελετηθεί επαρκώς, αν και συναντάται πολύ συχνά σε πραγματικό φόρτο εργασίας σε πολλά εμπορικά και άλλα συστήματα βάσεων δεδομένων. Με την εργασία αυτή αντιμετωπίζουμε τέτοιου είδους ερωτήματα πάνω σε δεδομένα που είναι κατανεμημένα σε ένα μεγάλου κλίμακας δίκτυο. Οι συνεισφορές μας με αυτήν την εργασία περιλαμβάνουν: (α) ένα νέο κατανεμημένο ευρετήριο, που επιτρέπει την πρόσβαση σε πλειάδες με τυχαίο και διατεταγμένο τρόπο, (β) ένα σύνολο αλγόριθμων για βαθμολογημένα ερωτημάτατα συνένωσης join. Οι αλγόριθμοί μας στηρίζονται στην προσαρμογή γνωστών αλγοριθμών κατωφλίου για βαθμολογημένο join σε κατανεμημένο περιβάλλον, (γ) μία νέα χρήση των Bloom φίλτρων και ιστογραμμάτων για την περαιτέρω μείωση του εύρους ζώνης που καταναλώνουν οι παραπάνω αλγόριθμοι, καθώς και απόδειξη για το ότι οι αλγόριθμοί μας που βασίζονται σε φίλτρα Bloom και ιστογράμματα παράγουν το σωστό top-k αποτέλεσμα, (δ) μια σε βάθος συζήτηση του σχεδιασμού των αλγορίθμων μας και θεμάτων που συνδέονται με τις επιδόσεις και τα trade-offs. Επιπλέον διερευνούμε την αποτελεσματικότητα και την ποιότητα των προτεινόμενων λύσεων μέσα από μία αναλυτική πειραματική αξιολόγηση, δείχνοντας τις περιπτώσεις που ο κάθε αλγόριθμός μας είναι κατάλληλος σε μαζικώς κατανεμημένα και αποκεντρωμένα περιβάλλοντα, ενώ τονίζουμε τα trade-offs που προκύπτουν. / The advent of peer-to-peer databases and the recent rise of cloudstores as key large-scale data management paradigms, have led researchers to look into the problem of supporting complex queries in a fully decentralized manner. Among the classes of queries considered in related centralized work, there is one that stands out as largely overlooked in widely distributed settings, albeit very common in real-world workloads: top-k joins. With this work we tackle such queries over data distributed across an internet-scale network. Our contributions include: (a) a novel distributed indexing scheme, allowing access to tuples in both a random and an ordered manner; (b) a set of query processing algorithms based on a novel adaptation of rank-join and threshold algorithms, appropriate for use in a distributed environment; (c) a novel use of Bloom Filters and histograms to further reduce the bandwidth consumption of the above algorithms; a proof that ensures that our algorithms based on Bloom filters and histograms produce the correct top-k results; and (d) an in-depth discussion of the design space and related performance trade-offs. We further investigate the efficiency and quality of the proposed solutions through an elaborate experimental evaluation, showcasing their appropriateness for widely-distributed and massively decentralized environments and highlighting related trade-offs. Top-k ερωτήματα Rank ερωτήματα 005.74 Distributed databases Top-k queries Rank queries Query processing DHT
23	Σχεδιασμός και υλοποίηση συστήματος ανάλυσης ηχογραφήσεων ηχοτοπίου Λιάσος, Παντελής 19 October 2012 (has links) Η ακουστική οικολογία είναι το επιστημονικό πεδίο το οποίο μελετά την επίδραση διαφόρων παραγόντων, όπως η ανθρώπινη δραστηριότητα, σε συγκεκριμένα οικοσυστήματα μέσω επιλεγμένων ηχογραφήσεων των γεωγραφικών περιοχών των ηχοτοπίων. Εδώ παρουσιάζεται μελέτη αυτόματης ανάλυσης, αναγνώρισης και κατηγοριοποίησης από τέτοιες ηχογραφήσεις. Δοκιμάζονται διάφοροι αλγόριθμοι και επιλέγεται μέθοδος που βασίζεται στην επεξεργασία του ηχητικού φάσματος, μέσω των Mel Frequency Cepstral Coefficients (MfCC) του φάσματος του ηχητικού σήματος. Τα ομαδοποιημένα δεδομένα που προέκυψαν, μελετήθηκαν ως προς το ποσοστό επιτυχούς αναγνώρισης της προέλευσης των ήχων που διακρίνονται στις ηχογραφήσεις. Η κατηγοριοποίηση και ταξινόμηση αυτή έγινε με τη δοκιμή διαφόρων αλγορίθμων ταξινόμησης. Επιπλέον πραγματοποιείται σύγκριση των αλγορίθμων αυτών με βάση το ποσοστό επιτυχούς αναγνώρισης αλλά και της ταχύτητας ταξινόμησης των ηχογραφημένων δειγμάτων η οποία οδηγεί σε συμπεράσματα για τη βελτιστοποίηση της συγκεκριμένης διαδικασίας / Acoustic ecology is the scientific field which studies the effect of human activity and other factors to ecosystems via the recording of soundscapes which constitute a database of selected recordings of geographic regions. The parameters that are examined are based on the processing of the sound spectrum, they are named Mel Frequency Cepstral Coefficients (MfCC) and represent factors of the signal spectrum. The rate of the successful recognition of the origin of sounds distinguished in the set of the soundscape recordings is estimated. Various classification algorithms are tested for the sound data classification. Moreover a comparison among the algorithms is realised based both on the ratio of successful recognition and the classification speed of the recorded samples which leads to conclusions on the optimisation of this particular process. Εξόρυξη δεδομένων Ταξινόμηση Ηχοτοπία Βάσεις δεδομένων Ηχογραφήσεις Ακουστική οικολογία 620.25 Data mining Classification Soundscapes Databases Recordings Acoustic ecology
24	Εξόρυξη γνώσης από ιατροβιολογικά δεδομένα / Biomedical data mining Καλλά, Μαρία-Παυλίνα 28 February 2013 (has links) Πίσω από όλα αυτά τα δεδομένα που υπάρχουν κρύβεται ένας τεράστιος θησαυρός γνώσεων τον οποίο δεν μπορούμε να αντιληφθούμε καθώς η μορφή των πληροφοριών δεν μας το επιτρέπει. Έτσι αναπτύχθηκαν μέθοδοι και τεχνικές που μας βοηθούν να βρούμε την κρυμμένη γνώση και να την αξιοποιήσουμε προς όφελος κυρίως του κοινού και η πιο γνωστή μέθοδος, με την οποία θα ασχοληθούμε και εμείς είναι η Εξόρυξη Γνώσης. Στην εργασία που ακολουθεί θα μιλήσουμε για την χρήση των μεθόδων Εξόρυξης Γνώσης (όπως λέγονται) σε βιοϊατρικά δεδομένα. Στην αρχή θα κάνουμε αναφορά στην Μοριακή Βιολογία και στην Βιοπληροφορική. Ακολούθως θα δουμε την Ανακάλυψη γνώσης από βάσεις δεδομένων. Θα δούμε αναλυτικά την Εξόρυξη γνώσης και πιο πολύ τις μεθόδους κατηγοριοποίησης. Τέλος θα εφαρμόσουμε τους αλγορίθμους σε ιατροβιολογικά δεδομένα και θα δούμε τα συμπεράσματα που προκύπτουν αλλά και μελλοντικές επεκτάσεις. / Behind all these data there is hidden a huge treasure of knowledge which we can not understand . Thus developed methods and techniques that help us find the hidden knowledge and to utilize it for the benefit of the public. The most famous method, which we will study, is Data Mining. In the work that follows we will discuss the use of data mining methods (as they are called) in biomedical data. In the beginning, we will report information about Molecular Biology and Bioinformatics. Then. we will see the knowledge discovery in databases. We will see in detail the Data Mining and the classification methods. Finally we implement the algorithms in biomedical data and see the conclusions and future extensions. Βιοπληροφορική Εξόρυξη γνώσης 610.285 Bioinformatics Data mining Classification algorithms Biological databases Ensemble methods
25	Σχεδιασμός & ανάπτυξη μιας μετα-βάσης δεδομένων για το δίκτυο πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο Γιουτλάκης, Άρης 26 July 2013 (has links) Η αποσαφήνιση της σχέσης του γονοτύπου με το φαινότυπο ενός οργανισμού είναι μια από τις μεγαλύτερες προκλήσεις των επιστημών ζωής σήμερα. Για την επίτευξη του στόχου αυτού, η κατανόηση της δομής και της ρύθμισης του δικτύου πρωτεϊνικών αλληλεπιδράσεων (ΔΠΑ) είναι ένα από τα καθοριστικά στάδια αυτής της συσχέτισης. Πρώτο βήμα προς την κατεύθυνση αυτή αποτελεί η λεπτομερής και ακριβής ανακατασκευή του ΔΠΑ. Πειραματικά αποτελέσματα που υποστηρίζουν πρωτεϊνικές αλληλεπιδράσεις δημοσιεύονται στη βιβλιογραφία, από όπου η γνώση αυτή εξορύσσεται είτε μέσω άμεσης καταγραφής από ερευνητές είτε μέσω υπολογιστικών αλγορίθμων ανάλυσης κειμένου, και αποθηκεύεται σε πρωτογενείς βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων (ΒΔΠΑ). Για το ΔΠΑ στον άνθρωπο, υπάρχουν αρκετές ΒΔΠΑ, οι οποίες λόγω διαφορετικών στόχων, τρόπων εξόρυξης γνώσης από τη βιβλιογραφία και διαφορετικής διαχείρισης της βάσης, παρουσιάζουν μικρή επικάλυψη, περιγράφουν τα δεδομένα τους με ασύμβατο μεταξύ τους τρόπο και ορολογία, και ορίζουν τις πρωτεϊνικές αλληλεπιδράσεις μέσω διαφορετικών επιπέδων αναφοράς της γονιδιακής πληροφορίας. Για την ενοποίηση δεδομένων πρωτεϊνικών αλληλεπιδράσεων από διάφορες πρωτογενείς βάσεις έχουν αναπτυχθεί μετα-βάσεις, οι οποίες προσπαθούν να ξεπεράσουν τα προβλήματα που προκύπτουν από την ετερογένεια των ΒΔΠΑ. Και στην περίπτωση των μεταβάσεων, όμως, ανακύπτουν προβλήματα, που αφορούν: α) στο ότι το δίκτυο ορίζεται με βάση τις πρωτεϊνικές αλληλεπιδράσεις και όχι τις πρωτεΐνες-κόμβους του ΔΠΑ, β) στον πλεονασμό κωδικών ταυτοποίησης των πρωτεϊνών στα διάφορα επίπεδα αναφοράς της γονιδιακής πληροφορίας, γ) στην ετερογένεια του τρόπου κανονικοποίησης των κωδικών ταυτοποίησης πρωτεϊνών, δ) στην υστέρηση της ανανέωσής τους σε σχέση με τις πρωτογενείς βάσεις και ε) στην επιλογή των δεδομένων που καταγράφονται από τις ΒΔΠΑ. Ο σκοπός αυτής της εργασίας είναι ο σχεδιασμός και η ανάπτυξη μιας μετα-βάσης δεδομένων για το δίκτυο πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο, PICKLE, που να προσφέρει επαρκείς λύσεις στα προβλήματα αυτά. Η μεγάλη διαφορά σε σχέση με τις υπάρχουσες μετα-βάσεις είναι ο ορισμός του ΔΠΑ με βάση το αξιολογημένο πλήρες ανθρώπινο πρωτεϊνωμα (Reviewed complete Human Proteome), όπως αυτό ορίζεται από τη βάση δεδομένων γνώσης πρωτεϊνικής πληροφορίας UniProt ΚΒ. Για τις πρωτεΐνες αυτές αναζητήθηκε η σχετική πληροφορία αλληλεπιδράσεων στις πέντε κύριες δημόσιες βάσεις πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο, DIP, HPRD, IntAct, MINT και BioGRID. Τα προβλήματα του πλεονασμού και της κανονικοποίησης λύθηκαν μέσω της ανάπτυξης μίας κατάλληλης γονιδιακής οντολογίας, η οποία μας επέτρεψε να συνδέσουμε το πλήρες ανθρώπινο πρωτεϊνωμα με τα υπόλοιπα επίπεδα αναφοράς της γενετικής πληροφορίας, δρώντας παράλληλα ως ένας ευέλικτος και ακριβής μηχανισμός κανονικοποίησης. Για τη γρήγορη ανανέωση των δεδομένων της μετα-βάσης, αναπτύχθηκε μια αυτοματοποιημένη διαδικασία σύνδεσης και ενημέρωσής της από τις PPIDBs. Η πρώτη έκδοση της PICKLE κατέγραψε 83720 αλληλεπιδράσεις για 12418 UNIPROT IDs από το σύνολο των 20225 του πλήρους ανθρώπινου πρωτεϊνωματος, που υποστηρίζονται από 27.590 δημοσιεύσεις. Η PICKLE θα εμπλουτιστεί με ένα φιλικό προς το χρήστη γραφικό περιβάλλον και θα συνδεθεί με εργαλεία ανάλυσης δικτύων και ομικών δεδομένων, για να αποτελέσει πολύτιμο εργαλείο σε βιοϊατρικές μελέτες και εφαρμογές. / The elucidation of the underlying relationship between an organism’s genotype and its expressed phenotype is currently one the greatest challenges faced by life sciences and biology in general. In order to achieve that, the better understanding of the inner structure and regulation mechanisms of the protein-protein interaction (PPI) networks is of great importance. The first step towards that goal is the detailed and accurate reconstruction of the PPI network itself. The scientific literature is constantly being updated with new experimental results supporting PPI evidence, which in turn are fed into primary PPI databases (PPIDB) by the use of either curators or text mining algorithms. Currently there is a large number of PPIDB referring to the human PPIs. Since many of them have different goals, literature curation methods, and database administration strategies, it is not surprising that they also exhibit a limited PPI overlap and incompatible terminology for PPI intera\-ctors, i.e. use of arbitrary levels of genetic organization. A number of meta-databases have been developed in order to achieve integrated overviews of PPI networks while circumventing the problems inherent in the field of primary PPI databases. Unfortunately, meta-databases have a number of issues of their own, such as: a) top-down network definition based on protein interactions instead of interactors, b) protein identifier redundancy in all levels of reference, c) the use of {\it ad hoc} normalization methods, d) infrequent updating and d) insufficient information stored. The major goal of this thesis is the design and implementation of PICKLE (Protein Interaction Knowledge Base), a meta-database for the human PPI network created specifically to tackle the aforementioned problems. PICKLE’s novelty stems from its unique approach to PPI network definition, following a bottom-up reconstruction method based on UniProt’s reviewed complete human proteome (RCHP) definition. Five primary PPIDB (DIP, HPRD, IntAct, ΜΙΝΤ and BioGRID) were mined for interactions explicitly constrained by UniProt’s proteome definition. Furthermore, in order to tackle the issues of redundancy and inadequate normalization, a specific ontology was designed which allowed linking of the RCHP set with all the other levels of genetic organization while also serving as an agile yet accurate normaliza\-tion mechanism. In order to address the issue of updating, an autonomous means of data collection and integration was developed. PICKLE’s maiden release recorded 83720 direct PPIs involving 12418 UniProt IDs (out of 20225) supported by a total of 27590 publications. PICKLE, an evolving valuable bioinformatics for biomedical research and red biotechnology applications tool will soon be updated with a user-friendly interface and upgraded by linking it with network analysis software and various omics datasets. Βιοπληροφορική Συστημική βιολογία 025.065 726 44 Bioinformatics Systems biology Biological databases Protein interaction networks
26	Novel frequent itemset hiding techniques and their evaluation / Σύγχρονες μέθοδοι τεχνικών απόκρυψης συχνών στοιχειοσυνόλων και αξιολόγησή τους Καγκλής, Βασίλειος 20 May 2015 (has links) Advances in data collection and data storage technologies have given way to the establishment of transactional databases among companies and organizations, as they allow enormous volumes of data to be stored efficiently. Most of the times, these vast amounts of data cannot be used as they are. A data processing should first take place, so as to extract the useful knowledge. After the useful knowledge is mined, it can be used in several ways depending on the nature of the data. Quite often, companies and organizations are willing to share data for the sake of mutual benefit. However, these benefits come with several risks, as problems with privacy might arise, as a result of this sharing. Sensitive data, along with sensitive knowledge inferred from these data, must be protected from unintentional exposure to unauthorized parties. One form of the inferred knowledge is frequent patterns, which are discovered during the process of mining the frequent itemsets from transactional databases. The problem of protecting such patterns is known as the frequent itemset hiding problem. In this thesis, we review several techniques for protecting sensitive frequent patterns in the form of frequent itemsets. After presenting a wide variety of techniques in detail, we propose a novel approach towards solving this problem. The proposed method is an approach that combines heuristics with linear-programming. We evaluate the proposed method on real datasets. For the evaluation, a number of performance metrics are presented. Finally, we compare the results of the newly proposed method with those of other state-of-the-art approaches. / Η ραγδαία εξέλιξη των τεχνολογιών συλλογής και αποθήκευσης δεδομένων οδήγησε στην καθιέρωση των βάσεων δεδομένων συναλλαγών σε οργανισμούς και εταιρείες, καθώς επιτρέπουν την αποδοτική αποθήκευση τεράστιου όγκου δεδομένων. Τις περισσότερες φορές όμως, αυτός ο τεράστιος όγκος δεδομένων δεν μπορεί να χρησιμοποιηθεί ως έχει. Μια πρώτη επεξεργασία των δεδομένων πρέπει να γίνει, ώστε να εξαχθεί η χρήσιμη πληροφορία. Ανάλογα με τη φύση των δεδομένων, αυτή η χρήσιμη πληροφορία μπορεί να χρησιμοποιηθεί στη συνέχεια αναλόγως. Αρκετά συχνά, οι εταιρείες και οι οργανισμοί είναι πρόθυμοι να μοιραστούν τα δεδομένα μεταξύ τους με στόχο το κοινό τους όφελος. Ωστόσο, αυτά τα οφέλη συνοδεύονται με διάφορους κινδύνους, καθώς ενδέχεται να προκύψουν προβλήματα ιδιωτικής φύσης, ως αποτέλεσμα αυτής της κοινής χρήσης των δεδομένων. Ευαίσθητα δεδομένα, μαζί με την ευαίσθητη γνώση που μπορεί να προκύψει από αυτά, πρέπει να προστατευτούν από την ακούσια έκθεση σε μη εξουσιοδοτημένους τρίτους. Μια μορφή της εξαχθείσας γνώσης είναι τα συχνά μοτίβα, που ανακαλύφθηκαν κατά την εξόρυξη συχνών στοιχειοσυνόλων από βάσεις δεδομένων συναλλαγών. Το πρόβλημα της προστασίας συχνών μοτίβων τέτοιας μορφής είναι γνωστό ως το πρόβλημα απόκρυψης συχνών στοιχειοσυνόλων. Στην παρούσα διπλωματική εργασία, εξετάζουμε διάφορες τεχνικές για την προστασία ευαίσθητων συχνών μοτίβων, υπό τη μορφή συχνών στοιχειοσυνόλων. Αφού παρουσιάσουμε λεπτομερώς μια ευρεία ποικιλία τεχνικών απόκρυψης, προτείνουμε μια νέα προσέγγιση για την επίλυση αυτού του προβλήματος. Η προτεινόμενη μέθοδος είναι μια προσέγγιση που συνδυάζει ευρετικές μεθόδους με γραμμικό προγραμματισμό. Για την αξιολόγηση της προτεινόμενης μεθόδου χρησιμοποιούμε πραγματικά δεδομένα. Για τον σκοπό αυτό, παρουσιάζουμε επίσης και μια σειρά από μετρικές αξιολόγησης. Τέλος, συγκρίνουμε τα αποτελέσματα της νέας προτεινόμενης μεθόδου με άλλες κορυφαίες προσεγγίσεις. Privacy preserving data mining Knowledge hiding Frequent itemset hiding Transactional databases 005.8 Απόκρυψη γνώσης
27	Νέοι αλγόριθμοι υπολογιστικής νοημοσύνης και ομαδοποίησης για την εξόρυξη πληροφορίας Τασουλής, Δημήτρης 10 August 2007 (has links) Αυτή η Διδακτορική Διατριβή πραγματεύεται το θέμα της ομαδοποίησης δεδομένων (clustering), καθώς και εφαρμογές των τεχνικών αυτών σε πραγματικά προβλήματα. Η παρουσίαση των επιμέρους θεμάτων και αποτελεσμάτων της διατριβής αυτής οργανώνεται ως εξής: Στο Κεφάλαιο 1 παρέχουμε τον ορισμό της Υπολογιστικής Νοημοσύνης σαν τομέας ερευνάς, και αναλύουμε τα ξεχωριστά τμήματα που τον αποτελούν. Για κάθε ένα από αυτά παρουσιάζεται μια σύντομη περιγραφή. Το Κεφάλαιο 2, ασχολείται με την ανάλυση του ερευνητικού πεδίου της ομαδοποίησης. Κάθε ένα από τα χαρακτηριστικά της αναλύεται ξεχωριστά και γίνεται μια επισκόπηση των σημαντικότερων αλγόριθμων ομαδοποίησης. Το Κεφάλαιο 3, αφιερώνεται στη παρουσίαση του αλγορίθμου UKW, που κατά την εκτέλεση του έχει την ικανότητα να προσεγγίζει το πλήθος των ομάδων σε ένα σύνολο δεδομένων. Επίσης παρουσιάζονται πειραματικά αποτελέσματα με σκοπό τη μελέτη της απόδοσης του αλγορίθμου. Στο Κεφάλαιο 4, προτείνεται μια επέκταση του αλγορίθμου UKW, σε μετρικούς χώρους. Η προτεινόμενη επέκταση διατηρεί όλα τα πλεονεκτήματα του αλγορίθμου UKW. Τα πειραματικά αποτελέσματα που παρουσιάζονται επίσης σε αυτό το κεφάλαιο, συγκρίνουν την προτεινόμενη επέκταση με άλλους αλγορίθμους. Στο επόμενο κεφάλαιο παρουσιάζουμε τροποποιήσεις του αλγορίθμου με στόχο την βελτίωση των αποτελεσμάτων του. Οι προτεινόμενες τροποποιήσεις αξιοποιούν πληροφορία από τα τοπικά χαρακτηριστικά των δεδομένων, ώστε να κατευθύνουν όσο το δυνατόν καλύτερα την αλγοριθμική διαδικασία. Το Κεφάλαιο 6, πραγματεύεται επεκτάσεις του αλγορίθμου σε κατανεμημένες Βάσεις δεδομένων. Για τις διάφορες υποθέσεις που μπορούν να γίνουν όσον αφορά τη φύση του περιβάλλοντος επικοινωνίας, παρουσιάζονται κατάλληλοι αλγόριθμοι. Στο Κεφάλαιο 7, εξετάζουμε την περίπτωση δυναμικών βάσεων δεδομένων. Σε ένα τέτοιο μη στατικό περιβάλλον αναπτύσσεται μια επέκταση του αλγορίθμου UKW, που ενσωματώνει τη δυναμική δομή δεικτοδότησης Bkd-tree. Επιπλέον παρουσιάζονται θεωρητικά αποτελέσματα για την πολυπλοκότητα χειρότερης περίπτωσης του αλγορίθμου. Το Κεφάλαιο 8, μελετά την εφαρμογή αλγορίθμων ομαδοποίησης σε δεδομένα γονιδιακών εκφράσεων. Επίσης προτείνεται και αξιολογείται ένα υβριδικό σχήμα που καταφέρνει να αυτοματοποιήσει την όλη διαδικασία επιλογής γονιδίων και ομαδοποίησης. Τέλος, η παρουσίαση του ερευνητικού έργου αυτής της διατριβής ολοκληρώνεται στο Κεφάλαιο 9 που ασχολείται με την ανάπτυξη υβριδικών τεχνικών που συνδυάζουν την ομαδοποίηση και τα Τεχνητά Νευρωνικά Δίκτυα, και αναδεικνύει τις δυνατότητες τους σε δύο πραγματικά προβλήματα. / This Doctoral Dissertation appoints the issue of data Clustering, as well as the applications of these kind of methods in real world problems. The presentation of the individual results of this dissertation is organised as follows: In Chapter 1, the definition of Computational Intelligence is provided as a research area. For each distinct part of this area a short description is supplied. Chapter 2, deals with the analysis of the research area of Clustering per se, and its characteristics are analysed separably. Moreover, we provide a review of the most representative clustering algorithms. Chapter 3, is devoted to the presentation of the UKW algorithm, that is able to endogenously provide approximations for the number of clusters in a dataset, during its execution. Furthermore, the included experimental results demonstrate the algorithm's efficiency. In Chapter 4, an extension of the UKW algorithm to metric spaces is proposed. This extension preserves all the advantages of the original algorithm. The included experimental results compare the proposed extension to other approaches. In the next chapter we present modifications of the UKW algorithm that scope to improve its efficiency. This is performed through the utilisation of information from the local characteristics of the data, so as to direct more efficiently the whole clustering procedure. Chapter 6, deals with extensions of the algorithm in distributed data bases. For the various assumptions that can be postulated for the nature of the communication environment different algorithms are proposed. In Chapter 7, we consider the case of dynamic databases. In such a non-static environment, an algorithm is developed that draws form the principles of the UKW algorithm, and embodies the dynamic indexing Bkd-tree data structure. Moreover, theoretical results are presented regarding the worst case complexity of the algorithm. Chapter 8, studies the application of clustering algorithms in gene expression data. Besides, it is proposed and evaluated, a hybrid algorithmic scheme that manages to automate the whole procedure of gene selection and clustering. Finally, the presentation of the research work of this dissertation is fulfilled in Chapter 9. This Chapter is devoted to the development of hybrid techniques that combine clustering methods and Artificial Neural Networks, and demonstrate their abilities in two real world problems. Εξόρυξη δεδομένων Βάσεις δεδομένων 006.3 Data clustering Computational intelligence Data mining Data bases Computational geometry
28	Μεθοδολογικό πλαίσιο υποστήριξης της εξόρυξης γνώσης από δεδομένα με την χρήση αρχών της πολυκριτήριας ανάλυσης αποφάσεων Μαστρογιάννης, Νικόλαος 11 January 2010 (has links) Η εξόρυξη γνώση από δεδομένα είναι μια νέα και δυναμική τεχνολογία που βοηθάει τις επιχειρήσεις να επικεντρωθούν στην σημαντική πληροφορία που βρίσκεται μέσα στις αποθήκες δεδομένων τους, αναζητώντας κρυμμένα πρότυπα και ανακαλύπτοντας πληροφορίες που οι ειδικοί μπορεί να χάσουν ή να παραβλέψουν. Τα τελευταία χρόνια έχει αναπτυχθεί πλήθος αλγορίθμων της εξόρυξης δεδομένων, οι οποίοι ακολουθούν διαφορετικές μεθοδολογικές προσεγγίσεις, ενώ ταυτόχρονα παρουσιάζουν σημαντική ποικιλία εφαρμογών. Η προσπάθεια ωστόσο για βελτιωμένους και αποδοτικότερους αλγορίθμους συνεχίζεται. Η παρούσα διδακτορική διατριβή έχει σαν βασικό της στόχο να συνεισφέρει στην προσπάθεια αυτή, βελτιώνοντας και ενισχύοντας την θεωρητική θεμελίωση υφιστάμενων αλγορίθμων της εξόρυξης δεδομένων. Ειδικότερα, μέσα από μια διαφορετική λογική, η οποία βασίζεται σε έννοιες και διαδικασίες της πολυκριτήριας ανάλυσης αποφάσεων, και ειδικότερα της μεθόδου ELECTRE I της θεωρίας των σχέσεων υπεροχής, η διδακτορική διατριβή αναπτύσσει ένα νέο μεθοδολογικό πλαίσιο για την εξόρυξη δεδομένων. Ενσωματώνοντας στην συνέχεια αυτό το μεθοδολογικό πλαίσιο σε υφιστάμενους αλγορίθμους, δημιουργούνται ουσιαστικά νέοι, αποτελεσματικότεροι και ακριβέστεροι αλγόριθμοι, για επιμέρους διαδικασίες και εφαρμογές της εξόρυξης δεδομένων. Πιο συγκεκριμένα, το προτεινόμενο μεθοδολογικό πλαίσιο, εφαρμόστηκε, με τις αναγκαίες τροποποιήσεις, στις διαδικασίες της ταξινόμησης και της ομαδοποίησης κατηγορικών αντικειμένων, μέσω των μεθόδων CLEDM και CLEKMODES, αντίστοιχα. Τα καλά αποτελέσματα από την εφαρμογή των παραπάνω μεθόδων σε μια σειρά ευρέως χρησιμοποιούμενων βάσεων δεδομένων, σε συνδυασμό με την δυνατότητα επέκτασης του μεθοδολογικού πλαισίου και σε άλλες διαδικασίες της εξόρυξης δεδομένων, διαμορφώνουν ένα νέο «υβριδικό» πεδίο έρευνας. Το πεδίο αυτό, αφενός έχει την δυναμική παραγωγής συνεχώς καλύτερων αλγορίθμων για την εξόρυξη δεδομένων, αφετέρου μπορεί να εξερευνήσει εις βάθος και να τυποποιήσει περαιτέρω την αλληλεπίδραση της εξόρυξης δεδομένων με την πολυκριτήρια ανάλυση αποφάσεων. / Data mining is a new and advancing technology that helps corporations to focus on the most important pieces of information stored in their data warehouses. In particular, data mining searches for hidden patterns and is able to discover information that otherwise could be missed or overlooked by experts. During the last years, a series of data mining algorithms has been developed. These algorithms are based on different methodological patterns and they can be implemented to solve a large variety of applications. However, the effort to build more advanced and efficient data mining algorithms has never stopped. The goal of this PhD thesis is to significantly contribute to the above effort by enhancing and improving the theoretical framework of existing data mining algorithms. More specifically, a different theoretical perspective is introduced, that is based on concepts and procedures of multicriteria analysis and in particular the ELECTRE I method of the outranking relations theory. Consequently, the PhD thesis develops a new methodological framework for data mining that can be incorporated to existing algorithms. This incorporation essentially develops new, more effective and accurate data mining algorithms, for a series of tasks and applications. In particular, the proposed methodological framework was applied, properly modified, to the tasks of classification and clustering, through the CLEDM and CLEKMODES methods, respectively. The good results of these methods in a series of widely used databases, and the perspective of expanding the new methodological framework to other data mining tasks as well, are able to introduce a new “hybrid” research field. This research field has the potential of producing better data mining algorithms and furthermore the potential to thoroughly explore and further formalize the interaction of data mining and multicriteria analysis. Εξόρυξη δεδομένων Βάσεις δεδομένων Μέθοδος ELECTRE I Αλγόριθμοι Ταξινόμηση Ομαδοποίηση 006.312 Data mining Databases Multicriteria analysis ELECTRE I method Algorithms Classification Clustering
29	Οργάνωση βάσεων εικόνων βάσει περιγράμματος : εφαρμογή σε φύλλα Φωτοπούλου, Φωτεινή 16 June 2011 (has links) Το αντικείμενο της μελέτης αυτής είναι η οργάνωση (ταξινόμηση, αναγνώριση, ανάκτηση κλπ.) βάσεων που περιλαμβάνουν εικόνες (φωτογραφίες) φύλλων δένδρων. Η οργάνωση βασίζεται στο σχήμα των φύλλων και περιλαμβάνει διάφορα στάδια. Το πρώτο στάδιο είναι η εξαγωγή του περιγράμματος και γίνεται με διαδικασίες επεξεργασίας εικόνας που περιλαμβάνουν τεχνικές ομαδοποίησης και κατάτμησης. Από το περίγραμμα του φύλλου εξάγονται χαρακτηριστικά που δίνουν την δυνατότητα αξιόπιστης περιγραφής κάθε φύλλου. Μελετήθηκαν στη διατριβή αυτή οι παρακάτω γνωστές μέθοδοι: Centroid Contour Distance, Angle code (histogram), Chain Code Fourier Descriptors. Προτάθηκαν επίσης και καινούριες μέθοδοι: Pecstrum (pattern spectrum), Multidimension Sequence Similarity Measure (MSSM). Οι παραπάνω μέθοδοι υλοποιήθηκαν. Παράχθηκε κατάλληλο λογισμικό και εφαρμόσθηκαν σε μία βάση εικόνων φύλλων επιλεγμένη από το διαδίκτυο. Η αξιολόγηση των μεθόδων έγινε μέσα από έλεγχο της συνολικής ακρίβειας κατηγοριοποίησης (με τον confusion matrix). H μέθοδος MSSM έδωσε τα καλύτερα αποτελέσματα. Μία οπτική αξιολόγηση έγινε σε αναπαράσταση 2 διαστάσεων (biplot) μέσα απο διαδικασία Multidimensional Scaling. / The objective of this thesis is the leaf images data base organization (i.e classification, recognition, retrieval etc.). The database organization is based on the leaf shape and is accomplished in a few stages. The contour recognition and recording consist the first stage and is performed with image processing operations namely clustering and segmentation. From the leaf contour several features are extracted appropriate for a reliable description of each leaf type. The following well known techniques were studied in this thesis: Centroid Contour Distance, Angle code (histogram), Chain Code, Fourier Descriptors. Two new metods were also proposed: Pecstrum (pattern spectrum), Multidimension Sequence Similarity Measure. In the experimental study appropriate software was produced to realize all the above methods which was applied to the leaf data base downloaded from internet. The overall evaluation of the methods was done by means of the classification in precision and using the confusion matrix. Best results were produced by the MSSM method. Φύλλα δέντρων Ανάκτηση δεδομένων Ταξινόμηση Περιγραφείς σχήματος 575.570 285 64 Tree leaves Data retrieval Classification Image databases Shape descriptors Features extraction
30	Σχεδίαση δικτυακής πύλης θεατρικής ομάδας Γιαννακάς, Φίλιππος 13 September 2011 (has links) Αντικείμενο της διπλωματικής εργασίας είναι η ανάπτυξη μιας δικτυακής πύλης της Θεατρικής Ερασιτεχνικής Ομάδας του Πανεπιστημίου Πατρών. Επόμενος στόχος είναι η σχεδίαση και η υλοποίηση ενός πρωτοτύπου περιβάλλοντος που περιλαμβάνει εργαλεία για την αποθήκευση, διαχείριση και επεξεργασία των δεδομένων από προηγούμενες θεατρικές παραστάσεις. Συγκεκριμένα, το περιβάλλον αυτό θα πρέπει να παρέχει τις παρακάτω λειτουργίες: • ιστορικό παραστάσεων • διαχείριση πληροφορίας • αναζήτηση Για το σκοπό αυτό χρησιμοποιήθηκε το εργαλείο ανάπτυξης εφαρμογών διαδικτύου (PHP), βάση δεδομένων (MySQL) και το εργαλείο διαχείρισης περιεχομένου (Content Management) Mod-X Revolution. / -- Ιστότοποι Τεχνολογία ροής Βάσεις δεδομένων Θεατρικές ομάδες Βίντεο 005.72 Websites Modx revolution Databases Theatre groups Deep video linking Video taging Video streaming Pseudostreaming

Search results