Global ETD Search

11	PhytoKaryon : μία κυτταρολογική βάση δεδομένων των φυτών της Ευρώπης και της Μεσογείου : αξιοποίηση και παρουσίαση δεδομένων. I Σταυρόπουλος, Πέτρος 03 May 2010 (has links) Δημιουργία του ιστότοπου της κυτταρολογικής Βάσης Δεδομένων Φυτών PhytoKaryon, η οποία περιέχει καρυολογικά δεδομένα των φυτών της Μεσογείου και της Ευρώπης. Υλοποιήθηκε σε περιβάλλον PHP, MySQL και Apache Server. Παρουσιάζει τα αποτελέσματα της αξιοποίησης της Βάσης Δεδομένων από την πλευρά του διαχειριστή του Ιστότοπου. / The creation of the site of the cytologic Plants' Data Base PhytoKaryon, which contains karyological data of plants of Mediterranean and Europe. It was implemented in PHP, MySQL and Apache Server environment. It presents the results of exploitation of Data Base from the side of site's administrator. Βάσεις δεδομένων Κυτταρολογία Βιολογία Φυτά Καρυότυπος 581.902 85 Phytokaryon Databases Kytarology Biology PHP MySQL Plants Karyotype
12	Δόμηση υπολογιστικού μηχανισμού πρόβλεψης της δράσης και των παρενεργειών των νευροψυχιατρικών φαρμάκων Σολωμού, Αναστασία 20 September 2010 (has links) Στην καθημερινή ιατρική πρακτική υπάρχουν δυσκολίες κατά την επιλογή του κατάλληλου θεραπευτικού σχήματος που ωφελεί ατομικά τον ασθενή, ο οποίος αποτελεί μία ξεχωριστή και μοναδική οντότητα. Η διαδικασία που ακολουθεί ένα φάρμακο από τη στιγμή που λαμβάνεται ακολουθεί τους κανόνες της φαρμακοκινητικής και φαρμακοδυναμικής, που με τη σειρά τους εξαρτώνται από παράγοντες όπως είναι η ηλικία, το φύλο, το περιεχόμενο του γαστρεντερικού σωλήνα (ΓΕΣ), ο τρόπος ζωής του ατόμου, οι συνήθειές του, οι συμπαρομαρτούσες νόσοι καθώς και άλλα φάρμακα που μπορεί να συγχορηγούνται. Οι μοριακοί μεσολαβητές όλων αυτών των παραγόντων υπόκεινται σε διακύμανση που απορρέει από την ύπαρξη γενετικών πολυμορφισμών. Γενετικοί πολυμορφισμοί σε γονίδια που κωδικοποιούν πρωτεΐνες-μεταφορείς διαδραματίζουν πολύ σημαντικό ρόλο. Οι παράγοντες αυτοί συνολικά επηρεάζουν την «τύχη» του φαρμάκου στον οργανισμό μέσω προαγωγής ή αναστολής μεταφορέων του τοιχώματος του ΓΕΣ, μέσω μεταβολής του pH ή της βακτηριακής χλωρίδας, μέσω αναστολής ή προαγωγής του μεταβολισμού του στο ήπαρ ή και μέσω της επιρροής της απέκκρισης και της κατανομής του φαρμάκου. Όσον αφορά την φαρμακοδυναμική, δηλαδή το αποτέλεσμα του ιδίου του φαρμάκου στον οργανισμό, επίσης εξαρτάται από τους παραπάνω παράγοντες όπως η ηλικία, το φύλο, συνοδές παθήσεις, άλλα φάρμακα ή χημικές ουσίες (που τυχόν δρουν ως ανταγωνιστές της θέσης δράσης) και φυσικά, οι γενετικοί πολυμορφισμοί των υποδοχέων θέσεων δράσης. Στην ιατρική πράξη και κατά τη συνταγογράφηση πρέπει να λαμβάνονται υπόψη όλα τα προαναφερθέντα στοιχεία. Φυσικά, η πολυπλοκότητα αυτού κάνει κάτι τέτοιο να φαίνεται αδύνατο για έναν ιατρό. Για το λόγο αυτό, θα επιχειρηθεί ο θεωρητικός σχεδιασμός ενός υπολογιστικού συστήματος-λογισμικού που θα υλοποιήσει τον μέχρι τώρα ακατόρθωτο συνδυασμό όλων αυτών των αποσπασματικών παραμέτρων που επηρεάζουν την δράση των φαρμάκων και συγκεκριμένα των νευροψυχιατρικών. Η υλοποίηση ξεκινά με τη συλλογή των δεδομένων που στο εξής ονομάζονται παράμετροι-μεταβλητές του συστήματος και των οποίων ο συνδυασμός θα δίνει το αναμενόμενο αποτέλεσμα της χρήσης ενός νευροψυχιατρικού φαρμάκου σε κάθε ασθενή ξεχωριστά, αναλόγως της ηλικίας, του φύλου, του τρόπου ζωής, τις συνοδές παθήσεις, συγχορηγούμενα φάρμακα και τυχόν γνωστών γενετικών πολυμορφισμών. Το σύστημα θα είναι έτσι σχεδιασμένο, ώστε ανά πάσα στιγμή θα μπορούν να διοχετευθούν νέα δεδομένα, ανάλογα με την πρόοδο της έρευνας. Στο μέλλον, θα μπορούσε η μελέτη αυτή να θέσει τις βάσεις για ένα πλήρες σύστημα πρόβλεψης της δράσης όλων των κατηγοριών των φαρμάκων για τον ξεχωριστό ασθενή με απώτερο σκοπό την αποτελεσματικότερη και ασφαλέστερη ατομική θεραπεία. / - Φαρμακοδυναμική Φαρμακοκινητική 615.1 Prediction neuropsychiatric drug action Patient databases
13	Ανάπτυξη παραθυρικής εφαρμογής εισαγωγής στοιχείων και διαχείρισης βάσης δεδομένων αρχέγονων αιμοποιητικών κυττάρων Τσολάκος, Σταύρος 02 February 2011 (has links) Οι βάσεις δεδομένων αποτελούν, πλέον, επιτακτική ανάγκη για την οργάνωση, αποθήκευση και γρήγορη ανάκτηση δεδομένων, αλλά και την εξαγωγή συμπερασμάτων μέσα από διαδικασίες στατιστικής επεξεργασίας, στα πλαίσια της αξιοποίησης του τεράστιου όγκου πληροφορίας που ήδη υπάρχει αλλά και εξακολουθεί να παράγεται με εξαιρετικά γρήγορους ρυθμούς στην ιατροβιολογική έρευνα και εν προκειμένω στο πεδίο των λήψεων και των μεταμοσχεύσεων αρχέγονων αιμοποιητικών κυττάρων. Ωστόσο, για την εύκολη πρόσβαση στις πληροφορίες αυτές, απαιτούνται εξειδικευμένες εφαρμογές οι οποίες κρατούν μακρυά την πολυπλοκότητα των βάσεων δεδομένων από τον τελικό χρήστη, προσφέροντας ένα απλό και φιλικό περιβάλλον διαχείρισης. Το θέμα της εργασίας αυτής είναι η ανάπτυξη μιας τέτοιας εφαρμογής, με το όνομα “AutoStem”. Η εφαρμογή αναπτύχθηκε με τη γλώσσα προγραμματισμού Python, με τη βοήθεια των βιβλιοθηκών wxPython για την δημιουργία του διαδραστικού γραφικού περιβάλλοντος, storm για την επικοινωνία με τη βάση δεδομένων και matplotlib για τη δημιουργία υψηλής ποιότητας γραφημάτων. / Databases constitute nowadays imperative tool for the organization, storage, rapid data recovery and statistical analysis in the field of the modern managing and exploitation of the huge volume of information that already exists and continues to be produced extremely fast. The databases are extremely useful in the management of bioinformation of medicine and biology both in daily diagnostics as well as research. The present study is concentrated in the application of databases in the blood stem cells collections and transplantations. However, sophisticated and specialized applications are required in order to for them be easily accessed. Applications that hide their native complexity, offering an easy to use, intuitive and friendly management environment. The subject of the present thesis is the development of such an application, named “AutoStem”. The application was developed using the Python programming language, using the wxPython GUI library, the storm library for communicating with the database and the matplotlib for creating high quality graphs. Βάσεις δεδομένων Μεταμοσχεύσεις Αιμοποιητικά κύτταρα 617.954 028 5 Databases Transplantations Stem cells
14	Κατασκευή ηλεκτρονικού οδηγού και βάσης δεδομένων για την διάδοση της μουσικής παράδοσης "Δρόμοι της μουσικής παράδοσης" Νούλας, Γεώργιος 21 December 2011 (has links) Η παρούσα διπλωματική έχει σκοπό τον σχεδιασμό και κατασκευή ηλεκτρονικού καταλόγου και βάσης δεδομένων για την οργάνωση και διαχείριση αρχείου μουσικής ελληνικής παράδοσης και σχετικού περιεχομένου και την έκδοσή του στον παγκόσμιο ιστό. Μέσα από την διπλωματική αυτή προτείνεται ένας τρόπος για την αποθήκευση της μουσικής πληροφορίας στο διαδίκτυο, το σχετικό υλικό που θα πρέπει να συνοδεύει ένα τραγούδι, τον τρόπο παρουσίασης του υλικού αυτού στον χρήστη της εφαρμογής, τις λειτουργίες αναζήτησής της και τον τρόπο αναπαραγωγής της. Για τις ανάγκες της διπλωματικής έγινε και προτείνεται κατηγοριοποίηση των τραγουδιών με βάσης το είδος τους , δηλαδή το θέμα τους, και με βάση τον ρυθμό τους, δηλαδή της μουσικής τους. Επίσης προτείνεται και κατηγοριοποίηση για τα άρθρα. Οι δύο παραπάνω κατηγοριοποιήσεις αφορούν αποκλειστικά το ελληνικό δημοτικό τραγούδι. Επίσης προτείναμε δομή ιστοσελίδας του WWW για την διάδοση την μουσικής παράδοσης που θα είναι φιλική για τον μέσο χρήστη του internet και θα κρατάει το ενδιαφέρον του. Στα πλαίσια της διπλωματικής αυτής εργασίας δημιουργήθηκε ο πληρέστερος στο διαδίκτυο οδηγός παραδοσιακής μουσικής της Πελοποννήσου και της Στερεάς Ελλάδας. Ωστόσο με ένα επιπλέον σύστημα που δημιουργήθηκε είναι δυνατή η προσθήκη επιπλέον υλικού από χρήστες που θα καλύψει όλες τις περιοχές της χώρας μας. / The current work is about a e-catalogue for the greek traditional music. It is a user centered WWW aplication and belongs to the Arcadia Project at C.E.I.D. Βάσεις δεδομένων Διαδίκτυο 780.285 467 8 Greek traditional music Databases Internet
15	Ανάπτυξη ολοκληρωμένου συστήματος εξόρυξης και οπτικοποίησης γνώσης από βιολογικά δεδομένα Γκαντούνα, Βασιλική 25 January 2012 (has links) Στα τέλη του 20ου αιώνα, οι παράλληλες εξελίξεις και η ανάπτυξη καινοτόμων μεθόδων και εργαλείων σε διαφορετικές ερευνητικές περιοχές είχε ως αποτέλεσμα την εμφάνιση των λεγόμενων "αναδυόμενων τεχνολογιών" (emerging technologies). Σε αυτό το πλαίσιο λοιπόν, των αναδυόμενων τεχνολογιών, εμφανίστηκε στο προσκήνιο η επιστήμη της Βιοπληροφορικής (Bioinformatics) η οποία αποτελεί την τομή των επιστημών της βιολογίας και της πληροφορικής. Η ραγδαία ανάπτυξη της τεχνολογίας έχει οδηγήσει στην εκρηκτική αύξηση του ρυθμού παραγωγής βιολογικών δεδομένων, γεγονός που καθιστά επιτακτική την ανάγκη της αποδοτικής και αποτελεσματικής διαχείρισης τους. Για την κάλυψη αυτής ακριβώς της ανάγκης δημιουργήθηκαν οι βιολογικές βάσεις δεδομένων που έχουν σήμερα εξαιρετική δυναμική και περιθώρια εφαρμογών. Οι βασικοί τομείς έρευνας στο πλαίσιο των βιολογικών βάσεων δεδομένων μπορούν να ταξινομηθούν σε τρεις μεγάλες κατηγορίες. Η πρώτη κατηγορία αφορά στην όσο το δυνατόν πιο αποδοτική οργάνωση των βιολογικών δεδομένων ώστε να είναι δυνατή η αποτελεσματική αποθήκευση τους. Αυτός ακριβώς είναι και ο λόγος δημιουργίας των βιολογικών βάσεων δεδομένων. Η δεύτερη κατηγορία αφορά στην ανάπτυξη εργαλείων και μεθόδων που επιτρέπουν την ανάλυση και την επεξεργασία των βιολογικών δεδομένων έτσι ώστε να διευκολυνθεί η διαδικασία ανακάλυψης γνώσης από αυτά. Σε αυτή την κατηγορία, σημαντικό ρόλο παίζουν οι τεχνικές εξόρυξης γνώσης οι οποίες εφαρμόζονται πάνω σε μεγάλες συλλογές βιολογικών δεδομένων και συνήθως οδηγούν στην ανακάλυψη νέων σχέσεων και προτύπων που κρύβονται ανάμεσα στα δεδομένα. Τέλος, η τρίτη κατηγορία αφορά στην ανάπτυξη εργαλείων που διευκολύνουν την διαδικασία της βιολογικής ερμηνείας των αποτελεσμάτων της εξόρυξης. Εδώ, ουσιαστικό ρόλο κατέχουν οι τεχνικές οπτικοποίησης της παραγόμενης γνώσης για την όσο το δυνατόν πιο κατανοητή παρουσίαση των συμπερασμάτων στον άνθρωπο ο οποίος στην συνέχεια θα επιλέξει ποια από αυτά είναι πραγματικά χρήσιμα. Η δημιουργία ενός ολοκληρωμένου συστήματος που θα αποτελεί τον απότοκο της τεχνολογικής σύζευξης των τεχνικών των τριών παραπάνω κατηγοριών σε συνδυασμό με την ανάγκη αξιοποίησης μιας μέχρι πρότινος ανεκμετάλλευτης μεγάλης συλλογής βιολογικών δεδομένων αποτέλεσαν το κίνητρο για την εκπόνηση της παρούσας διπλωματικής εργασίας. Στόχος της εργασίας είναι η ανάπτυξη ενός ολοκληρωμένου συστήματος το οποίο χρησιμοποιώντας την τεχνολογία Microsoft PivotViewer θα απεικονίζει την παραπάνω συλλογή δεδομένων προσφέροντας ένα υψηλό επίπεδο αναπαράστασης και θα καταγράφει τις συχνότητες εμφάνισης των μεταλλάξεων και άλλων γενετικών παραλλαγών ανά πληθυσμιακές ομάδες σε παγκόσμια κλίμακα. Το σύστημα αυτό θα μπορεί να λειτουργήσει ως ένα σύγχρονο εκπαιδευτικό και διαγνωστικό εργαλείο για την πληθυσμιακή μελέτη της παθογένειας και της θεραπείας ασθενειών που οφείλονται σε κάποια γενετική διαταραχή. Ο χρήστης διαμέσου ενός εύχρηστου και φιλικού περιβάλλοντος διεπαφής θα μπορεί να εστιάσει από μια μεγάλη συλλογή δεδομένων σε ένα εξειδικευμένο υποσύνολό της που ενδεχομένως σχετίζεται με μία συγκεκριμένη ασθένεια, μία συγκεκριμένη μελέτη ή έναν συγκεκριμένο πληθυσμό παρατηρώντας έτσι τα δεδομένα αυτά από μια διαφορετική οπτική γωνία που ενδεχομένως να τον βοηθήσει να ανακαλύψει νέα πρότυπα και σχέσεις ανάμεσα τους αξιόλογης βιολογικής σημασίας. / In the late 20th century, parallel advances and the development of innovative methods and tools in different research areas resulted in the appearance of the so-called "emerging technologies". In the framework of emerging technologies, the science of Bioinformatics came to the fore which is the intersection of the sciences of biology and informatics. The rapid growth of technology has led to the explosive increase in the rate of production of biological data, which dictates the need for efficient and effective data management. Biological databases have been created to satisfy exactly this need and they have extremely dynamic and potential applications today. The main research areas in biological databases can be classified into three broad categories. The first category concerns the better organization of the biological data so as to enable efficient storage. This is the reason for the development of the biological databases. The second category concerns the development of tools and methods that allow analysis and processing of biological data to facilitate the process of discovering knowledge from them. In this category, data mining techniques play an important role. They are applied over large collections of biological data and often lead to the discovery of new relationships and patterns that lie between the data. Finally, the third category involves the development of tools that facilitate the process of understanding and visualizing the biological meaning of the data mining results. Here, the visualization techniques have an essential role in presenting the data mining results in a meaningful way to the scientists who will eventually decide which of these results are really useful and reliable. The development of an integrated system which will be the result of the technological coupling of the three above categories in conjunction with the need of utilization a previously unexploited large collection of biological data was the motivation for the elaboration of this thesis. This work aims to develop an integrated system which represents the above collection providing a high level visualization and records the frequencies of causative genetic variations worldwide by utilizing the Microsoft PivotViewer technology. This system can serve as a modern educational and diagnostic tool for the population-based study of the pathogenesis and treatment of diseases caused by a genetic disorder. The user through a user-friendly interface can zoom in from the massive amounts of data to particular disease-specific, study-specific, or population-specific data so that he can begin observing the data from a different perspective that may enable him to discover new patterns and relationships between them of remarkable biological importance. Εξόρυξη δεδομένων 572.802 85 Biological databases Data mining
16	Σχεδιασμός και ανάπτυξη προσαρμοζόμενου συστήματος για την διδασκαλία του μαθήματος Βάσεις δεδομένων Ξηροτύρης, Νικόλαος 19 October 2012 (has links) Ο στόχος της παρούσας διπλωματικής εργασίας είναι η παρουσίαση της χρησιμότητας του ηλεκτρονικού υπολογιστή στην εκπαιδευτική διαδικασία, η ευρεία χρήση των βάσεων δεδομένων στον σύγχρονο κόσμο καθώς και η μελέτη των λειτουργικών περιοχών μίας βάσης δεδομένων. Επίσης, παρουσιάζεται ο τρόπος με τον οποίο οργανώνονται τα δεδομένα μιας βάσης δεδομένων στο σκληρό δίσκο και η χρησιμότητα των ευρετηρίων. Στο πρώτο κεφάλαιο, γίνεται μια εισαγωγή στην χρησιμότητα του ηλεκτρονικού υπολογιστή στην καθημερινότητα μας και κυρίως, στην εισβολή του στην εκπαιδευτική διαδικασία. Παρουσιάζονται κάποια κύρια στοιχεία που κάνουν τον Η/Υ απαραίτητο - πλέον - στην εκπαίδευση, οι τρόποι με τους οποίους μπορεί να χρησιμοποιηθεί στην εκπαίδευση και φυσικά η μεγάλη συμβολή της συνεργατικής μάθησης με την βοήθεια των ηλεκτρονικών υπολογιστών. Στο δεύτερο κεφάλαιο, αναφέρεται η γενική ιδέα των Βάσεων Δεδομένων, η εξέλιξή τους και κάποια ιστορικά στοιχεία. Στη συνέχεια παρουσιάζονται τα βασικά στοιχεία της δομής των βάσεων δεδομένων και οι λειτουργικές περιοχές τους (αρχιτεκτονική, μοντέλα, γλώσσες, ασφάλεια). Στο τρίτο κεφάλαιο, ασχολούμαστε με την αποθήκευση των βάσεων δεδομένων, κυρίως σε δευτερεύοντα αποθηκευτικά μέσα, όπως ο σκληρός δίσκος. Αναφέρονται τα επιμέρους στοιχεία ενός σκληρού δίσκου και τον τρόπο με τον οποίο αποθηκεύονται τα δεδομένα σε μορφή εγγραφών, τοντρόπο οργάνωσης και διάταξης των εγγραφών σε αρχεία καθώς και περιληπτικά η μέθοδος του κατακερματισμού. Στο τέταρτο κεφάλαιο, παρουσιάζεται η δομή των ευρετηρίων για την διάταξη των εγγραφών σε ένα αρχείο. Αναφέρονται οι βασικοί τύποι ευρετηρίων (πρωτέυον, δευτερεύον, συστάδων και πολυεπίπεδο) καθώς και τα δυναμικά πολυεπίπεδα ευρετήρια με την χρήση Β-δένδρων και Β+-δένδρων. Στο πέμπτο κεφάλαιο, παρουσιάζεται μία εφαρμογή των ευρετηρίων σε μία δειγματική βάση δεδομένων (Sakila), η οποία χρησιμοποιείται για εκπαιδευτικούς σκοπούς. Συντάσσονται ερωτήματα SQL με την βοήθεια εντολών δημιουργίας ευρετηρίων, ώστε να δειχθεί και πειραματικά ότι τα ευρετήρια είναι μία πολύ καλή μέθοδος μείωσης του χρόνου αναζήτησης, ειδικά σε μία βάση με πάνω από 1000-2000 εγγραφές. / The aim of the present thesis is to show the utility of computers in education, the widespread use of databases in the modern world and the study of the functional areas of a database. It is also presented the way the data are organized in a database on the hard disk and the structure of indexes. The first chapter includes an introduction to the usefulness of the personal computer to our everyday life and especially, in its invasion in the educational process. There are presented some key elements that make the PC necessary in education, the ways in which it can be used in education and of course the great contribution of collaborative learning with the help of computers. The second chapter refers to the concept of databases, their development and some historical data. Also, there are presented the basic elements of the structure of databases and their functional areas (architecture, models, languages, security). The third chapter deals with the storage of databases, particularly in a secondary storage media, such as the hard disk. There are indicated the components of a hard disk and how the data is stored in records, the organization and provision of records in files and briefly the method of hashing. The fourth chapter presents the structure of indexes for the order of the records in a file. The basic types of indexes are described (primary, secondary, clustering and multilevel), as well as, the dynamic multi-level indexes using B-trees and B+-trees. The fifth chapter presents an application of indexes in a sample database (Sakila), which is used for educational purposes. SQL queries are drafted with the help of create indexes command, in order to show – experimentally - that the indexes are a great way to reduce search time, especially, in a database which contains over 1000-2000 records. Ευρετήρια Βάσεις δεδομένων Σκληροί δίσκοι 371.334 Indexes Databases Hard discs Sakila
17	Αποδοτική οργάνωση και διαχείριση πολυδιάστατων αντικειμένων για την ανακάλυψη γνώσης Κροτοπούλου, Αικατερίνη 11 January 2011 (has links) Ο σκοπός αυτής της διατριβής είναι η ανεύρεση μεθόδων αποδοτικής οργάνωσης και διαχείρισης πολυδιάστατων αντικειμένων (multi-dimensional objects) προκειμένου να ανακαλυφθεί χρήσιμη γνώση. Αρχική αφορμή για αυτή τη μελέτη αποτέλεσαν οι ανάγκες μιας απαιτητικής εφαρμογής με σκοπό τη χαρτογράφηση του ανθρώπινου εγκεφάλου προκειμένου να εντοπιστούν επιληπτικές εστίες. Οι απαιτήσεις Αναπαράστασης και Διαχείρισης των Δεδομένων του Εγκεφάλου, έφεραν στην επιφάνεια δύο κεντρικά ερευνητικά προβλήματα: - Τις ιδιαιτερότητες των πολύπλοκων, μη-ομοιογενών, δικτυακών μερικές φορές, τρισδιάστατων αντικειμένων (τμημάτων του εγκεφάλου – brain objects). - Την ανάγκη για αποτελεσματική διαχείριση-χρήση γνωστών αλλά και παραγόμενων εξαρτήσεων δεδομένων και γνώσης (data and knowledge dependencies), η οποία μπορεί να αναβαθμίσει την απόδοση και τη δυναμική της εφαρμογής. Το μεγαλύτερο μέρος της μελέτης που αφορούσε αυτό το πρόβλημα, οδήγησε σε : - Διερεύνηση θεμάτων ανεύρεσης ομοιοτήτων (similarity search). Καθώς η συγκεκριμένη περιοχή διαθέτει μεγάλο εύρος εφαρμογών αλλά και ανοικτών προβλημάτων, αποτέλεσε τελικά μεγάλο μέρος της παρούσας διατριβής. Δεδομένου ότι πολλά από τα γεωμετρικά χαρακτηριστικά των δεδομένων αλλά και από τις εξαρτήσεις γνώσης που αφορούν τον ανθρώπινο εγκέφαλο, συναντώνται – καθ’ολοκληρία ή τμηματικά – σε πλήθος σύγχρονων πολυμεσικών (multimedia) εφαρμογών, τα παραπάνω προβλήματα εντάσσονται στα βασικά προβλήματα της έρευνας του τομέα των Βάσεων Δεδομένων. Επικεντρώνοντας την έρευνά στα παραπάνω προβλήματα, καταλήξαμε: • στον ορισμό νέων ευέλικτων τύπων δεδομένων, εννοιών και μοντέλων καθώς και εργαλείων και μεθόδων ταξινόμησης δεδομένων και γνώσης (βάση δεδομένων BDB και μοντέλα 3D-IFO και MITOS) οι οποίες οργανώνουν πιο ευέλικτα και αποδοτικά τα δεδομένα μας, με τρόπους που όχι μόνο κάνουν την πρόσβασή τους ευκολότερη αλλά αξιοποιούν παράλληλα τις ‘κρυμμένες’ μεταξύ τους σχέσεις για την άντληση επιπλέον γνώσης. • στον ορισμό νέων μεθόδων και δέντρων αναζήτησης, για : o τον αποδοτικό εντοπισμό τμηματικών ομοιοτήτων (partial similarity) ανάμεσα σε πολυδιάστατα αντικείμενα (Lui k-n-match και INTESIS) o την εξάλειψη της μεγάλης πτώσης της απόδοσης των δέντρων με την αύξηση των διαστάσεων των αντικειμένων (‘dimensionality curse’) (δομή Digenis). o την ανεύρεση χαρακτηριστικών/διαστάσεων με παρόμοια εξέλιξη στην πορεία του χρόνου – για πολυδιάστατα κυρίως αντικείμενα – με σκοπό τη μελέτη πιθανής αλληλεπίδρασής τους. Γενικά, η παρούσα μελέτη αποτελείται από δύο βασικά μέρη, τα οποία αναφέρονται σε δύο περιοχές με μεγάλη αλληλεπίδραση:  Τη Μοντελοποίηση σε Πολυμεσικές Βάσεις Δεδομένων  Την Αναζήτηση Ομοιοτήτων ανάμεσα σε Πολυδιάστατα Αντικείμενα Στο πρώτο κεφάλαιο αρχικά παρουσιάζεται το πρόβλημα της χαρτογράφησης του ανθρώπινου εγκεφάλου για τον εντοπισμό επιληπτικών εστιών, απ’όπου εγείρονται τα πρώτα προβλήματα αναπαράστασης και οργάνωσης τριδιάστατων αντικειμένων πολύπλοκης δομής και λειτουργικών σχέσεων και εξαρτήσεων μεταξύ τους. Σε μια πρώτη προσέγγιση προτείνεται το λογικό μοντέλο BDB (Brain Data Base) όπου εισάγονται νέοι τύποι οντοτήτων. Εδώ, ιδιαίτερο ενδιαφέρον παρουσιάζει η προσθήκη της ιεραρχικής διάταξης στο Σχεσιακό Μοντέλο, προκειμένου οι περιοχές του εγκεφάλου να οργανωθούν με βάση την πιθανότητα εμφάνισης επιληπτικής εστίας έτσι ώστε να βελτιώνονται στατιστικά οι χρόνοι ανάκτησής τους. Στη συνέχεια, η μελέτη επεκτείνεται σε άλλα – επόμενης γενιάς - είδη μοντέλων. Πιο συγκεκριμένα, οι ανάγκες της εφαρμογής μελετώνται με βάση ένα Σημαντικό (semantic model) - το μοντέλο IFO - και ένα Αντικειμενοστραφές Μοντέλο (object oriented model), με αποτέλεσμα τη δημιουργία των μοντέλων 3D-IFO και MITOS αντίστοιχα. Στο 3D-IFO εισήχθησαν νέοι τύποι δεδομένων προκειμένου να υποστηριχθούν αποδοτικά τα ιδιαίτερα δεδομένα μας καθώς και νέοι τελεστές για την καλύτερη διαχείριση των σύνθετων δεδομένων. Επιπλέον, εισήχθη ένας νέος constructor και ένα κατάλληλο πεδίο για την υποστήριξή του, προκειμένου να υποστηριχτεί η αναπαράσταση της διάταξης των μερών του εγκεφάλου με βάση κάποιο κριτήριο έτσι ώστε να διευκολυνθεί η μελλοντική απλή και συνδυαστική ανάκτηση πληροφορίας. Τέλος το αντικειμενοστραφές μοντέλο MITOS, εισάγει πάλι ένα νέο μοντέλο δεδομένων (MITOS Data Model - MDM) το οποίο συνεργάζεται με μία νέα γλώσσα ερωτημάτων (MITOS Query Language - MQL). Το μοντέλο MITOS εισάγει διάφορες καινοτομίες οι οποίες εξυπηρετούν μια περισσότερο εκφραστική και έξυπνη αναπαράσταση και διαχείριση πολυδιάστατων δεδομένων και γνώσης. Η μία από αυτές τις καινοτομίες είναι ο ορισμός ενός ακόμη βασικού χαρακτηριστικού των αντικειμένων (object characteristic), της σχέσης τους με το περιβάλλον, απεγκλωβίζοντάς την από την κατάσταση ή τη συμπεριφορά, όπου αποδυναμώνεται σαν έννοια. Η δεύτερη καινοτομία του MITOS η οποία αφορά την MQL σχετίζεται με την εισαγωγή ‘κλειδιού’ στους κανόνες (rules). Η διερεύνηση αυτής της δυνατότητας – η ιδέα προέρχεται από το χώρο των Βάσεων Δεδομένων – οδηγεί πράγματι σε ένα είδος κλειδιού, κατά την έννοια που θα μπορούσε να έχει στις Βάσεις Γνώσης και η οποία δεν μπορεί να είναι ακριβώς ίδια με την αντίστοιχη των Βάσεων Δεδομένων, λόγω των ειδοποιών διαφορών των δύο Βάσεων. Στο δεύτερο κεφάλαιο μελετάται η αναζήτηση ενός ελάχιστα διερευνημένου είδους ομοιότητας ανάμεσα σε πολυδιάστατα κυρίως αντικείμενα, της τμηματικής ομοιότητας (partial similarity). Η τμηματική ομοιότητα σε αντίθεση με τον ιδιαίτερα διερευνημένο τύπο της πλήρους ομοιότητας (full similarity), αναφέρεται σε πραγματικές ομοιότητες οι οποίες δεν είναι πλήρεις. Κι αυτό συμβαίνει γιατί ένα πολύ συνηθισμένο σενάριο κατά τη διερεύνηση ομοιοτήτων είναι το ακόλουθο: Συνήθως η ανεύρεση πλήρους ομοιότητας βασίζεται σε υπολογισμό αποστάσεων, όπως η Ευκλείδεια απόσταση, οι οποίες είναι συνάρτηση όλων των διαστάσεων των εμπλεκομένων αντικειμένων. Όταν λοιπόν υπάρχουν διαστάσεις με μεγάλες διαφορές, ακόμη κι αν είναι λίγες, αυξάνουν αρκετά την υπολογιζόμενη απόσταση έτσι ώστε οι αποστάσεις τέτοιων αντικειμένων που στην πραγματικότητα μπορεί να είναι όμοια, να καταλήγουν να έχουν μεγάλες τιμές και συνεπώς να μην ανιχνεύεται η ομοιότητά τους (π.χ. όμοια αντικείμενα με πολύ διαφορετικό χρώμα). Από την άλλη πλευρά, για αντικείμενα τα οποία διαφέρουν λίγο σε κάθε διάσταση (π.χ. λίγο διαφορετικό χρώμα, σχήμα, προσανατολισμό κ.λ.π.) και καταλήγουν να είναι στην πραγματικότητα συνολικά πολύ διαφορετικά, η υπολογιζόμενη μεταξύ τους απόσταση έχει μικρή τιμή, οπότε ανιχνεύονται σαν όμοια, χωρίς να είναι. Οι περισσότερες εργασίες οι οποίες έχουν μελετήσει την τμηματική ομοιότητα, έχουν εστιάσει σε γεωμετρικά δεδομένα. Η εργασία που επεκτείνεται σε πολυδιάστατα αντικείμενα γενικά, είναι η εργασία των Koudas et al., (VLDB 2006) και έχει οδηγήσει σε αξιόλογα αποτελέσματα στο θέμα της τμηματικής ομοιότητας. Εισάγει τις αποδοτικές μεθόδους k-n-match και frequent k-n-match, οι οποίες επιστρέφουν k αντικείμενα, όμοια με τα δοθέντα όχι σε όλες αλλά σε n διαστάσεις, αποφεύγοντας έτσι εκείνες τις λίγες διαστάσεις με τις μεγάλες διαφορές, οι οποίες οδηγούν σε παραπλανητικά αποτελέσματα. Παρόλ’αυτά αυτές οι μέθοδοι κρύβουν κάποιες αδυναμίες οι οποίες τελικά οδηγούν είτε σε ανεύρεση πλήρους ομοιότητας (όταν τελικά ληφθούν υπ’όψιν όλα τα n), είτε σε μία κατά περίπτωση μόνο (και σχεδόν τυχαία) ανίχνευση τμηματικής ομοιότητας (με τα κατάλληλα n’s τα οποία δεν πρέπει να είναι ούτε πολύ μεγάλα ούτε πολύ μικρά, αλλά δεν ορίζονται από κάποιο τύπο ή μέθοδο). Βασιζόμενοι σ’ αυτές τις μεθόδους, προτείνουμε δύο νέες τεχνικές οι οποίες όπως αποδεικνύεται μπορούν να εντοπίσουν πραγματικές τμηματικές ομοιότητες. Η πρώτη, η Lui k-n-match, επιτυγχάνει τον κατά προσέγγιση εντοπισμό των κατάλληλων n’s για τα k-n-matches, με τη βοήθεια της αλληλεπίδρασης με το χρήστη και του ελέγχου των αποδεκτών προτάσεων των k-n-matches. Πιο συγκεκριμένα, μέσω της μεθόδου k-n-match, προτείνεται για κάθε n ένα σύνολο αντικειμένων πιθανά όμοιων με το δεδομένο αντικείμενο του ερωτήματος (query object) . Ο χρήστης φιλτράρει αυτό το σύνολο, επιλέγοντας εκείνα τα αντικείμενα που θεωρεί πραγματικά όμοια με το δεδομένο. Αυτή η διαδικασία συνεχίζεται μέχρι αφού το n γίνει μεγαλύτερο από το ήμισυ των διαστάσεων των αντικειμένων, υπάρξει σύνολο προτεινόμενων αντικειμένων από το οποίο ο χρήστης δεν επιλέγει κανένα ως όμοιο . Μ’αυτόν τον τρόπο επιτυγχάνεται μεγαλύτερη εγκυρότητα των αποτελεσμάτων (λόγω της εμπλοκής του χρήστη) με περιορισμένο ταυτόχρονα αριθμό εκτελούμενων k-n-matches. Η δεύτερη μέθοδος (INTESIS) βασίζεται στην εξής παρατήρηση: στην ουσία όταν δύο αντικείμενα μοιάζουν αυτό συνήθως σημαίνει ότι μοιάζουν στα περισσότερα χαρακτηριστικά τους, καθένα από τα οποία αναπαριστάται και αντιπροσωπεύεται από ένα σύνολο (μικρό συνήθως) διαστάσεων-πεδίων του αντικειμένου. Εάν λοιπόν οριστεί από τους ειδικούς κάθε εφαρμογής αυτή η αντιστοιχία χαρακτηριστικών και διαστάσεων - δημιουργώντας υποσύνολα διαστάσεων - τότε μπορούν να συμβούν διαδοχικά τα παρακάτω: α) Να γίνει έλεγχος πλήρους ομοιότητας σε κάθε τέτοιο υποσύνολο διαστάσεων β) Να οργανωθούν αυτά τα υποσύνολα σε ισάριθμα ιεραρχικά δέντρα για την εύκολη και αποδοτική διαχείρισή τους. Η επιπλέον απλούστευση αυτής της επιλογής έγκειται στο ότι δεδομένου ότι τα εν λόγω υποσύνολα διαστάσεων θα είναι μικρά, είναι πολύ εύκολη η επιλογή δέντρου γι’ αυτά, αφού σχεδόν όλα τα ιεραρχικά δέντρα έχουν μεγάλη απόδοση όταν πρόκειται για μικρό αριθμό διαστάσεων. Συνεπώς ο αναλυτής της κάθε εφαρμογής μπορεί να χρησιμοποιήσει όποιο τέτοιο δέντρο κρίνει εκείνος σαν καλύτερο ( Το R-tree είναι η δική μας πρόταση). Τελικά, για να ολοκληρωθεί η διαδικασία πρέπει να έχει οριστεί ένας ελάχιστος αριθμός απαιτούμενων όμοιων χαρακτηριστικών προκειμένου να θεωρηθούν δύο αντικείμενα όμοια. Για την αξιολόγηση αυτής της μεθόδου, πρέπει αρχικά να σημειωθεί ότι αναφέρεται σε συνολικό αριθμό διαστάσεων μικρότερο του 100 και συνεπώς σε σχετικά μικρό αριθμό δέντρων. Όπως είναι φανερό, σε μονο-επεξεργαστικό σύστημα οι τελικοί χρόνοι απόκρισης είναι το άθροισμα των χρόνων κάθε δέντρου. Λαμβάνοντας υπ’όψιν το ότι τα δέντρα λόγω του μικρού αριθμού διαστάσεων που αντιστοιχούν στο καθένα έχουν πολύ καλές αποδόσεις, βγαίνει εύκολα το συμπέρασμα ότι ο εκάστοτε τελικός χρόνος απόκρισης της μεθόδου - όντας ένα μικρό πολλαπλάσιο των πολύ μικρών χρόνων προσπέλασης των δέντρων - είναι αρκετά χαμηλός. Με δεδομένο ότι η χρήση κάθε δέντρου δεν προϋποθέτει την χρήση κάποιου άλλου πριν ή μετά, οι αναζητήσεις σε κάθε δέντρο μπορούν να γίνονται παράλληλα. Συνεπώς σε πολυεπεξεργαστικό σύστημα, ο συνολικός χρόνος απόδοσης μπορεί να μειωθεί σημαντικά, φτάνοντας μέχρι και το χρόνο που απαιτείται μόνο για αναζήτηση σε ένα δέντρο (όταν υπάρχουν τόσοι επεξεργαστές όσα και δέντρα). Φυσικά, εάν λάβει κανείς υπ’όψιν του ότι η τμηματική ομοιότητα αποτελεί ένα ιδιαίτερα απαιτητικό είδος τότε όχι μόνο οι χρόνοι απόκρισης σε πολυεπεξεργαστικό σύστημα αλλά και εκείνοι του συστήματος ενός επεξεργαστή, αποτελούν ικανοποιητικές αποδόσεις. Το τρίτο κεφάλαιο μελετά τη δυνατότητα δημιουργίας μιας νέας δομής η οποία δε θα ‘υποφέρει’ από τη μεγάλη πτώση της απόδοσης των δέντρων με την αύξηση των διαστάσεων των αντικειμένων (‘dimensionality curse’) ενώ ταυτόχρονα θα εξασφαλίζει καλή απόδοση και σε μικρό αριθμό διαστάσεων. Οι μέχρι τώρα μελέτες έχουν καταλήξει στο εξής συμπέρασμα: Τα γνωστά διαδεδομένα δέντρα αναζήτησης (είτε πρόκειται για δέντρα οργανωμένα βάση κατανομής χώρου (space partitioning) είτε για δέντρα βάση κατανομής δεδομένων (data partitioning)) αποδίδουν πολύ καλύτερα σε μικρό αριθμό διαστάσεων ενώ όσο αυτός ο αριθμός αυξάνει - ειδικά από 10 και πάνω – η απόδοση χειροτερεύει δραματικά. Το VA-File (σχήμα προσέγγισης διανύσματος) από την άλλη πλευρά - το οποίο είναι ένας απλός πίνακας-αρχείο γεωμετρικών προσεγγίσεων των αντικειμένων - με την αύξηση των διαστάσεων αποδίδει καλύτερα στην αναζήτηση ομοιοτήτων αλλά παρουσιάζει χαμηλή απόδοση σε μικρό αριθμό διαστάσεων. Προκειμένου να ξεπεραστεί αυτή η καθοριστική εξάρτηση της απόδοσης από το πλήθος των διαστάσεων των προς διαχείριση αντικειμένων, προτείνουμε τη νέα υβριδική δομή Digenis, η οποία παντρεύει τη λογική των δέντρων αναζήτησης με κείνη των VA αρχείων. Πιο συγκεκριμένα, ορίζεται και χρησιμοποιείται ένα στατικό παραμετροποιημένο δέντρο (δέντρο Digenis) σε εννοιολογικό επίπεδο ενώ σε φυσικό επίπεδο χρησιμοποιείται το αρχείο Digenis το οποίο κατασκευάζεται με βάση το δέντρο. Με αυτή τη συσχέτιση επιτυγχάνεται αναζήτηση σε μικρό μόνο μέρος του αρχείου κατά τη διαδικασία ανεύρεσης ομοιοτήτων ανάμεσα σε αντικείμενα πολλών αλλά και λίγων διαστάσεων, γεγονός που δίνει γενικότητα και ευελιξία στη μέθοδο. Πιο συγκεκριμένα, για το σχηματισμό του δέντρου, αρχικά ορίζονται οι οικογένειες αντικειμένων, οι οποίες αποτελούνται από αντικείμενα με μικρή απόσταση (βάση ενός προκαθορισμένου από τον εκάστοτε αναλυτή ορίου fl) και αντιπροσωπεύονται από το ‘μέσο’ αντικείμενο της οικογένειας (εάν δεν υπάρχει δημιουργείται για αυτό το ρόλο και μόνο). Κάθε κόμβος του δέντρου αντιπροσωπεύει-φιλοξενεί μία τέτοια οικογένεια. Το είδος των αποστάσεων που χρησιμοποιείται είναι η πλέον διαδεδομένη απόσταση, η Ευκλείδεια απόσταση, για την οποία ισχύει και η τριγωνική ανισότητα στην οποία θα βασιστεί μεγάλο μέρος της μεθόδου. Επίσης ένα δεύτερο όριο απόστασης (Lt) ορίζεται – από τον αναλυτή πάλι - σαν όριο με βάση το οποίο δύο αντικείμενα μπορούν να θεωρηθούν όμοια. Το δέντρο Digenis τελικά χτίζεται έχοντας ρίζα την πιο ‘κεντρική’ οικογένεια της περιοχής των αντικειμένων και κόμβους-παιδιά της τις ch πιο γειτονικές της οικογένειες, κάθε μία από αυτές έχει παιδιά της τις ch πιο γειτονικές της οικογένειες κ.ο.κ. Η δεδομένη ισχύ της τριγωνικής ανισότητας ανάμεσα στις Ευκλείδειες αποστάσεις των αντικειμένων-οικογενειών, αποδεικνύεται ένα χρήσιμο θεώρημα βάση του οποίου καθιστάται εφικτή η ασφαλής εξαίρεση μεγάλου μέρους του δέντρου από τους ελέγχους ομοιότητας, κατευθύνοντας τον τελικό έλεγχο σε μία μικρή περιοχή του. Αυτή η ανάλυση της αναζήτησης μέσα στο δέντρο είναι πολύ χρήσιμη σε ό,τι αφορά τη χρήση του αρχείου Digenis, όπου εκεί πραγματοποιείται η πραγματική αναζήτηση (φυσικό επίπεδο). Το αντίστοιχο αρχείο Digenis στο φυσικό επίπεδο σχηματίζεται εάν αντιστοιχίσουμε σε κάθε του εγγραφή έναν κόμβο του δέντρου, ξεκινώντας από τη ρίζα του δέντρου και περνώντας από κάθε επίπεδο, από αριστερά προς τα δεξιά. Με αυτή την αντιστοίχηση, μπορούν πολύ εύκολα να χρησιμοποιηθούν οι τεκμηριωμένες τεχνικές εύκολου, ασφαλούς και γρήγορου αποκλεισμού περιοχών. Ο απολογισμός της μεθόδου (θεωρητικά αλλά και πειραματικά) περιλαμβάνει θετικές και αρνητικές όψεις. Θετικές όψεις: • Το αρχείο έχει πολύ καλή απόδοση όταν διαχειριζόμαστε αντικείμενα πολλών διαστάσεων. Αυτό ήταν αναμενόμενο αφού το αρχείο λειτούργησε σαν ένα είδος VA αρχείου, όπου το ζητούμενο ήταν η δημιουργία συμπαγών γεωμετρικών προσεγγίσεων. Κι αυτό γιατί και η χρήση των οικογενειών επέφερε μία πρώτη ‘συμπίεση’ των δεδομένων αλλά και η προ-τακτοποίηση των αντικειμένων μέσω της εννοιολογικής χρήσης του δέντρου οδήγησε σε ένα είδος ομαδοποίησης γειτονικών αντικειμένων σε γειτονικές περιοχές. • Το αρχείο έχει επίσης καλές επιδόσεις και όταν διαχειριζόμαστε αντικείμενα λίγων διαστάσεων. Αυτό συμβαίνει γιατί σε σχέση με το αρχείο VA είναι αναμενόμενα καλύτερο αφού βασίζεται σε δενδρική διάταξη, ενώ για τον ίδιο λόγο είναι ανταγωνιστικό και των παραδοσιακών ιεραρχικών δέντρων. Αρνητικές όψεις: • Η στατικότητα στον ορισμό του αριθμού(ch) των παιδιών ανά κόμβο του δέντρου, δημιουργεί προβλήματα στην κατασκευή του, γιατί συνήθως οι πραγματικά όμοιες οικογένειες μπορεί είναι περισσότερες ή λιγότερες από ch. Αντιμετώπιση: Αν είναι περισσότερες, τοποθετούνται στο σύνολο των παιδιών οι ch κοντινότερες (με μικρότερες αποστάσεις από τον γονέα). Αν είναι λιγότερες, τότε ορίζεται ένα σχετικό όριο παιδιών και γεμάτων κόμβων στο δέντρο, πάνω από το οποίο τα παιδιά τοποθετούνται κανονικά στο δέντρο και οι υπόλοιποι κόμβοι μέχρι να συμπληρωθεί ο αριθμός παιδιών ch, συμπληρώνεται με κενούς κόμβους. Όταν όμως ο αριθμός των παιδιών μιας οικογένειας και οι υπόλοιποι γεμάτοι κόμβοι στο δέντρο είναι κάτω από αυτό το όριο, το αντίστοιχο προς δημιουργία δέντρο αποκόπτεται και δημιουργείται νέο μικρότερο δέντρο - με μικρότερο ch – ενώ το αρχικό δέντρο αναδιατάσσεται. Συνεπώς η τελική εφαρμογή μπορεί να περιλαμβάνει περισσότερα του ενός αρχεία Digenis, τα οποία κατά την αναζήτηση προσπελαύνονται από το μεγαλύτερο προς το μικρότερο, μέχρι να βρεθεί ομοιότητα (εάν υπάρχει). • Μπορεί να υπάρχουν απομακρυσμένες οικογένειες – να μη συνδέονται με καμία άλλη – οι οποίες δεν μπορούν να ενταχθούν σε κανένα δέντρο. Αντιμετώπιση: Δημιουργείται ένα Αρχείο Απομακρυσμένων (‘remote’ αρχείο) στο οποίο τοποθετούνται σειριακά οι απομακρυσμένες οικογένειες. Κατά την αναζήτηση αυτό το αρχείο προσπελαύνεται πρώτο, γιατί εφόσον εν γένει θα φιλοξενεί λίγες οικογένειες, η αναζήτηση σ’ αυτό θα είναι γρήγορη. Εάν υπάρχει ομοιότητα μεταξύ του αντικειμένου του ερωτήματος (query) και κάποιας οικογένειας του αρχείου, τότε έχει αποφευχθεί όλη η αναζήτηση στα δέντρα ενώ εάν πάλι δεν υπάρχει τέτοια ομοιότητα, λόγω του μικρού μεγέθους του αρχείου, η χρονική επιβάρυνση είναι σχεδόν αμελητέα. Στο τελευταίο κεφάλαιο εξετάζεται ένα είδος δυναμικής αναζήτησης ομοιότητας, το οποίο ασχολείται με τις χρονικές ακολουθίες όχι των ίδιων των αντικειμένων αλλά των πεδίων (χαρακτηριστικών) τους. Δηλαδή αυτό που ανιχνεύεται είναι το κατά πόσο μοιάζει η εξέλιξη δύο χαρακτηριστικών στο χρόνο, πληροφορία που μπορεί να σταθεί πολύ χρήσιμη σε πολλά είδη εφαρμογών (ιατρικές, οικονομικές, επιστημονικές γενικά, κλπ). Χρησιμοποιώντας ένα παράδειγμα ιατρικών δεδομένων που αφορούν ορμόνες, με τη βοήθεια της προτεινόμενης μεθόδου (Chiron) εντοπίζονται με αποδοτικό τρόπο όμοια ε / The subject of this dissertation is the invention of methods which assure effective organization and management of multi-dimensional objects in order to achieve knowledge discovery. The initial target behind this study was the needs of a demanding application intending to map the human brain in order to help the localization of epileptic foci. During the corresponding research, the Representation and Management needs of human brain data raised two core research problems:  The representation peculiarity of the composite, non-uniform, network structured three-dimensional objects(brain objects), and  The needs for effective management-use of known and derived data and knowledge dependencies, which can upgrade the application performance and dynamics. The most important part of our relative research, leaded to the: o Investigation of similarity search aspects. As this research area has great application and open problem width, it constitutes a great part of this dissertation. Taking into account that the certain geometrical and knowledge dependency features of human brain data are common – all or part of them - in many modern multimedia applications, the above problems are included in the basic Data Base research problems. Focusing our research in the above problems, we lead up to the:  Definition of new flexible data types, concepts, models, tools and data and knowledge ordering methods (Data Base BDB and models 3D-IFO and MITOS) which organize our data more flexibly and effectively, using methods that not only assure easier data access but also exploit their ‘hidden’ relationships and dependencies for more knowledge discovery.  Definition of new search trees and methods for: o Effective detection of partial similarity among multi-dimensional objects ( Lui k-n-match και INTESIS). o Obliteration of the high performance fall which occurs in similarity trees as dimensionality increases (‘dimensionality curse’) (Digenis structure ). o Detection of object features/attributes/properties (dimensions) which have similar course in the time course – for multi-dimensional objects mostly – aiming at the study and detection of possible interaction among them (Chiron proposal ). Generally, this dissertation consists of two basic parts, which refer to two research areas with great interaction: • The Multi-Dimensional Data Base Modelling • The Similarity Search among Multi-Dimensional objects. Ιn the first chapter, the problem of human brain mapping for the localization of epileptic foci is discussed. This problem raises issues related to the peculiarities of the representation and the organization of three dimensional objects with complex structures/shapes and functional dependencies and relationships among them (brain objects). In the beginning, the logical model BDB (Brain Data Base) is proposed as a first approach, introducing new entity types. In the corresponding study, a very interesting proposal is the introduction of hierarchical ordering in the Relational Model in order to organize the brain areas according to their frequencies of epileptic foci presence, improving statistically the corresponding response times. In the following, the needs of the application are studied in the basis of a Semantic – IFO model - and of an Object-oriented Model, resulting in the definition of the 3D-IFO and the MITOS (Model for the Intelligent Three-dimensional Object Support) model, respectively. In the framework of 3D-IFO model, new data types and new operators have been introduced, in order to achieve effective representation and better management of the complex brain objects. Additionally, a new constructor and the suitable attribute for its support have been introduced, in order to effectively represent the ordering among brain parts, based on a certain criterion, thus facilitating combined data retrieval. In the end, the object-oriented model MITOS, introduces a new data model (MITOS Data Model – MDM) which cooperates with an intelligent knowledge base approach (MITOS Query Language – MQL). MITOS model introduces many novelties which serve a more expressive and intelligent representation and management of multi-dimensional data and knowledge. One of these novelties constitutes the definition of one more basic object characteristic (in object-oriented theory), the relationship with the environment, releasing it from the situation or the behaviour, where its concept and representation weakens. The second MITOS novelty concerns MQL and is related to the introduction of the concept of ‘key’ in the rules area. The extension of this potentiality – the idea comes from Data Base area – leads in fact to a kind of a key, with a meaning that it could have in Knowledge Bases and can not be exactly the same with that in Data Bases, because of the specific distinctions of these two Bases. The subject of the second chapter is the detection of a least investigated similarity kind among multi-dimensional objects, the partial similarity. Partial similarity refers to similarities which are not full but they really exist. It is difficult to capture them using common techniques based on similarity functions (e.g. Euclidian distance) because these functions are affected by the whole set of object dimensions. Thus, when the objects are similar but ‘very different’ in few dimensions (e.g. very different colour and size) then the corresponding calculated functions (distances) will have very high values because of these few high dissimilarities and the similarity result will be negative while the objects will actually be similar. On the other hand, when between two objects there are low dissimilarities in most dimensions, they are actually dissimilar but the resultant function will have low value, so the dissimilar objects will be discerned as similar. In both cases, the common full similarity detection methods are not reliable. The few studies that have investigated partial similarity, have mostly focused on geometric data. The study which is extended to multi-dimensional objects in general and has led to significant results in partial similarity, is presented in a paper of Koudas and al., in VLDB 2006. It introduces the effective methods k-n-match and frequent k-n-match, which result in k objects being similar to the given ones not in all their dimensions but at least in n ones, avoiding in this way those few very dissimilar dimensions –if any- which lead to false results. Nonetheless, these methods have some weaknesses which finally result either in full similarity (when finally, in frequent k-n-match, all n’s are taken into account) or in an occasional partial similarity detection (with the suitable n’s, which should not be very high or very low, without having however any type or method to calculate the ‘best’ n’s). Based on these methods, we propose two techniques which can provably detect real partial similarities. The first of them, Lui k-n-match, succeeds in the approximate specification of the suitable n’s for the k-n-matches, based on human-computer interaction and on the suitable checks of the similar objects that k-n-matches propose. More precisely, using k-n-match, for each n a set with objects possibly similar to the given one (query object), is proposed. The user filters this set and decides which objects of the proposed set are really similar to the given one. This procedure continues until the point where, while n has become larger than d/2 , the user does not select any object as similar from the proposed object set. In this way, the results are more reliable and valid (because of human-computer interaction) while in parallel the number of the executed k-n-matches are remarkably reduced. The second partial similarity detection method (INTESIS) is based on the following observation: when two objects are similar, it usually means that they are similar in most of their characteristics. In data bases, each of object characteristic is represented by a set (usually small) of features-attributes(dimensions). Thus, if this correspondence between a characteristic and a set of attributes is defined by the developer of each application - creating dimension subsets – then the following can be successively done: a) A full similarity detection for each dimension subset b) Organization of these subsets in the corresponding hierarchical trees for their easy and effective management. The additional simplification of this choice derives from the fact that as long as the dimension subsets are small, the selection of the corresponding tree will be a very easy task, while almost all hierarchical trees have high performance for low dimensionalities. Consequently, the developer of each application can use the hierarchical tree that he/she considers as best (our proposition is R*-tree). Finally, in order to complete the procedure, the application developer has to define which is the minimum number of the requisite similar characteristics that indicate partial similarity, for the particular application. For the evaluation of the method, first of all, it is necessary to mention that it refers to a total number of dimensions less than 100 and consequently to a relatively small number of trees. As it is obvious, the final response time in a uniprocessor system is the sum of the response times of each tree. Taking into account that the number of dimensions which correspond to each tree is small, these trees have very good response times and consequently the total response time is low enough. While the use of each tree does not presuppose the use of another tree before or after it, the search in each tree can be performed in parallel. Therefore, in a multi-processing system, the total response time can be considerably reduced, achieving to reach the time needed for only one tree (when the number of processors is equal to the number of trees). Furthermore, bearing in mind that partial similarity forms a very demanding similarity search kind, not only the response times in multi-processing systems but those times in a uniprocessor system constitute satisfying performances. The third chapter studies the potentiality of defining a new structure which does not ‘suffer’ from ‘dimensional curse’, while it assures good performance for low dimensionalities too. The latest studies have resulted in the following: Although the known similarity trees (either based on space partitioning or on data partitioning perform effectively in cases of low dimensionality, their performance generally degrades as dimensionality increases (especially for more than 10 dimensions). On the other hand, VA-File constitutes a simple approximate method (it is a simple array-file of object geometric approximations) which manages to outperform any other similarity search method at high dimensionality but it has low performance for low dimensionality. In order to overcome this determinant dependence between the performance and the dimensionality of a data-object set, we propose the new hybrid structure called Digenis, which marries the logic of similarity trees with VA-Files logic. More precisely, a static parametric tree (Digenis tree) is defined in conceptual level while the Digenis file, based on Digenis tree, is used in physical level. Using this correlation, a) the similarity search procedure is located in a small part of the file, excluding most dissimilar objects from the search and b) the method is used effectively for both low and high dimensional objects, preserving generality and flexibility. The first necessary definition for Digenis proposal is related to the object families. They consist of objects having a small distance among them (based on a certain limit fl defined from the analyst, in each case) and they are represented by the ‘mean’ object of the family (if it does not exist, it is created just for this role). Each object family is hosted in a node of Digenis tree. The distance which is used is the most spread one, the Euclidian distance, for which the triangle inequality – where the method is mainly based - stands. Additionally, a second distance limit (Lt) is defined – from the analyst- which forms the limit used to conclude if two objects are similar or not. Finally, the root of the Digenis tree is the most ‘centered’ family in the total object area and the nodes being the children of it are its ch nearest families-nodes. The children of each of them are its ch nearest families, and so on. The triangle inequality which stands among the Euclidian distances of the object-families, is proved to be a very useful Theorem for the safe check exclusion of a great part of the tree , leading to a final check in a small tree area. The search analysis of the tree is very helpful for the use of Digenis file, where the real search is performed (physical level). The corresponding Digenis file in the physical level is created if each tree node composes a record of the file, beginning from the tree root and passing from each level, from left to right. Using this correspondence, the proved Digenis tree techniques of easy, safe and quick exclusion of Digenis record areas can be used. The (theoretical and experimental) evaluation of the method results in the detection of certain advantages and disadvantages of it. Advantages:  The file has very good performance for high dimensionalities. This was expected because the file works as a kind of VA-File, where the records are compact geometric approximations. This matters because both the use of object families achieves a first data ‘compression’ and the pre-arrangement of the objects via the conceptual use of the tree lead to a kind of grouping of neighboring objects in neighboring areas.  The file has also good performance for low dimensionality, because in comparison to VA-File, it is expectably better while it is based on a tree structure. For the same reason, Digenis file is competitive to the classic hierarchical similarity trees. Drawbacks:  The fact that the number of children for each node is statically defined as ch in each application is a disadvantage for the construction of the tree, because usually the really similar families may be more or less than ch. Confrontation: If the similar families of a node are more than ch, then only the ch closest to the family are placed as its children, in the next level. If they are less than ch, then a limit of children and full nodes in the tree is defined. When this limit is overcome, the nodes-children are normally placed in the tree and the rest nodes –until ch-th one – remain empty. When however the number of the children of a family and of the full nodes in the tree, are less than this limit, the corresponding subtree is separated, creating a new smaller tree – with smaller ch – while the initial tree is reorganized. Consequently, the final application may include more than one Digenis tree, which are accessed from the bigger to the smaller, until the similarity is found (if any).  Perhaps there are remote areas of object families – without any connection with other families – which can not be included in any other tree. Confrontation: A file including sequentially the remote families (called ‘remote’ file’) is created. During the similarity search, this file is the first which is accessed because while it usually hosts a few families, the search will be quick enough. If a similarity is detected (among the query object and a family in the file), then the search in the trees will be avoided while if no similarity exists, the time overhead of the file search is almost negligible, because of its size. In the last chapter, a new kind of dynamic similarity search is investigated. It is related with the time streams not of the objects themselves but of their properties/attributes/dimensions. In other words, what is detected is whether the courses of two or more properties resemble. This kind of information can be very useful for several kinds of applications (medical, financial, scientific in general, e.t.c). Using medical data related to hormonal tests as an example, we prove that, based on our method Chiron, the hormones which are developed in the same way are accurately and effectively detected. More precisely, new objects (property course objects or Chiron objects) which encode the variations of each property in certain time intervals, are defined and organized in a tree (Chiron tree). The way these objects are defined, their differences and the Chiron tree itself make its navigation and the detection of similar Chiron objects – and consequently of properties which are developed in a similar way - a quick and easy procedure. This is achieved via the distribution of the Chiron objects in the Chiron tree according to the number of the different digits that exist among them. In this way, when we search in the Chiron tree for objects similar to a given one, a simple and compact algorithm is used, which avoids a vast amount of useless checks among very different objects. Generally, the method is promising enough because it poses new problems for investigation, like the statistical analysis of its results, the search for objects that are developed in a reverse way, the management of time shifts among the property course objects and the Chiron tree optimization. Ανεύρεση ομοιοτήτων Πλήρης ομοιότητα Τμηματική ομοιότητα Ιατρική πληροφορική 006.312 Multidimensional databases Complex network objects Full similarity Partial similarity Similarity discovery Property time course Dimensionality curse K n match
18	Κατολισθήσεις στο νομό Αχαΐας: Ανάπτυξη μοντέλου επικινδυνότητας Κάβουρα, Αικατερίνη - Παρασκευή 11 July 2013 (has links) Στην παρούσα εργασία γίνεται μια προσπάθεια ανάδειξης του φαινομένου των κατολισθήσεων στο Νομό Αχαΐας με κύρια συνιστώσα το χρόνο (παρελθόν - παρόν- μέλλον). Οι κατολισθήσεις αποτελούν ένα σημαντικό φυσικό κίνδυνο (Natural Hazard) καθώς είναι ευρέως διαδεδομένες και κατέχουν μία θέση στη λίστα των λεγόμενων Φυσικών Καταστροφών (Natural Disasters). Έχει παρατηρηθεί ότι στη Δυτική Ελλάδα τα φαινόμενα των κατολισθήσεων είναι περισσότερα και συχνότερα απ’ ότι στη κεντρική και ανατολική Ελλάδα, κυρίως λόγω της λιθολογικής σύστασης των σχηματισμών, της έντονης και ενεργής τεκτονικής καθώς και των υψηλών βροχοπτώσεων. Ο Ν. Αχαΐας είναι μία από τις πιο χαρακτηριστικές περιοχές μελέτης κατολισθήσεων καθότι εκτός της μεγάλης συχνότητας του φαινομένου, υπάρχει μεγάλη ποικιλία ως προς την έκφρασή του (γεωλογία, μέγεθος, αίτια, συνέπειες κα). Εδώ και δεκαετίες, από το Εργαστήριο Τεχνικής Γεωλογίας του Τμήματος Γεωλογίας Πανεπιστημίου Πατρών, μελετώνται τα φαινόμενα κατολισθήσεων στο Νομό οπότε υπάρχει αρκετός όγκος πληροφόρησης που μας δίνει στοιχεία για το παρελθόν μέσω των υφιστάμενων Βάσεων Δεδομένων. Σήμερα, παρόν, υπάρχει σχετικά άμεση ανταπόκριση και αντιμετώπιση των φαινομένων και καλύτερη καταγραφή αυτών. Το ερώτημα που τίθεται είναι κατά πόσο είναι εφικτό παρακολουθώντας και καταγράφοντας την ενεργότητα των κατολισθήσεων, να προβλέψουμε μία μελλοντική εξέλιξή τους, μέλλον. Για τον σκοπό αυτόν έγινε μία διεξοδική συλλογή στοιχείων και ανάπτυξη μιας νέας Βάσης Δεδομένων Κατολισθήσεων για το Ν. Αχαΐας. Αρχικά, αναπτύχθηκε μία Φόρμα Καταγραφής Κατολισθήσεων (Landslide Inventory Form) στην οποία καταγράφηκαν 123 περιπτώσεις για την Αχαΐα (ιστορικές καταγραφές), από τις οποίες διατηρήθηκε ένα μέρος. Έγινε προσπάθεια αναγνώρισης και αποτύπωσης των καταγεγραμμένων θέσεων με χρήση Γεωγραφικών Συστημάτων Πληροφόρησης - ΓΠΣ (Geographical Information System – GIS). Η αποτύπωση έγινε με την βοήθεια ορθοφωτοχαρτών της ΚΤΗΜΑΤΟΛΟΓΙΟ ΑΕ και κατά περιπτώσεις σαν βοηθητικό εργαλείο του GoogleEarth. Παράλληλα με τις παλαιές (ιστορικές) θέσεις αναγνωρίστηκαν μία σειρά επιπλέον κατολισθήσεων (νέες) οι οποίες αποτέλεσαν μία σειρά νέων καταγραφών. Προέκυψε έτσι μία αρκετά ενημερωμένη Βάση Κατολισθήσεων η οποία και αναρτήθηκε στο Διαδίκτυο στον ιστότοπο του Εργαστηρίου Τεχνικής Γεωλογίας. Από τις θέσεις που καταγράφηκαν τελικά επιλέχθηκαν οι τέσσερις (4) πλέον σημαντικές και «ενεργές» κατολισθήσεις μερικές από τις οποίες έχουν απασχολήσει αρκετά επιστήμονες και τεχνικούς τα παλαιότερα χρόνια, για περαιτέρω παρακολούθηση (monitoring) με ενόργανο εξοπλισμό (αποκλισιόμετρο) και μεθόδους τηλεπισκόπισης (remote sensing - SAR interferometry). Οι θέσεις αυτές είναι: (α) η κατολισθαίνουσα ζώνη Πλατάνου, (β) η κατολίσθηση της Παναγοπούλας, (γ) η κατολίσθηση της Καρυάς και (δ) η κατολίσθηση στον οικισμό Πλατανίτη Ναυπάκτου του Νομού Αιτωλοακαρνανίας. Στις θέσεις αυτές έγινε λεπτομερής γεωτεχνική έρευνα και εγκατάσταση αποκλισιομετρικών σωλήνων για συστηματική παρακολούθηση της κινηματικής και την ανάπτυξη ενός μοντέλου επικινδυνότητας. / The objective of this thesis is the study of landslide hazard. It’s an attempt to highlight the phenomenon of landslides in the Prefecture of Achaia function of time (past - present - future). Landslides constitute a major geologic hazard because they are widespread and we can add them in the hall of fame of natural disasters. It has been observed that in western Greece phenomena of landslides are more frequent than in the central and eastern Greece, mainly due to the lithology of the formations, the strong and active tectonics and high rainfall. For decades, the Laboratory of Engineering Geology, Department of Geology, University of Patras, studied the effects of landslides in the Prefecture, as a result, there is enough volume of data that gives us information about the past through the existing Database. Today, there is immediate response and handling of landslide phenomena as well as better recording methods. The question that arises is whether it is possible by monitoring and recording the activity of landslides to predict a future evolution, future. For this purpose took place a detailed collection of data and developed a new landslide database for the Prefecture of Achaia. At first, we developed a Landslide Inventory Form which recorded and archived 123 historical cases from Achaia, a part of that study was recorded and kept for further study. After that, the landslide recordings were imported to the Geographical Information Systems - GIS. Additionally, we used orthophotos from KTIMATOLOGIO S.A. and occasionally we used, as an auxiliary tool GoogleEarth. Alongside with the old (historical) landslide sites we identified a series of additional landslides (new ones) which helped us constitute a new archive with new recordings. As a result, there is an updated Landslide Database which was published on the webpage of the Laboratory of Engineering Geology. From this point of view, we selected the four (4) most important and "active" landslides from which some of them have been the major study of several scientists and technicians in the past. Further monitoring (monitoring) with instrumental equipment (inclinometer) and remote sensing methods (remote sensing - SAR interferometry) was used in the study. These positions are as recorded : (a) the landslide zone at Platanos area (b) the landslide of Panagopoula area, (c) the landslide of Karia village and (d) the landslide at Platanitis area, near Nafpaktos village, Aitoloakarnania Prefecture. On these studies, a detailed geotechnical investigation and installation of inclinometer tubes for systematic monitoring of the kinematics and the development of a risk model was used. Κατολισθήσεις Αχαΐα Βάσεις δεδομένων 551.307 Landslides Achaia prefecture Historical cases Geographic information system (GIS)
19	Κατανεμημένο σύστημα παρακολούθησης τιμών καταναλωτή με χρήση υπηρεσιών διαδικτύου και κινητών συσκευών Σοκορέλη, Ιωάννα 20 October 2010 (has links) Η παρούσα διπλωματική εργασία αναφέρεται στην δημιουργία μιας εφαρμογής για κινητά τηλέφωνα, σε πλατφόρμα J2ME. Η εφαρμογή αυτή δίνει τη δυνατότητα στους χρήστες της, με τη βοήθεια υπηρεσιών βασισμένων στη θέση, να συγκρίνουν τις τιμές στις οποίες πωλούνται διάφορα βιβλία στα καταστήματα της περιοχής τους. Για την ανάπτυξη αυτής της εφαρμογής χρησιμοποιήθηκαν υπηρεσίες διαδικτύου που επιτρέπουν την επικοινωνία μεταξύ κινητών συσκευών και ενός κεντρικού εξυπηρετητή. Επίσης, αναπτύχθηκε μια βάση δεδομένων από την πλευρά του εξυπηρετητή, η οποία ενημερώνεται από τους ίδιους τους χρήστες. Για τον καθορισμό της γεωγραφικής θέσης του χρήστη χρησιμοποιείται το σύστημα GPS, ενώ για την παρουσίαση των αποτελεσμάτων χρησιμοποιήθηκε το Static Maps API. / The purpose of this diploma thesis is the development of an application designed for mobile phones, based on a J2ME platform. This application enables the users to use their phones in order to compare the prices of books among stores of a specific area. The development of this application includes a distributed system, which consists of two components: the client application, namely the users and the server application that contains a data base. This data base gets updated by the end users. The communication between the server and the client is based on Web Services. The users’ location is determined by the phone’s embedded GPS receiver. Finally, the Static Maps API is used for mapping the results. Φορητές συσκευές Βάσεις δεδομένων 384.33 Web services J2ME Google maps API Location based services Databases
20	PhytoKaryon : μία κυτταρολογική βάση δεδομένων των φυτών της Ευρώπης και της Μεσογείου : αξιοποίηση και παρουσίαση δεδομένων II Σταυρόπουλος, Αθανάσιος 27 December 2010 (has links) Δημιουργία του ιστότοπου της κυτταρολογικής Βάσης Δεδομένων Φυτών PhytoKaryon, η οποία περιέχει καρυολογικά δεδομένα των φυτών της Μεσογείου και της Ευρώπης. Υλοποιήθηκε σε περιβάλλον PHP, MySQL και Apache Server. Παρουσιάζει τα αποτελέσματα της αξιοποίησης της Βάσης Δεδομένων από την πλευρά του απλού χρήστη του Ιστότοπου. / The creation of the site of the cytologic Plants' Data Base PhytoKaryon, which contains karyological data of plants of Mediterranean and Europe. It was implemented in PHP, MySQL and Apache Server environment. It presents the results of exploitation of Data Base from the side of user. Βάσεις δεδομένων Βιολογία Κυτταρολογία Φυτά Καρυότυπος Χρήστης 581.902 85 Phytokaryon Databases Kytarology Biology PHP Plants Karyotype Users

Search results