Spelling suggestions: "subject:"δεδομένα"" "subject:"δεδομμένα""
1 |
Μελέτες στις ταχέως εξαπλωνόμενες χρηματοοικονομικές κρίσεις με την χρήση υποδειγμάτων απαριθμητών τιμών και δεδομένων διάρκειαςΣιάκουλης, Βασίλειος 18 June 2014 (has links)
Στην παρούσα διατριβή πραγματοποιούμε εμπειρικές αναλύσεις στο αντικείμενο της Χρηματοοικονομικής Μόλυνσης στον χρηματοπιστωτικό τομέα και στις αγορές μετοχών και ομολόγων, με την χρήση υποδειγμάτων απαραριθμητών δεδομένων και δεδομένων διάρκειας. / In the current thesis we focus on Financial Contagion modeling in the domain of bank failures, stock and bond markets, with the use of Count and Duration data models.
|
2 |
Μελέτη των περιβαλλοντικών συνθηκών έκλυσης του χημικού στοιχείου 222Rn και η πιθανή συσχέτιση της με την σεισμικότητα της περιοχής ΜεγάρωνΟικονομόπουλος, Ευάγγελος 18 March 2009 (has links)
Kατά τις τελευταίες δύο δεκαετίες θεωρείται ότι υπάρχουν ενδείξεις πιθανού συσχετισμού των μεταβολών του εκλυόμενου ραδονίου στο έδαφος και της σεισμικής δραστηριότητας. Παρότι στην Ελλάδα εκδηλώνεται το μεγαλύτερο μέρος της σεισμικής δραστηριότητας της Ευρώπης, δεν έχουν πραγματοποιηθεί συστηματικές έρευνες έως τώρα.
Η περιοχή της διατριβής καλύπτει την ανάγκη ανάλυσης της έκλυσης ραδονίου από περιβαλλοντικές παραμέτρους και τη σεισμικότητα. Το πείραμα χωροθετήθηκε στην περιοχή του Κορινθιακού κόλπου λόγω του ότι:
1) παρουσιάζεται υψηλή σεισμικότητα, η σεισμικότητα σε αυτή την περιοχή δε είναι εντοπισμένη σε ένα συγκεκριμένο τμήμα της, αλλά χαρακτηρίζει την ευρύτερη περιοχή.
2) Στην περιοχή εκδηλώνονται συχνά σεισμικά γεγονότα όλων των μεγεθών, σχετιζόμενα με τη σεισμικότητα της ίδιας της περιοχής, αλλά και λόγω διέγερσης σεισμικών ρηγμάτων στην εγγύς περιοχή (π.χ. σεισμοί Αλκυονίδων 1981 και σεισμοί Αθήνας 1999).
3) Η ύπαρξη στην περιοχή ενός μεγάλου αριθμού ρηγμάτων, τα οποία έχουν σαφή επιφανειακή έκφραση. Η ύπαρξη ρηγμάτων με σαφή επιφανειακή έκφραση δίνει επιπλέον τη δυνατότητα μέτρησης της ροής ραδονίου μέσα από ένα ρήγμα.
4) Στην περιοχή μελέτης υπάρχουν καλής ακρίβειας σεισμολογικά και μετεωρολογικά δεδομένα, έτσι ώστε να μπορεί να συσχετισθεί η επίπτωση των μετεωρολογικών αλλαγών με τις μετρήσεις ραδονίου. Η συγκεκριμένη περιοχή δε χαρακτηρίζεται από βίαιες μετεωρολογικές μεταβολές, οι οποίες επηρεάζουν την έκλυση του ραδονίου. / Over the last decades evidence for correlation between radon emission and earthquake activity suggests that monitoring of radon in soil gas can be used as a method to predict future earthquakes. However, although the method is promising for earthquake prediction and most of the seismic activity in Europe is released in Greece, no systematic experiments were conducted so far. In this study we present preliminary results of a two years experiment through the monitoring of eight sites in the Megara basin. In each site, soil radon exhalation was monitored in shallow boreholes (80 cm deep), using CR39 films, which were exposed every 15-day.
The Megara basin was selected as a study area for the following reasons: (a) the basin is actively deformed and most of this deformation is accommodated by strong historic earthquakes. The most recent of these events are the 1981 Corinth earthquake sequence. (b) Within the basin large faults have spectacular outcrops, and or still preserve seismic ruptures. Thus the tectonic setting of the monitoring sites is well known in its tectonic position. (c) The entire experiment is set up quite close to Athens, thus earthquake epicenters are calculated fairly well and detailed meteorological data are also available.
The experiment includes a series of monitoring sites distributed from Megara town to the coast of the Alkyonides bay, that it well known as the epicenter of the 1981 Corinth earthquakes. In essence the coastal area of the Gulf is rather the surface expression of the South Alkyonides Fault zone. Surface displacement along this fault during the 1981 event reached up to 1 m north side down. Based on these monitoring sites, we present the first results regarding the background soil radon concentration in the Megara basin as well as radon exhalation through a fault. Specifically, we present data of radon exhalation through a still preserved co-seismic rupture, 20 north of the rupture on the hanging wall block and 200 m south of the rupture within the footwall block of the South Alkyonides Fault zone.
|
3 |
Διαδικτυακές υπηρεσίες και εφαρμογές για επεξεργασία και απεικόνιση ιατρικών δεδομένωνΣαραντόπουλος, Χαράλαμπος 14 May 2012 (has links)
Σκοπός αυτής της εργασίας είναι η αναφορά και ανάλυση των υπαρχουσών τεχνολογιών με τις οποίες είναι δυνατή η κατασκευή ενός web service. Η γλώσσα XML καθώς και οι WSDL, UDDI και SOAP είναι οι βασικές τεχνολογίες που χρησιμοποιούνται για την κατασκευή των web services και αναλύονται λεπτομερώς με παραδείγματα, για την πλήρη κατανόησή τους / Τhe aim of this paper is to to analyse the current technology, we can construct a web service. XML, WSDL, UDDI and SOAP are the main tools we use to built a web service
|
4 |
Ανάπτυξη & υλοποίηση συστήματος συλλογής & ελέγχου ποιότητας μετεωρολογικών δεδομένωνΚατσιδήμας, Κωνσταντίνος 10 June 2013 (has links)
Στην εργασία αυτή περιγράφεται η ολοκληρωμένη ανάπτυξη και υλοποίηση συστήματος συλλογής και ελέγχου ποιότητας μετεωρολογικών δεδομένων που έχει τεθεί σε πλήρη λειτουργία από το καλοκαίρι του 2011 στο εργαστήριο Φυσικής της Ατμόσφαιρας του τμήματος Φυσικής του Πανεπιστημίου Πατρών. Στο πρώτο κεφάλαιο περιγράφονται οι βασικές έννοιες των μετρούμενων φυσικών παραμέτρων. Οι μετρούμενες φυσικές παράμετροι είναι η θερμοκρασία, η σχετική υγρασία, η ταχύτητα ανέμου, η διεύθυνση ανέμου, η ατμοσφαιρική πίεση, το ύψος υετού, η ολική και η διάχυτη ηλιακή ακτινοβολία. Στο δεύτερο κεφάλαιο περιγράφονται τα γενικά στοιχεία του σταθμού (θέση) καθώς και οι βασικές αρχές λειτουργίας των οργάνων. Τα όργανα που χρησιμοποιούνται είναι το θερμοϋγρόμετρο, ο ανεμοδείκτης, το ανεμόμετρο, το βροχόμετρο, το βαρόμετρο και τα πυρανόμετρα. Στο τρίτο κεφάλαιο περιγράφεται ολοκληρωμένο το σύστημα συλλογής και μετρήσεων καθώς και τα χαρακτηριστικά των οργάνων και των συσκευών που έχουν εγκατασταθεί. Στο σύστημα συμπεριλαμβάνονται εκτός των οργάνων τα συστήματα συλλογής και καταγραφής (data loggers) καθώς και το σύστημα μεταφοράς (modem και καλωδιώσεις). Στο τέταρτο κεφάλαιο αναφέρεται ο προγραμματισμός των δύο τμημάτων του σταθμού. Στο πέμπτο κεφάλαιο περιγράφονται η διαχείριση μετεωρολογικών δεδομένων, ο έλεγχος ποιότητας και η ανάλυση των δεδομένων. / This paper describes the development and implementation of an integrated system of collection and quality control of meteorological data that has been fully operational since the summer of 2011 at the laboratory of Atmospheric Physics, Physics Department, University of Patras. The first chapter describes the basic concepts of the measured meteorological parameters. These are temperature, relative humidity, wind speed and direction, atmospheric pressure, amount of precipitation, total and diffuse radiation. The second chapter describes the general elements of the station (position) and the basic operating principles of the instruments used (humidity temperature probe, potentiometer windvane, anemometer, rain gauge, barometer and the pyranometer). The third chapter describes the integrated system for data collection and the characteristics of the instruments and devices that are installed. The system includes instruments for the data collection and recording (data loggers) and transfer (modem and wiring). The fourth chapter deals with the planning of the two parts of the station. The fifth chapter describes the meteorological data management, quality control and analysis.
|
5 |
Ομαδοποιημένη οπτικοποίηση γεωγραφικών δεδομένων με χρήση web τεχνολογιώνΧαρπαντίδης, Βασίλειος 05 February 2015 (has links)
Στις μέρες μας ο κόσμος αναζητά συνεχώς νέες πληροφορίες. Η αναζήτηση αυτή πολλές φορές
εξαρτάται ή/και βασίζεται σε γεωγραφικά δεδομένα. Για αυτόν το σκοπό η αποτύπωση της
πληροφορίας στο χάρτη είναι μια κλασική μέθοδος που ακολουθείται.
Αυτή η διπλωματική ξεκίνησε από την παρατήρηση ότι ενώ από τη μία υπάρχει μεγάλος όγκος
πληροφορίας, η αποτύπωσή της στο χάρτη είναι πολύ φτωχή. Σχεδόν όλες οι εφαρμογές με εξαίρεση
τους κολοσσούς της πληροφορικής (Microsoft και Google) αναπαριστούν περιορισμένη ποσότητα
πληροφορίας. Αυτή η παρατήρηση προήλθε από λεπτομερή έρευνα των πρακτικών που ακολουθούνται
τόσο από εμπορικές εφαρμογές, όσο και από αντίστοιχες ερευνητικές δραστηριότητες. Έτσι,
χρησιμοποιώντας κάποιος αυτές τις υπηρεσίες δυσκολεύεται να κατανοήσει τη συνολική πληροφορία
της γεωγραφικής περιοχής που εξετάζει.
Σε αυτήν την εργασία προσπαθούμε να δώσουμε λύση στο παραπάνω πρόβλημα, δηλαδή στην
αποτύπωση της συνολικής πληροφορίας σε κάποια μη ορισμένη εξ αρχής γεωγραφική περιοχή. Το
σύνολο της πληροφορίας, επίσης, δεν είναι στατικό, αλλά αλλάζει σύμφωνα με διάφορα κριτήρια που
μπορεί να επιλέξει ο χρήστης.
Η εργασία θα κινηθεί σε δύο βασικούς πυλώνες. Αρχικά, θα δοθεί λύση στο απλούστερο πρόβλημα της
παρουσίασης στο χρήστη της ποσότητας της πληροφορίας στις αντίστοιχες γεωγραφικές περιοχές. Στη
συνέχεια, αφού χρησιμοποιηθεί η λύση αυτού του προβλήματος θα γίνει μια προσπάθεια να λυθεί το
πιο σύνθετο πρόβλημα της ομαδοποίησης της εμφανιζόμενης στοιχείων πληροφορίας στις γεωγραφικές
περιοχές που εξετάζονται από το χρήστη. Οι λύσεις των δύο αυτών προβλημάτων θα βασιστούν στην
ομαδοποίηση. Το πρώτο πρόβλημα θα λυθεί με τη χρήση του αλγορίθμου ομαδοποίησης σε πλέγμα και
το δεύτερο θα βασιστεί στη χρήση μερικών παραλλαγών του αλγορίθμου Minimum Description
Length (MDL). Παρόλο που φαίνεται ότι θα ακολουθηθούν κλασικοί αλγόριθμοι η διπλωματική αυτή
θα τους χρησιμοποιήσει με πρωτοφανή τρόπο (δε βρέθηκε αντίστοιχη χρήση στη βιβλιογραφία) και σε
πολλά λεπτά σημεία θα δοθούν καινοτόμες λύσεις.
Οι δύο αυτές λύσεις δε θα υλοποιηθούν απλά σε ένα εργαστηριακό σύστημα, όπου κάποιος έμπειρος
χρήστης (ο ερευνητής) θα μπορεί να πραγματοποιεί πειράματα, αλλά σε μία σύγχρονη web εφαρμογή.
Απόρροια αυτής της επιλογής είναι η εφαρμογή που θα παραχθεί από την υλοποίηση αυτής της
διπλωματικής να είναι άμεσα προσπελάσιμη από όλον τον κόσμο. Αυτό είναι ένα ακόμη προτέρημα
αυτής της εργασίας.
Συνοψίζοντας η εργασία θα ολοκληρωθεί με ένα συνοπτικό σχολιασμό των λύσεων και των
αποτελεσμάτων τους σε ένα πραγματικό σύνολο δεδομένων. Σε αυτά τα αποτελέσματα θα
παρατηρηθεί η λογική συσχέτιση των αποτελεσμάτων των ομαδοποιημένων σημείων σε σχέση με τις
γεωγραφικές περιοχές. / Nowadays information is produced everywhere. So a great amount of data exists. Spatial data analysis and visualization is a hot trend and a dynamic map like google maps is the best so far solution. The problem is that the combination of the massive amount of data and the limited size of the map instead of helping the user may confuse him/her. Now, consider a web application with a dynamic map, presenting the whole information of each place without confusing the user with the huge amount of information. This paper proposes some techniques to present the quantity and the quality of information in any place of the dynamic map. The common factor of all the proposed techniques is the grouping via some algorithms like grid clustering.
|
6 |
Μελέτη κατολισθίσεων από ιστορικά, βιβλιογραφικά δεδομένα χαρτογράφησης στην περιοχή ΙωαννίνωνΚαλαντζή, Φωτεινή 11 November 2009 (has links)
Στην παρούσα μελέτη έγινε α) αποδελτίωση των εφημερίδων για το χρονικό
διάστημα 1960 έως 2008 σχετικά με κατολισθητικά φαινόμενα στο Νομό Ιωαννίνων
και β) αναλυτική διερεύνηση των φαινομένων αυτών σε 3 περιοχές του νομού με τη
χρήση ιστορικών και βιβλιογραφικών δεδομένων, αποδελτιωμένων πληροφοριών
από εφημερίδες καθώς και επιτόπιας χαρτογράφησης και καταγραφής έργων που
έγιναν μετά την εκδήλωση των κατολισθήσεων / At the present research study a) we have extracted data from newspapers for the period between 1960 and 2008 considering landslide events at the Prefecture of Ioannina and b) we have analytically investigated these phenomena at 3 regions of the Prefecture by using historical data, scientific literature and data extracted from newspapers as well as on the spot mapping and recording of the reconstruction work that have taken place.
|
7 |
Μελέτη περιβαλλοντικών παραμέτρων σε ποτάμια της Βορείου Ελλάδας : εφαρμογή του αλγορίθμου CLEAN σε συνδυασμό με την παραγοντική ανάλυση για τη διερεύνηση υδροχημικών δεδομένων τριών ποταμών της Β. ΕλλάδαςΠαναγιωτόπουλος, Παναγιώτης 08 December 2008 (has links)
Σκοπός της εργασίας είναι να παρουσιαστεί ένα μεθοδολογικό σχέδιο που αποτελείται από την φασματική ανάλυση CLEAN και την παραγοντική ανάλύση έτσι ώστε να καταδειχθεί ότι η ανάπλαση υδροχημικών χρονοσειρών αναδεικνύει σημαντικές πληροφορίες όσον αφορά τη χρονική διακύμανση των κυρίαρχων διεργασιών που επηρεάζουν την ποιότητα νερού τριών ποταμών της Βόρειας Ελλάδας (Στρυμόνα, Αξιό, Αλιάκμονα). / -
|
8 |
Έλεγχος ισχύος κατά τη μετάδοση πολυμεσικών δεδομένων σε κινητά δίκτυα επικοινωνιών επόμενης γενιάςΡέκκας, Ευάγγελος 27 April 2009 (has links)
Ο ταχύτατα εξελισσόμενος τομέας των δικτύων κινητών επικοινωνιών έχει επιφέρει μία ιδιαίτερα
αυξανόμενη απαίτηση για ασύρματη, πολυμεσική επικοινωνία. Στη ραγδαία εξέλιξη του τομέα αυτού
συμβάλουν τα μέγιστα και οι απαιτήσεις της σύγχρονης αγοράς για ένα ενοποιημένο και λειτουργικό
σύστημα κινητής τηλεφωνίας παρέχοντας παράλληλα πληθώρα ευρυζωνικών υπηρεσιών ψηφιακού
περιεχομένου στους πελάτες – χρήστες του.
Είναι γεγονός ότι, τα τελευταία χρόνια τα δίκτυα επικοινωνιών τρίτης γενιάς (3G) – UMTS γνωρίζουν
μεγάλη άνθηση και η χρήση τους έχει επεκταθεί στις περισσότερες ευρωπαϊκές χώρες, όπως και στην
Ελλάδα. Τα νέα αυτά κινητά δίκτυα αντικαθιστούν τα υπάρχοντα κινητά δίκτυα δεύτερης γενιάς και
επιπλέον προσφέρουν προηγμένες υπηρεσίες στους κινητούς χρήστες. Ωστόσο, η αδήριτη ανάγκη για
μεγαλύτερες (ευρυζωνικές) ταχύτητες πρόσβασης οδήγησε στην περαιτέρω ανάπτυξη των 3G δικτύων
και στην υιοθέτηση νέων τεχνολογιών, με κυριότερο εκπρόσωπο τους την τεχνολογία HSPA. Η
τεχνολογία HSPA αποτελεί τη φυσιολογική μετεξέλιξη του UMTS, η οποία πολλές φορές συναντάται και
ως 3.5G ή 3G+, προκειμένου να δηλώσει την αναβάθμιση του 3G (UMTS) προτύπου.
Ωστόσο, παρά το γεγονός ότι η τεχνολογία HSPA αναμένεται να προσφέρει τη δυνατότητα παροχής
πληθώρας ευρυζωνικών υπηρεσιών, το 3GPP ήδη μελετά και επεξεργάζεται νέες τεχνολογίες που θα
επικρατήσουν την αμέσως επόμενη δεκαετία στην αγορά των κινητών επικοινωνιών. Το νέο αυτό project
αποκαλείται Long Term Evolution (LTE) και στοχεύει στην επίτευξη ακόμη υψηλότερων ρυθμών
μετάδοσης σε συνδυασμό με την αξιοποίηση μεγαλύτερου εύρος ζώνης. Κύρια προοπτική του LTE
αποτελεί η διασφάλιση της ανταγωνιστικότητας και η επικράτηση του προτύπου στο χρονικό ορίζοντα
της επόμενης δεκαετίας.
Κατά συνέπεια, η αγορά κινητών επικοινωνιών σταδιακά μεταλλάσσεται προς τη δημιουργία δικτύων
κινητών επικοινωνιών επόμενης γενιάς, με απώτερο σκοπό την επίτευξη του αποκαλούμενου «Mobile
Broadband».
Ταυτόχρονα με την εκτεταμένη εξάπλωση των δικτύων κινητών επικοινωνιών επόμενης γενιάς καθώς
και τις αυξημένες δυνατότητες των κινητών συσκευών, οι πάροχοι πολυμεσικού περιεχομένου και
υπηρεσιών ενδιαφέρονται όλο και περισσότερο για την υποστήριξη της πολυεκπομπής δεδομένων
(multicasting) στα δίκτυα αυτά με σκοπό την αποτελεσματική διαχείριση και επαναχρησιμοποίηση των
διαθέσιμων πόρων του δικτύου. Επιπρόσθετα, οι χρήστες των κινητών δικτύων έχουν πλέον την
απαίτηση να προσπελαύνουν εφαρμογές και υπηρεσίες οι οποίες μέχρι σήμερα μπορούσαν να
διατεθούν αποκλειστικά από τα συμβατικά ενσύρματα δίκτυα. Έτσι λοιπόν στις μέρες μας γίνεται λόγος
για υπηρεσίες πραγματικού χρόνου όπως mobile TV, mobile gaming, mobile streaming κ.α.
Ένα από τα σημαντικότερα βήματα των δικτύων κινητών επικοινωνιών προς την κατεύθυνση της
παροχής νέων, προηγμένων πολυμεσικών υπηρεσιών είναι η εισαγωγή της υπηρεσίας Multimedia
Broadcast / Multicast Service (MBMS). Η MBMS υπηρεσία έχει σαν κύριο σκοπό την υποστήριξη IP
εφαρμογών πανεκπομπής (broadcact) και πολυεκπομπής (multicast) επιτρέποντας με αυτό τον τρόπο
την παροχή υπηρεσιών υψηλού ρυθμού μετάδοσης σε πολλαπλούς χρήστες με οικονομικό τρόπο. Η
multicast μετάδοση δεδομένων σε κινητά δίκτυα επικοινωνιών είναι μια νέα λειτουργικότητα η οποία
βρίσκεται ακόμη στο στάδιο των δοκιμών και της προτυποποίησης της. Ένας multicast μηχανισμός
μεταδίδει τα δεδομένα μόνο μία φορά πάνω από κάθε ασύρματο σύνδεσμο που αποτελεί τμήμα των
μονοπατιών προς τους προορισμούς-κινητούς χρήστες.
Το κρισιμότερο σημείο που εντοπίζεται κατά τη multicast μετάδοση δεδομένων στα κινητά δίκτυα
επικοινωνιών είναι ο αποτελεσματικός έλεγχος ισχύος. Οι σταθμοί βάσης των κυψελωτών αυτών
δικτύων διαθέτουν περιορισμένους πόρους ισχύος (άρα και περιορισμένη χωρητικότητα κυψέλης),
γεγονός που επιβάλλει τη χρήση μίας βέλτιστης στρατηγικής για την όσο το δυνατόν καλύτερη
αξιοποίηση των διαθέσιμων πόρων ισχύος. Ο έλεγχος ισχύος στοχεύει στη μείωση της εκπεμπόμενης
ισχύος, στην ελαχιστοποίηση του θορύβου στο κυψελωτό δίκτυο και κατά συνέπεια στη διασφάλιση
μεγαλύτερης χωρητικότητας επιπλέον χρηστών.
Ένα από τα βασικότερα στοιχεία του ελέγχου ισχύος στα δίκτυα κινητών επικοινωνιών επόμενης γενιάς
κατά τη multicast μετάδοση πολυμεσικών δεδομένων αποτελεί η επιλογή του κατάλληλου καναλιού
μεταφοράς για τη μετάδοση των δεδομένων από τον κόμβο RNC στον κινητό χρήστη. Συγκεκριμένα,
πρόκειται για ένα κρίσιμο ζήτημα το οποίο είναι ακόμα υπό εξέταση στο 3GPP. Προς την κατεύθυνση
αυτή, στο MBMS στάνταρ έχει αναπτυχθεί ένας μηχανισμός που αποκαλείται Counting Mechanism. Ο στόχος του μηχανισμού αυτού είναι η βελτιστοποίηση της ροής δεδομένων για την υπηρεσία MBMS,
όταν αυτά διέρχονται από τις διεπαφές του UTRAN (διεπαφές Iub και Uu). Ωστόσο, η υπάρχουσα
μορφή του μηχανισμού αυτού διακρίνεται από πολλές αδυναμίες που δεν επιτρέπουν την
αποτελεσματική και μαζική μετάδοση πολυμεσικών δεδομένων. Τα σημαντικότερα προβλήματα του
υπάρχοντος Counting Mechanism είναι η απουσία ευρυζωνικών χαρακτηριστικών καθώς και η σπατάλη
σημαντικού τμήματος των (ούτως ή άλλως περιορισμένων) πόρων ισχύος. Εν γένει, η επιλογή του
κατάλληλου καναλιού μεταφοράς των πολυμεσικών δεδομένων στο ασύρματο μέσο είναι μια δύσκολη
διαδικασία καθώς μια λανθασμένη επιλογή καναλιού μπορεί να οδηγήσει στην αστοχία ενός ολόκληρου
κελιού. Γίνεται σαφές, λοιπόν, ότι απαιτείται μία βελτιωμένη έκδοση του υπάρχοντος Counting
Mechanism για την αποτελεσματικότερη και οικονομικότερη μετάδοση πολυμεσικού περιεχομένου σε
μεγάλο πλήθος χρηστών.
Στόχος της παρούσας μεταπτυχιακής εργασίας είναι η μελέτη του ελέγχου ισχύος στα δίκτυα κινητών
επικοινωνιών επόμενης γενιάς καθώς και η ανάπτυξη νέων μεθόδων για τη βελτιστοποίηση του
Counting Mechanism. Ιδιαίτερο χαρακτηριστικό της μεταπτυχιακής αυτής εργασίας είναι η ενσωμάτωση
και η «εκμετάλλευση» όλων των ιδιαίτερων χαρακτηριστικών της HSDPA τεχνολογίας στην MBMS
υπηρεσία. Η MBMS υπηρεσία μέχρι τώρα βασίζεται στη λειτουργικότητα των υπαρχόντων UMTS
δικτύων. Ο συνδυασμός των δύο αυτών προτύπων, δηλαδή του MBMS και του HSDPA, υπόσχεται
τόσο την παροχή ευρυζωνικών πολυμεσικών δεδομένων σε μεγάλο πλήθος κινητών χρηστών όσο και
τη βέλτιστη επίτευξη ελέγχου ισχύος.
Προς αυτή την κατεύθυνση, θα πραγματοποιηθεί ανάλυση όλων των υπαρχόντων καναλιών μεταφοράς
του UMTS καθώς και της τεχνολογίας HSDPA και τα οποία μπορούν να χρησιμοποιηθούν για τη
multicast μετάδοση πολυμεσικών δεδομένων. Πιο συγκεκριμένα, τα κανάλια τα οποία αξιολογούνται
είναι τα: Forward Access Channel, High Speed–Downlink Shared Channel και Dedicated Channel. Τα
παραπάνω κανάλια μεταφοράς αξιολογούνται με βάση την απαιτούμενη ισχύ που πρέπει να ανατεθεί
από το σταθμό βάσης για καθένα από αυτά, και κατά συνέπεια με βάση το ρυθμό μετάδοσης τους, τον
αριθμό των χρηστών που μπορούν να εξυπηρετήσουν, την ποιότητα υπηρεσιών για κάθε χρήστη, τη
μέγιστη δυνατή κάλυψη της κυψέλης κ.α.
Επίσης, αντικείμενο της παρούσας μεταπτυχιακής εργασίας είναι η εύρεση ενός κατάλληλου σημείου
εναλλαγής μεταξύ των διάφορων τύπων καναλιών κατά τη μετάδοση πολυμεσικών δεδομένων. Θα
διερευνηθούν τεχνικές μείωσης της εκπεμπόμενης ισχύος με απώτερο σκοπό την αποδοτικότερη χρήση
των πόρων του συστήματος και θα προταθούν νέες παραλλαγές του Counting Mechanism με ανώτερα
χαρακτηριστικά διαχείρισης και κατανομής πόρων ισχύος. Οι νέοι αυτοί μηχανισμοί υπόσχονται
βελτιωμένη απόδοση, μείωση της καταναλισκόμενης ισχύος και κατά συνέπεια αύξηση της
χωρητικότητας των κινητών δικτύων επόμενης γενιάς. Το γεγονός αυτό μπορεί να επιτρέψει τη μαζική
μετάδοση πολυμεσικών δεδομένων σε πληθώρα κινητών χρηστών.
Τέλος, θα διερευνηθούν και νέες, πιο αποδοτικές τεχνικές για τη μετάδοση πολυμεσικών δεδομένων στα
μελλοντικά δίκτυα LTE. Στην περίπτωση αυτή λαμβάνονται υπόψιν όλες οι βασικές τεχνικές μετάδοσης
δεδομένων όπως τα MIMO κεραιοσυστήματα. / Due to rapid growth of mobile communications technology, the demand for wireless multimedia
communications thrives in today’s consumer and corporate market. The need to evolve multimedia
applications and services is at a critical point given the proliferation and integration of wireless systems.
Consequently, there is a great interest in using the IP-based networks to provide multimedia services.
One of the most important areas in which the issues are being debated, is the development of standards
for the Universal Mobile Telecommunications System (UMTS).
UMTS constitutes the third generation (3G) of cellular wireless networks which aims to provide highspeed
data access along with real time voice calls. Wireless data is one of the major boosters of
wireless communications and one of the main motivations of the next generation standards. Through the
3G mobile networks, the mobile users have the opportunity to run applications and realize services that
offered until today only by wired networks. Such broadband services are mobile Internet, mobile TV,
mobile gaming, mobile streaming, video calls etc.
High Speed Packet Access (HSPA) constitutes a significant step towards the so-called Mobile
Broadband. HSPA supports both downlink and uplink communication through the HSDPA and HSUPA
channels, respectively. HSPA promises the provision of enhanced end-users’ experience with a wide
range of novel, interactive applications, faster performance and reduced delays. Furthermore, from the
operators’ prism, HSPA ensures improved network performance, increased capacity and higher
coverage.
Multimedia Broadcast Multicast Service (MBMS) is a novel framework, extending the existing UMTS
infrastructure that constitutes a significant step towards the so-called Mobile Broadband. MBMS is
intended to efficiently use network and radio resources, both in the core network and, most importantly,
in the air interface of UMTS Terrestrial Radio Access Network (UTRAN), where the bottleneck is placed
to a large group of users. Actually, MBMS is a point-to-multipoint service in which data is transmitted
from a single source entity to multiple destinations, allowing the networks resources to be shared.
MBMS is an efficient way to support the plethora of the emerging wireless multimedia and application
services such as IP Video Conferencing, Streaming Video by supporting both broadcast and multicast
transmission modes.
Long Term Evolution (LTE) will stretch the performance of 3G systems with improved coverage and
system capacity, as well as increased data rates and reduced latency. LTE also provides a tight
integration between unicast and multicast/broadcast MBMS transport bearers. Moreover, it also takes
3G-MBMS one step further to provide highly efficient multi-cell broadcast. By transmitting not only
identical signals from multiple cell sites (with identical coding and modulation), but also synchronize the
transmission timing between cells, the signal at the mobile terminal will appear exactly as a signal
transmitted from a single cell site and subject to multi-path propagation.
There is a growing demand for wireless data applications, which although face low penetration today,
are expected to gain high interest in future mobile networks. These applications actually reflect a
modern, future way of communication among mobile users. For instance, mobile TV is expected to be a
‘killer’ application for 3G’s. Such mobile TV services include streaming live TV (news, weather forecasts
etc.) and streaming video (such as video clips). All the above constitute a series of some indicative
emerging applications that necessitate advanced transmission techniques. However, increased
improvements have to be made both in the uplink and downlink transmission and in better radio
resource management, in order to meet future demands and provide rich multimedia services to large
users’ population. In addition, several obstacles, mainly regarding the interoperability and ubiquitous
access between different access technologies and services, have to be overcome (thus leading to 4G).
The main target of this dissertation is the study of power control issues, the development and the
performance evaluation of an efficient power scheme for the provision of broadband, multicast services
and applications to mobile users. This will be effectively implemented through the efficient use of MBMS
and HSPA technologies in both 3G and its evolution LTE. An important aspect of this work is the
investigation of the selection of the most efficient radio bearer for the transmission of MBMS multicast
data. MBMS services can be provided in each cell by either multiple Point to Point (PTP) channels or by
a single Point to Multipoint (PTM) channel. PTM transmission uses a single channel reaching down to
the cell edge, which conveys identical traffic. On the other hand, PTP transmission uses dedicated
channel allocated to each user, which conveys identical content. Obviously, a decision has to be made on the threshold between these two approaches. Therefore, improvements of the currently existing
Counting Mechanism in MBMS will be studied. Although relative research work in this field considers the
need for a power-based Counting Mechanism and not a UE-based Counting Mechanism, the case of
HSDPA usage in such a power mechanism could be further investigated, taking also into account the
availability of multi-mode cells. This could lead to an optimal scheme for the MBMS Counting
Mechanism.
The fundamental selection criterion of channel type is the amount of base station power required to
transmit to a group of users. To this direction, the role of power control in the MBMS multicast
transmission in UMTS is studied and analysed. A power control scheme for the efficient radio bearer
selection in MBMS is then proposed. The choice of the most efficient transport channel in terms of
power consumption is a key point for the MBMS since a wrong transport channel selection for the
transmission of the MBMS data could result to a significant decrease in the total capacity of the system.
Various UMTS transport channels are examined for the transmission of the multicast data and a new
algorithm is proposed for the more efficient usage of power resources in the base station.
|
9 |
Yδρολογική προσομοίωση λεκανών απορροής με ελλιπή δεδομένα / Hydrologic simulation of ungauged basinsΜέχλερη, Βαρβάρα 03 March 2008 (has links)
Στον ελληνικό χώρο, για έναν μεγάλο αριθμό λεκανών δεν υπάρχουν διαθέσιμες μετρήσεις απορροής, γεγονός που καθιστά δύσκολη την υδρολογική τους προσομοίωση για τον προσδιορισμό των συνιστωσών του υδρολογικού ισοζυγίου. Μια τέτοια περίπτωση αποτελούν οι λεκάνες απορροής των ποταμών του Πείρου και του Παραπείρου. Στους ποταμούς αυτούς κατασκευάζεται ένα σύστημα έργων που αποτελείται από ένα φράγμα εκτροπής στη θέση Βαλμαδούρα στον ποταμό Πείρο, έναν ταμιευτήρα στη θέση Αστέρι στον Παραπείρο και έναν συνδετικό αγωγό. Στόχος της κατασκευής των έργων αυτών αποτελεί η κάλυψη των υδρευτικών αναγκών της πόλης των Πατρών, της Βιομηχανικής Περιοχής και των κοινοτήτων της Β.Δ. Αχαϊας.
Στη μελέτη των έργων αυτών (Υ.ΠΕ.ΧΩ.Δ.Ε., 1997) ο υπολογισμός του υδρολογικού ισοζυγίου στις λεκάνες που αντιστοιχούν στις θέσεις των έργων βασίστηκε σε απλοποιητικές παραδοχές. Συγκεκριμένα θεωρήθηκε ότι το νερό αποθηκεύεται μόνο στην εδαφική ζώνη και δεν γίνεται διάκριση ανάμεσα σε επιφανειακή και υπόγεια απορροή.
Στην παρούσα εργασία για τον ακριβή και αναλυτικό προσδιορισμό των συνιστωσών του υδρολογικού ισοζυγίου χρησιμοποιήθηκε το υδρολογικό μοντέλο βροχής–απορροής ENNS (Nachtnebel, 1993), η χρήση του οποίου απαιτεί την εύρεση τιμών των παραμέτρων που υπεισέρχονται στις εξισώσεις των διαδικασιών που περιγράφουν το μοντέλο. Λόγω ελλείψεως μετρήσεων απορροής για τις λεκάνες του Πείρου και του Παραπείρου, για την εύρεση των τιμών των παραμέτρων του μοντέλου εφαρμόστηκε μια μεθοδολογία διερεύνησης της υδρολογικής ομοιότητας των δύο λεκανών με άλλες λεκάνες, για τις οποίες υπάρχουν διαθέσιμες μετρήσεις απορροής. Πιο συγκεκριμένα χρησιμοποιήθηκαν οι λεκάνες απορροής του Γλαύκου στον Νομό Αχαϊας, του Αχελώου που αντιστοιχεί στην θέση του φράγματος της Μεσοχώρας, του ποταμού Ερύμανθου, παραποτάμου του Αλφειού και του ποταμού Myakka στην Florida των Η.Π.Α.. Η διαδικασία που ακολουθήθηκε είναι η εξής:
Αρχικά πραγματοποιείται η ρύθμιση του μοντέλου για τις τέσσερις λεκάνες για τις οποίες υπάρχουν μετρήσεις απορροής με στόχο (α) να βρεθούν οι τιμές των παραμέτρων που επηρεάζουν το αποτέλεσμα της προσομοίωσης και (β) να διαπιστωθεί το εύρος διακύμανσης των τιμών αυτών των παραμέτρων. Λόγω του σημαντικού εύρους διακύμανσης αυτών των παραμέτρων, πραγματοποιείται η κατάταξη των λεκανών του Πείρου, του Παραπείρου και των τεσσάρων λεκανών, για τις οποίες υπάρχουν διαθέσιμες μετρήσεις απορροής, σύμφωνα με κάποιους φυσιογραφικούς και κλιματικούς παράγοντες που επιλέχθησαν, ως προς την αναμενόμενη επιφανειακή απορροή.
Στη συνέχεια, για τις λεκάνες για τις οποίες υπάρχουν διαθέσιμες μετρήσεις απορροής γίνεται έλεγχος εάν οι τιμές των παραμέτρων του μοντέλου είναι συμβατές με την κατάταξη των λεκανών σύμφωνα με τους φυσιογραφικούς και κλιματικούς παράγοντες. Επειδή προκύπτει ότι αυτό δεν συμβαίνει, πραγματοποιείται επαναρρύθμιση του μοντέλου αναζητώντας συνδυασμούς παραμέτρων, οι οποίοι να επαληθεύουν την κατάταξη των λεκανών.
Τέλος με βάση τα αποτελέσματα της διερεύνησης της υδρολογικής ομοιότητας των λεκανών επιλέγονται οι τιμές των παραμέτρων του μοντέλου για την υδρολογική προσομοίωση των λεκανών του Πείρου και του Παραπείρου.
Τα αποτελέσματα που προέκυψαν από την υδρολογική προσομοίωση του Πείρου και του Παραπείρου με την χρήση του μοντέλου συγκρίθηκαν με τα αποτελέσματα της μελέτης του Υ.ΠΕ.ΧΩ.Δ.Ε. (Μάρτιος 1997).
Τα συμπεράσματα που προκύπτουν από την παρούσα εργασία είναι τα εξής:
(α) Από την διερεύνηση της υδρολογικής ομοιότητας των λεκανών του Πείρου και του Παραπείρου με τις λεκάνες του Γλαύκου, του Ερύμανθου, της Μεσοχώρας και του ποταμού Myakka, Η.Π.Α. διαπιστώθηκε ότι η επαναρρύθμιση του μοντέλου που πραγματοποιήθηκε για τις τέσσερις λεκάνες, για τις οποίες υπαρχουν μετρήσεις απορροής, οδήγησε σε βελτίωση των αποτελεσμάτων της ρύθμισης (μείωση των αποκλίσεων της μετρημένης και προσομοιωμένης απορροής). Επίσης, επειδή ο λόγος της επιφανειακής απορροής προς την βροχή για τις τέσσερις λεκάνες επαληθεύει την κατάταξη σύμφωνα με τους φυσιογραφικούς και κλιματικούς παράγοντες, προκύπτει ότι η διαδικασία που ακολουθήθηκε αποτελεί μια δυνατότητα αντιστοίχισης των παραμέτρων του μοντέλου σε κριτήρια που προκύπτουν από αυτούς τους παράγοντες.
(β) Από την σύγκριση των αποτελεσμάτων της μελέτης του Υ.ΠΕ.ΧΩ.Δ.Ε. με τα αποτελέσματα του μοντέλου αποδεικνύεται ότι το μοντέλο δίνει πιο ρεαλιστικές τιμές για τις συνιστώσες του υδρολογικού ισοζυγίου των λεκανών του Πείρου και του Παραπείρου από την μελέτη. Οι λόγοι είναι ότι (α) σύμφωνα με την κατάταξη των λεκανών βάσει των φυσιογραφικών και κλιματικών παραγόντων οι λεκάνες του Πείρου και του Παραπείρου παρουσιάζουν υδρολογική ομοιότητα με την λεκάνη του Γλαύκου, για την οποία το μοντέλο δίνει μια ρεαλιστική προσέγγιση της συνολικής απορροής (άμεσης και βασικής) και (β) η βασική απορροή που υπολογίστηκε με το μοντέλο παρουσιάζει πολύ μικρότερη μεταβλητότητα στον χρόνο έναντι της άμεσης απορροής λόγω της αποθηκευτικής ικανότητας του εδάφους.
(γ) Από τα αποτελέσματα της υδρολογικής προσομοίωσης των λεκανών του Πείρου και του Παραπείρου με την χρήση του μοντέλου προκύπτει ότι τα ποσοστά της άμεσης απορροής προς την βροχόπτωση των λεκανών του Πείρου και του Παραπείρου σύμφωνα με το μοντέλο δεν ήταν τα αναμενόμενα, παρόλο που τα αποτελέσματα του μοντέλου κρίθηκαν ικανοποιητικά. Οι πιθανοί λόγοι είναι κάποια μειονεκτήματα που παρουσιάζει η μεθοδολογία διερεύνησης της υδρολογικής ομοιότητας των λεκανών και τα οποία κρίνεται ότι εάν ληφθούν υπόψη μπορούν να οδηγήσουν σε βελτίωση της μεθόδου. / In Greece, there is a significant number of ungauged basins, for which the hydrologic simulation is not possible and as a result calculating the components of the water balance is infeasible. The basins of the rivers Peiros and Parapeiros were selected as a case-study. These rivers are involved in a current project; the construction of a diversion dam in the position Valmadoura of Peiros River, a reservoir in the position Asteri of Parapeiros River and a conjection pipe. The aim of this project is to support the water supply of the city of Patras, the Industrial Region and the communities of the North-west Achaias.
The study of this project conducted by the Hellenic Ministry of Environment, Physical Planning and Public Works in 1997 deals with the calculation of the water balance in these basins, based on simplified principles, assuming that the water is stored in the soil layer and there is no separation of the total runoff in surface flow and base flow.
In the present study, the use of the rainfall-runoff model ENNS (Nachtnebel, 1993) allowed the exact and analytical quantification of the water balance. The use of this model requires the estimation of a number of parameters involved in the governing equations of the model. The lack of runoff measurements in Peiros and Parapeiros basins preclude the determination of the required parameters. A study of the hydrologic similarity of these two basins with a number of gauged basins gave solution to the problem. The chosen basins are: (a) Glaukos River basin in the prefecture of Achaias, (b) Mesoxora basin, a sub-basin of Acheloos River, (c) Erymanthos basin, a sub-basin of Alfeios River and (d) Myakka River basin, Florida of U.S.A. The procedure adopted is divided in the following steps:
Firstly, the model ENNS was established for the basins mentioned previously in order to determine (a) the value of the parameters affecting the simulation result and (b) the range of their values. The significant variation led to the classification of the six basins, according to physiographic and climatic characteristics. The criterion used in the classification is the expected surface runoff to the amount of rainfall.
Secondly, a compatibility check between the values of the parameters of the model and the basins classification was performed. The unsatisfying result compelled the reestablishement of the model for the four gauged basins with an aim to obtain the appropriate parameters in accordance with the basins classification.
Finally, the values of the ENNS parameters, regarding Peiros and Parapeiros basins, were derived from the study of the hydrologic similarity of the basins. The results of the hydrologic simulation of Peiros and Parapeiros were compared to the results of the study conducted by the Hellenic Ministry of Environment, Physical Planning and Public Works in 1997.
The conclusions of the present study are:
(a)The setup of the ENNS model taking into account the hydrologic similarity study of the six basins improved the results of the model (decrease of the deviations between the measured and simulated discharge values). Moreover the ratio of the surface runoff to the rainfall for the four gauged basins verifies the basins classification. Hence, a satisfying degree of correlation between the model parameters and the physiographic and climatic basin characteristics, is obtained.
(b)Comparing the obtained results to those of the Hellenic Ministry of Environment, Physical Planning and Public Works study in 1997, the present model gives a more realistic view of the water balance. The reasons are: (a) according to the basins classification, Peiros and Parapeiros basins are similar to Glaukos basin, for which the model gives a realistic approach of the total runoff (surface and base flow) and (b) the base flow calculated by the model shows a smaller variability, contrary to the surface flow due to the storage capacity of the soil.
(c)The results of the hydrologic simulation of Peiros and Parapeiros basins showed that the percentage of the surface runoff to the amount of rainfall for the two basins is not compatible to the classification (smaller than 36.5% of Glaukos basin). However, the results of the model are satisfactory (accordance of the annual simulated values of actual evapotranspiration to the values calculated using the Turc method). The possible reasons are some disadvantages in the basins hydrologic similarity study that must be taken into consideration in order to improve the method.
|
10 |
Ανάκτηση κειμένου και εξαγωγή κανόνων από κείμενα με βιολογικό περιεχόμενο / Text retrieval and rule extraction from documents with biological conceptΓαϊτάνου, Ευφροσύνη 01 October 2008 (has links)
Η ραγδαία ανάπτυξη του Παγκόσμιου Ιστού προσέφερε σε όλους τους χρήστες ανά τον κόσμο τη δυνατότητα άμεσης, γρήγορης και αποτελεσματικής προσπέλασης κάθε είδους πληροφορίας. Καθημερινά πραγματοποιούνται εκατομμύρια καταχωρήσεις πληροφοριών στο Διαδίκτυο με αποτέλεσμα ο όγκος της διακινούμενης πληροφορίας να αυξάνει με εκθετικούς ρυθμούς.
Με το πάτημα ενός κουμπιού, μια πληθώρα πληροφοριών, ακόμη και για το πιο εξειδικευμένο θέμα, βρίσκεται μπροστά στην οθόνη του χρήστη, έτοιμη προς ανάγνωση και επεξεργασία. Αυτή ακριβώς η «υπερδιάθεση» πληροφοριών καθιστά πολύ δύσκολη έως αδύνατη οποιουδήποτε είδους επεξεργασία των δεδομένων από το χρήστη, έστω και σε επίπεδο απλής ανάγνωσης.
Η ύπαρξη ενός εργαλείου ανάκτησης κειμένου και εξαγωγής όρων και κανόνων από μια υπερμεγέθη συλλογή κειμένων θα έδινε τη δυνατότητα στο χρήστη να ανακτήσει χρήσιμες πληροφορίες γρήγορα, χωρίς να είναι απαραίτητη η ανάγνωση και η φυσική επεξεργασία όλων αυτών των κειμένων.
Ειδικότερα στο ευαίσθητο πεδίο των Βιο-Επιστημών όπου η αδυναμία επεξεργασίας της διαθέσιμης πληροφορίας και της εξαγωγής χρήσιμων συνδέσεων και συμπερασμάτων επηρεάζει αρνητικά την επιστημονική έρευνα, είναι επιτακτική η ανάγκη παρουσίας εργαλείων που θα διευκολύνουν τη διαδικασία εξόρυξης γνώσης από κείμενα με βιολογικό περιεχόμενο.
Στην παρούσα διπλωματική εργασία γίνεται μια παρουσίαση τεχνικών με τις οποίες είναι δυνατή η εξαγωγή γνώσης και κανόνων από κείμενα ηλεκτρονικής μορφής στο Διαδίκτυο τα οποία αφορούν στο επιστημονικό πεδίο της Βιολογίας.
Η προσπάθειά μας επικεντρώνεται κυρίως στη δυνατότητα εξόρυξης γνώσης από κείμενα που αναφέρονται σε ένα συγκεκριμένο θέμα Βιολογίας (π.χ. μεταγραφικοί παράγοντες) και που η πραγματοποίηση του στόχου αυτού θα ήταν διαφορετικά από δύσκολη έως αδύνατη καθώς το πλήθος των κειμένων είναι απαγορευτικό για την αναλυτική μελέτη τους από ειδικό ή ομάδα ειδικών, πόσο μάλλον από έναν απλό χρήστη.
Αρχικά, περιγράφουμε τον τρόπο ανάκτησης των κειμένων που αναφέρονται στο συγκεκριμένο θέμα του ενδιαφέροντός μας από την ηλεκτρονική βιβλιοθήκη National Library of Medicine και τη δημιουργία της προς επεξεργασία συλλογής κειμένων. Η συλλογή αυτή υπόκειται σε λεξικολογική ανάλυση και επεξεργασία κατά τη διάρκεια της οποίας διατηρούνται από κάθε κείμενο οι πιο σημαντικοί όροι, ενώ οι υπόλοιποι απορρίπτονται. Με τον τρόπο αυτό δημιουργείται ένα σύνολο από τους πιο αντιπροσωπευτικούς όρους ανά κείμενο με τη συχνότητα εμφάνισής τους σε αυτά.
Στη συνέχεια, εφαρμόζουμε τεχνικές ομαδοποίησης δεδομένων με στόχο τη δημιουργία ομάδων όρων, αλλά και ομάδων κειμένων. Στα πλαίσια της προσπάθειας αυτής, πειραματιστήκαμε με διάφορες γνωστές τεχνικές ομαδοποίησης (αλγόριθμοι k-means και ιεραρχικός μονής σύνδεσης), ενώ υλοποιήσαμε εκ νέου τον αλγόριθμο ISODATA σε περιβάλλον ανάπτυξης Matlab.
Η έρευνά μας ολοκληρώνεται με την εφαρμογή της τεχνικής του Latent Semantic Indexing πριν τη ομαδοποίηση των δεδομένων και τη σύγκριση των αποτελεσμάτων.
Μέσα από τις ομάδες που δημιουργούνται με αυτή τη διαδικασία, διαπιστώνουμε την παρουσία συνδέσεων μεταξύ όρων και κειμένων και, ακόμη περισσότερο, τη δυνατότητα εξαγωγής συμπερασμάτων, αλλά και εξόρυξης πραγματικά νέας γνώσης επάνω σε συγκεκριμένα πεδία της επιστήμης της Βιολογίας. / The rapid growth of World Wide Web offered every user around the globe the ability to have immediate, quick and effective access to every kind of information. Daily, millions of records of information about every subject are added on Internet, giving the volume of available information an exponential boost.
Simply by pressing only one single button, a plethora of information – even about the most sophisticated topic - is laid out in front of user’s screen ready to be read and processed. This plethora is exactly the reason that makes it difficult or even impossible for a simple user to process all the available data, or even just read it.
It is clear that the presence of a tool that will make feasible the retrieval of documents and the extraction of terms and rule-associations from a huge document collection would give users the ability to retrieve valuable information quickly, without even reading or pre-processing all these documents.
Especially in Bio-sciences, the inability of processing the available information and extracting useful connections and assumptions is an obstacle in scientific research. Therefore, there is a crying need for tools that will facilitate the process of text mining from documents with biological concept.
In the present master thesis we present techniques for extracting knowledge and rules from documents in a digital format retrieved from Internet, with special reference to the scientific field of Biology.
Our attempt is mainly focused on knowledge extraction from documents with specific biological concept (e.g. transcription factors), which is a really difficult – in some cases even impossible – task to accomplish due to the huge amount of available documents that an expert or a group of experts should read and process – imagine what a simple user could do.
First, we describe the retrieval of documents referring to the specific biological concept we are interested about, from the National Library of Medicine and the construction of our document set. This set will be lexicological processed and only the most important term from each document will be kept while the rest will be ignored. This way, a set of the most representative terms per document will be created, along with the frequency in which the terms appear in each document.
Secondly, we apply clustering techniques over this terms-by-document set in order to produce clusters of terms as well as clusters of documents. During this step, many well known clustering techniques are being tested, such as the k-means algorithm and the hierarchical-single linkage algorithm. We also describe our implementation, the ISODATA algorithm. The implementation of all clustering algorithms tested here was done on Matlab 6p5.
Our research ends with the application of Latent Semantic Indexing (LSI) technique over our terms-by-documents set before the clustering step; we compare the resulting clusters with those taken without performing LSI before clustering.
It is in those clusters that we find many connections between terms and documents and - even more – we discover the ability of extracting not only conclusions about the concept of the documents in each cluster but also truly new knowledge referring to specific scientific fields of Biology.
|
Page generated in 0.0244 seconds