231 |
Cooperative and cognitive communication techniques for wireless networks / Συνεργατικές τεχνικές επικοινωνίας για ασύρματα δίκτυα γνωστικών κόμβωνΤσίνος, Χρήστος 16 May 2014 (has links)
During the past years wireless communications have been exhibiting an increased growth rendering them the most common way for communication. The continuously increasing demand for wireless services resulted in limited availability of the wireless spectrum. To this end, Cognitive Radio (CR) techniques have been proposed in literature during the past years. The concept of CR approach is to utilize advanced radio and signal-processing technology along with novel spectrum allocation policies to enable new unlicensed wireless users to operate in the existing occupied spectrum areas without degrading the performance of the existing licensed ones. Moreover, the broadcast and fading nature of the wireless channel results in severe degradation on the performance of wireless transmissions. A solution to the problem is the use of multiple-antenna systems so as to achieve spatial diversity. However, in many cases, the communication
devices' nature permit the support of multiple antennas due to size, power consumption, and hardware limitations. To this end, cooperative communications provide an alternative way to achieve spatial diversity via virtual antenna arrays formed by single antenna nodes. It is noteworthy that cooperation has an important role within the CR literature as many techniques developed within its context exploiting the benefits of cooperation in order to achieve improved performance. Therefore, the aim of the present dissertation is to develop efficient and practical cognitive, cooperative and cognitive cooperative schemes. More specifically the contributions are the following ones.
The first contribution is a novel CR communication scheme. During the past years numerous CR communication schemes have been presented in literature. To the best of our knowledge, the majority of them were developed assuming perfect Channel State Information (CSI) at the unlicensed user's side. There are several cases where the licensed users do not desire any interaction with the unlicensed ones. In such cases, the assumption that the unlicensed user can obtain CSI that concerns the licensed user channels is not valid and as a result the corresponding communication technique cannot be applied. Therefore, at first we propose an novel CR communication scheme that requires CSI that can be estimated in a completely blind manner. Then, the corresponding blind estimation scheme is developed. Another significant contribution is the theoretical results that have been derived for both the perfect CSI case and the imperfect CSI case (when the blind estimation scheme is employed for obtaining the corresponding CSI). Especially, the theoretical results that concern the imperfect CSI case are some of the first ones that appear in the relevant literature, to the best of our knowledge.
The second contribution is a decentralized adaptive Eigenvalue-Based spectrum Sensing (EBSS) technique for multi-antenna CR Systems. Spectrum Sensing is a fundamental functionality in CR systems. In general, the unlicensed user employs a spectrum sensing technique in order to detect licensed user(s) activity in scenarios where the former user is permitted to establish a communication link only via spectrum areas that are temporarily free of the latter one's transmissions. EBSS techniques are known to achieve good performance and also to be applicable in a completely blind manner. In the literature so far, only batch and centralized cooperative EBSS techniques have been considered which, however, suffer from limitations that render them impractical in several cases such as, when time-varying channels are involved or continuous spectrum monitoring is required. Thus, the aim here is to develop practical cooperative adaptive versions of typical Eigenvalue-Based Spectrum Sensing (EBSS) techniques which could be applied in a completely decentralized manner and cope well in time-varying scenarios. To this end, at first, novel adaptive EBSS techniques are developed for the Maximum Eigenvalue Detector (MED), the Maximum-Minimum Eigenvalue Detector (MMED), and the Generalized Likelihood Ratio Test (GLRT) schemes, respectively, for a single-user (no cooperation) case. Then, a novel distributed subspace tracking method is proposed which enables the cooperating nodes to track the joint subspace of their received signals. Based on this method, cooperative decentralized versions of the adaptive EBSS techniques are subsequently developed that overcome the limitations of the existing batch centralized approaches.
The third contribution is a new cooperative scheme for half-duplex uplink transmission. The technique is based on a virtual MIMO structure formed by the single antenna source and relays nodes along with the multi-antenna base station which is the destination node. The new technique aims at providing increased diversity and multiplexing gains, contrariwise to existing approaches where the proposed techniques achieve increased diversity gain at the cost of severe multiplexing gain loss. The theoretical outage probability and the corresponding Diversity Multiplexing Trade-off (DMT) curve of the proposed technique are also derived.
The final contribution is two novel algorithms which enable the relay cooperation for the distributed computation of the beamforming weights in a blind and adaptive manner, without the need to forward the data to a fusion center. The proposed algorithms are constituent parts of two corresponding distributed beamforming schemes for relay networks that distribute the computational overhead equally among the relay nodes. In the first scheme, the beamforming vector is computed through minimization of the total transmit power subject to a receiver quality-of-service constraint (QoS). In the second scheme, the beamforming weights are obtained through maximization of the receiver signal-to-noise-ration (SNR) subject to a total transmit power constraint. The proposed approaches achieve close performance to the one of the optimal beamforming solutions derived assuming perfect channel state information at the relays' side. / Τα τελευταία χρόνια, οι ασύρματες επικοινωνίες γνωρίζουν ραγδαία ανάπτυξη και ουσιαστικά αποτελούν τον πιο κοινό τρόπο επικοινωνίας. Η συνεχώς αυξανόμενη ζήτηση για υπηρεσίες ασύρματων επικοινωνιών έχει ως αποτέλεσμα την περιορισμένη διαθεσιμότητα του ασύρματου φάσματος συχνοτήτων. Για να αντιμετωπισθεί το προηγούμενο πρόβλημα, προτάθηκαν στο πρόσφατο παρελθόν τεχνικές στα πλαίσια των συστημάτων γνωσιακών κόμβων (Cognitive Radio- CR). Η βασική ιδέα ενός συστήματος CR είναι να χρησιμοποιήσει προηγμένες τεχνικές επικοινωνιών και επεξεργασίας σήματος μαζί με νέες τεχνικές ανάθεσης συχνοτήτων φάσματος για να επιτρέψει σε νέους μη αδειοδοτημένους ασύρματους χρήστες να λειτουργήσουν σε συχνότητες φάσματος που έχουν ανατεθεί σε αδειοδοτημένους χρήστες χωρίς να επηρεάζουν την επίδοση των τελευταίων. Επιπλέον, η ισχυρή παρεμβολή στις ασύρματες μεταδόσεις και η επίσης ισχυρή εξασθένιση του σήματος ενός ασύρματου συστήματος επικοινωνιών έχουν ως αποτέλεσμα τη σημαντική υποβάθμιση της επίδοσης των ασυρμάτων επικοινωνιών. Μια λύση στο προηγούμενο πρόβλημα μπορεί να δοθεί με την χρήση πολλαπλών κεραιών για την επίτευξη χωρικής ποικιλομορφίας. Σε πολλές περιπτώσεις όμως, η φύση των τηλεπικοινωνιακών συσκευών δεν επιτρέπει την υποστήριξη των πολλαπλών κεραιών λόγω περιορισμών στο μέγεθος της συσκευής, στην κατανάλωση ισχύος και στο υλικό. Ένας εναλλακτικός τρόπος για την επίτευξη χωρικής ποικιλομορφίας είναι μέσω των συνεργατικών επικοινωνιών (Cooperative Communications) οι οποίες σχηματίζουν γενικευμένα συστήματα πολλαπλών κεραιών από συστήματα μιας κεραίας. Είναι αξιοσημείωτο ότι η συνεργασία παίζει σημαντικό ρόλο στη βιβλιογραφία των συστημάτων CR, βάσει της οποίας αναπτύσσονται τεχνικές μετάδοσης με βελτιωμένη επίδοση. Επομένως, ο στόχος της παρούσας διατριβής είναι η ανάπτυξη αποδοτικών και πρακτικών τεχνικών γνωσιακών, συνεργατικών και γνωσιακών-συνεργατικών τεχνικών επικοινωνίας. Πιο συγκεκριμένα, η συνεισφορά της διατριβής μπορεί να χωριστεί στα ακόλουθα σκέλη.
Στο πρώτο σκέλος παρουσιάζουμε μια νέα τεχνική μετάδοσης για CR συστήματα. Στο πρόσφατο παρελθόν, μια πληθώρα τεχνικών μετάδοσης για CR συστήματα έχει παρουσιαστεί στη βιβλιογραφία. Η πληθώρα των τεχνικών αυτών έχει αναπτυχθεί υποθέτοντας τέλεια γνώση της κατάστασης των εμπλεκόμενων ασύρματων τεχνικών (Channel State Information – CSI) στην πλευρά των μη αδειοδοτημένων χρηστών. Υπάρχουν, όμως, αρκετές περιπτώσεις στις οποίες οι αδειοδοτημένοι χρήστες δεν επιθυμούν καμία αλληλεπίδραση με τους αντίστοιχους μη αδειοδοτημένους. Σε τέτοιες περιπτώσεις, η υπόθεση ότι ο μη αδειοδοτημένος χρήστης έχει πρόσβαση σε CSI που σχετίζεται με τα κανάλια του αντίστοιχου αδειοδοτημένου δεν είναι έγκυρη με αποτέλεσμα η σχετική τεχνική μετάδοσης να μην μπορεί να εφαρμοστεί. Συνεπώς, αρχικά προτείνουμε ένα καινοτόμο CR επικοινωνιακό σχήμα που απαιτεί CSI το οποίο μπορεί να υπολογισθεί με έναν εντελώς τυφλό τρόπο. Έπειτα η αντίστοιχη τυφλή τεχνική εκτίμησης αναπτύσσεται. Μια άλλη σημαντική συνεισφορά είναι τα θεωρητικά αποτελέσματα τα οποία έχουν εξαχθεί τόσο για την τέλεια CSI περίπτωση, όσο και για τη μη τέλεια CSI περίπτωση (όταν το τυφλό σχήμα εκτίμησης χρησιμοποιείται για την απόκτηση της αντίστοιχης CSI). Ειδικότερα, τα θεωρητικά αποτελέσματα τα οποία αφορούν τη μη τέλεια CSI περίπτωση είναι μερικά από τα πρώτα τα οποία εμφανίζονται στη σχετική βιβλιογραφία, από όσο γνωρίζουμε.
Το δεύτερο σκέλος αφορά μια απόκεντρικοποιημένη προσαρμοστική τεχνική επισκόπησης φάσματος ιδιοτιμών (Eigenvalue-Based Spectrum Sensing – EBSS) για συστήματα CR πολλαπλών κεραιών. Γενικά, ο μη αδειοδοτημένος χρήστης χρησιμοποιεί μία τεχνική επισκόπησης φάσματος προκειμένου να ανιχνεύσει την δραστηριότητα των αδειοδοτημένων χρηστών σε σενάρια όπου ο πρώτος επιτρέπεται να μεταδώσει μόνο διαμέσου περιοχών φάσματος οι οποίες είναι προσωρινά ελέυθερες από μεταδόσεις του δεύτερου. Είναι γνωστό ότι οι τεχνικές EBSS επιτυγχάνουν καλή επίδοση και είναι εφαρμόσιμες με ένα εντελώς τυφλό τρόπο. Στην βιβλιογραφία μέχρι στιγμής, έχουν μελετηθεί μόνο κεντρικοποιημένες συνεργατικές τεχνικές και τεχνικές τύπου batch οι οποίες υποφέρουν από περιορισμούς που τις καθιστούν μη πρακτικές σε αρκετές περιπτώσεις όπως όταν εμπλέκονται χρονικά μεταβαλλόμενα κανάλια ή όταν απαιτείται συνεχής παρακολούθηση του φάσματος. Συνεπώς, ο σκοπός εδώ είναι η ανάπτυξη πρακτικών συνεργατικών και προσαρμοστικών εκδοχών τυπικών EBSS οι οποίες μπορούν να εφαρμοστούν με ένα εντελώς αποκεντρικοποιημένο τρόπο και αποδίδουν καλά σε σενάρια που εμπλέκουν χρονικά μεταβαλλόμενα κανάλια. Προς αυτή την κατεύθυνση αναπτύσσονται αρχικά, νέες προσαρμοστικές εκδοχές για τις τεχνικές Maximum Eigenvalue Detector (MED), Maximum-Minimum Eigenvalue Detector (MMED) και την Generalized Likelihood Ratio Test (GLRT) αντίστοιχα για την περίπτωση του ενός χρήστη. Έπειτα μια νέα μέθοδος κατανεμημένης παρακολούθησης υποχώρου προτείνεται, η οποία επιτρέπει στους συνεργαζόμενους κόμβους να παρακολουθούν τον κοινό υποχώρο των ληφθέντων σημάτων τους. Με βάση αυτή την μέθοδο, συνεργατικές και αποκεντρικοποιημένες εκδοχές των προσαρμοστικών EBSS τεχνικών αναπτύσσονται οι οποίες ξεπερνούν τους περιορισμούς των υπαρχόντων κεντρικοποιημένων τεχνικών τύπου batch.
Το τρίτο σκέλος είναι μια νέα συνεργατική τεχνική για half-duplex uplink μετάδοση. Αυτή η τεχνική βασίζεται σε ένα γενικευμένο σύστημα πολλαπλών κεραιών σχηματιζόμενο από την μιας κεραίας πηγή και κόμβους συνεργατών μαζί με το σταθμό βάσης πολλαπλών κεραιών ο οποίος είναι και ο κόμβος προορισμός. Η νέα τεχνική στοχεύει στο να παρέχει αυξημένα κέρδη ποικιλομορφίας και πολυπλεξίας, σε αντίθεση με υπάρχουσες τεχνικές οι οποίες επιτυγχάνουν αυξημένα κέρδη ποικιλομορφίας σε βάρος του κέρδους ποικιλομορφίας. Η θεωρητική πιθανότητα διακοπής επικοινωνίας και η αντίστοιχη καμπύλη Diversity Multiplexing Tradeoff (DMT) της προτεινόμενης τεχνικής υπολογίζονται.
Το τελευταίο σκέλος είναι δύο νέοι αλγόριθμοι, οι οποίοι επιτρέπουν την ενδο-συνεργασία των συνεργατικών κόμβων για τον κατανεμημένο υπολογισμό των βαρών της τεχνικής προσανατολισμένης επικοινωνίας με τυφλό και προσαρμοστικό τρόπο χωρίς την ανάγκη προώθησης των δεδομένων σε έναν κόμβο σταθμό. Οι προτεινόμενοι αλγόριθμοι είναι συστατικά στοιχεία δύο αντίστοιχων τεχνικών προσανατολισμένης επικοινωνίας για δίκτυα συνεργατών τα οποία κατανέμουν τον υπολογιστικό φόρτο ισότιμα στους συνεργαζόμενους κόμβους. Στο πρώτο σχήμα το διάνυσμα βαρών υπολογίζεται ώστε να ελαχιστοποιείται η συνολική ισχύς μετάδοσης υπό έναν περιορισμό στην ποιότητα μετάδοσης. Το δεύτερο σχήμα, το διάνυσμα βαρών υπολογίζεται ώστε να μεγιστοποιείται το SNR του υπό έναν περιορισμό στην επιτρεπόμενη συνολική ισχύς μετάδοσης. Οι προτεινόμενες τεχνικές επιτυγχάνουν επίδοση κοντινή σε εκείνη των βέλτιστων λύσεων, οι οποίες έχουν υπολογισθεί υποθέτοντας τέλειο CSI στους κόμβους συνεργάτες.
|
232 |
Μελέτη με MRI μετακτινικών αλλοιώσεων στα οστά ασθενών με μεταστατικούς ή πρωτοπαθείς όγκους που υποβάλλονται σε ακτινοθεραπείαΡωμανός, Οδυσσεύς 10 June 2014 (has links)
Ο μυελός των οστών επηρεάζεται από λεμφοϋπερπλαστικές διαταραχές, μεταστατική νόσο, αλλά και από διάφορες θεραπευτικές προσεγγίσεις. Η μαγνητική τομογραφία είναι η πιο κατάλληλη μέθοδος για την ανίχνευση των μεταστάσεων και την παρακολούθηση μετά τη θεραπεία. Τεχνικές ανάλυσης εικόνας χρησιμοποιούνται επιπλέον προκειμένου να αντλήσουμε πρόσθετες διαγνωστικές πληροφορίες. Η παρούσα μελέτη επικεντρώνεται στις πρώιμες αλλαγές που προκαλούνται στον οστικό μυελό μετά από ακτινοβόληση και συγκρίνει καθιερωμένες μεθόδους για την ταυτοποίηση και τον χαρακτηρισμό αυτών των βλαβών με τη χρήση ενός αυτοματοποιημένου συστήματος ταξινόμησης.
ΜΕΘΟΔΟΙ: 36 ασθενείς με ιστολογικά επιβεβαιωμένη πρωτοπαθή κακοήθεια και οστικές μεταστάσεις συμπεριλήφθηκαν στη μελέτη. Όλοι οι ασθενείς υποβλήθηκαν σε ακττινοθεραπεία για την αντιμετώπιση οστικών μεταστάσεων στη σπονδυλική στήλη ή τη λεκάνη. Η μαγνητική τομογραφία πραγματοποιήθηκε ακριβώς πριν, 12 έως 18 ημέρες και 3 μήνες μετά την έναρξη της ακτινοθεραπείας. Ελήφθησαν εικόνες εντός, πλησίον και εκτός του πεδίου ακτινοβόλησης. Η ποιοτική αξιολόγηση πραγματοποιήθηκε ανεξάρτητα από δύο έμπειρους ακτινολόγους. Για την ποσοτική αξιολόγηση, συγκεκριμένες μετρήσεις επιλέχθηκαν και αξιολογήθηκαν με τη μέθοδο της περιοχής ενδιαφέροντος. Επιπλέον, χαρακτηριστικά υφής 1ης και 2ης τάξης εξήχθησαν και τοποθετήθηκαν σε ένα πιθανοτικό νευρωνικό δίκτυο, προκειμένου να δημιουργηθεί ένα σύστημα αυτόματης ταξινόμησης των βλαβών.
ΑΠΟΤΕΛΕΣΜΑΤΑ: Σύμφωνα με την ποιοτική και ποσοτική αξιολόγηση, εντός του πεδίου ακτινοβολίας 22.22% και 33.33% των ασθενών αντίστοιχα παρουσίασε λιπώδη μεταστροφή του μυελού, 19.44% και 16.67% των ασθενών παρουσίασε αιμορραγία, ενώ 11.11% και 16.67% των ασθενών εμφάνισε οίδημα του οστικού μυελού. Παρακείμενα του πεδίου ακτινοβόλησης 11.11% και 19.44% των ασθενών παρουσίασε λιπώδη μεταστροφή, 8.33% παρουσίασε αιμορραγία, ενώ 2.78% και 8.33% έδειξε οίδημα του μυελού των οστών. Εκτός του πεδίου ακτινοβολίας 5.56% των ασθενών παρουσίασαν αλλαγές συμβατές με λιπώδη μεταστροφή, ενώ το υπόλοιπο 94.44% δεν έδειξε σημαντικές μεταβολές.
Δεν υπήρξε στατιστικά σημαντική μεταβολή του δείκτη σκιαγραφικής ενίσχυσης μετά τη χορήγηση γαδολινίου. Με βάση την πολυπαραγοντική ανάλυση, καμία από τις παραμέτρους που μελετήθηκαν δεν φάνηκε να επηρεάζει στατιστικά σημαντικά την εμφάνιση οποιασδήποτε από τις μετακτινικές αλλοιώσεις.
Η μέγιστη συνολική ακρίβεια ταξινόμησης του συστήματός μας, ως προς τη διάκριση μεταξύ προ και μετακτινικών εικόνων ήταν 93.02%, με χρήση του συστήματος ταξινόμησης LSFT - PNN και της μεθόδου ECV. Η ακρίβεια του συστήματος στη διάκριση μεταξύ των τριών κυρίων τύπων των μετακτινικών βλαβών ήταν 86.67% .
ΣΥΜΠΕΡΑΣΜΑΤΑ: Η παρούσα μελέτη δείχνει ότι σημαντικό ποσοστό των ασθενών που υποβάλλονται σε ακτινοθεραπεία θα εμφανίσει τουλάχιστον μία από τις κοινές μετακτινικές μεταβολές του οστικού μυελού. Η λιπώδης μεταστροφή του μυελού είναι η πιο συχνά εμφανιζόμενη πρώιμη μεταβολή. Η ποιοτική ανάλυση των εικόνων μαγνητικής τομογραφίας υστερεί σε ευαισθησία σε σύγκριση με τις ποσοτικές μετρήσεις. Το βασζόμενο σε νευρικό δίκτυο προτεινόμενο σύστημα ταξινόμησης μπορεί να αποδειχθεί χρήσιμο εργαλείο για το χαρακτηρισμό αυτών των βλαβών. / Bone marrow can be affected by lymphoproliferative disorders and metastatic disease but also by several therapeutic approaches. MRI is the most suitable method for the detection of metastases and post-treatment follow-up. Image analysis techniques are now used to extract additional diagnostic information. This study focuses on the early radiation-induced changes that can be detected by MRI and compares the established methods for the identification and characterization of these lesions with an automated classification system.
METHODS: 36 patients with histologically confirmed primary malignancy and associated bone metastases were included in the study. All patients underwent radiation therapy (RT) to treat bone metastases to the spinal column or the pelvis. Magnetic resonance imaging (MRI) was performed just before the start of RT, 12 to 18 days and up to 3 months after the start of RT. Images were obtained within, adjacent and outside the radiation field. Qualitative assessment was performed independently by two experienced radiologists. For quantitative assessment, specific measurements were selected and evaluated by the method of the region of interest (ROI). In addition, textural features of 1st and 2nd class were exported and inserted into a probabilistic neural network classifier, in order to create an automatic classification system for these lesions.
RESULTS: Following qualitative and quantitative assessment, within the radiation field, 22.22% and 33.33% of patients respectively showed fatty conversion of the bone marrow, 19.44% and 16.67% of patients showed haemorrhage, while 11.11% and 16.67% of the patients demonstrated bone marrow oedema. Adjacent to the radiation field, 11.11% and 19.44% of patients showed fatty conversion, 8.33% showed haemorrhage, while 2.78% and 8.33% demonstrated bone marrow oedema. Outside of the radiation field, 5.56% of patients showed changes compatible with fatty conversion, while the remaining 94.44% showed no significant change.
There was no statistically significant change of the enhancement index after gadolinium administration. In multivariate analysis, none of the studied parameters did not appear to affect significantly the appearance of any of the radiation-induced lesions.
The largest overall classification accuracy of the system designed to distinguish between the pre- radiation and radiation-induced images was 93.02% using the LSFT-PNN classification system of multiple sequences and the ECV method. Discrimination accuracy of the classification system designed to distinguish between the three main types of post-radiation lesions was 86.67%.
CONCLUSIONS: This study shows that a significant proportion of patients undergoing RT will experience at least one of the common radiation-induced bone marrow changes. Fatty marrow conversion is the most often featured change in the examined period. Qualitative analysis of the MRI images lacks sensitivity comparing to quantitative measurements. The proposed classification system, based on the neural network, can be used as a very helpful tool for the characterization of these lesions.
|
233 |
Δομές δεικτοδότησης και υπολογισμός ερωτημάτων εύρους κ-διαστάσεων σε κατανεμημένα περιβάλλοντα / Indexing structures and computation k-dimensional range queries in distributed environmentsΚαπλάνης, Αθανάσιος 24 November 2014 (has links)
Ανέκαθεν, η ανάγκη του ανθρώπου για πληροφορία ήτανε μια από αυτές που φρόντιζε να ικανοποιήσει όσο το δυνατόν πληρέστερα. Η πληροφορία είναι σε όλες τις περιπτώσεις ένα πολύτιμο εργαλείο στην λήψη αποφάσεων και οι άνθρωποι γρήγορα αντιλήφθηκαν την σημασία της, ειδικότερα μάλιστα στην σύγχρονη εποχή στην οποία μέσω της επιστήμης της Πληροφορικής δόθηκε η δυνατότητα σε μεγάλο μέρος του κοινού να έχει πρόσβαση σε τεράστιο όγκο δεδομένων, τα οποία μέσω της σωστής επεξεργασίας μετατρέπονται σε πληροφορία. Αυτό που πλέον αποτελεί πρόκληση, η οποία μας καλεί σαν επιστήμονες της Πληροφορικής να αντιμετωπίσουμε, είναι η εύρεση και στην συνέχεια η εφαρμογή καινούργιων μεθόδων γρήγορης και ανέξοδης συλλογής, αποδοτικής αποθήκευσης και εποικοδομητικής ανάλυσης δεδομένων, έτσι ώστε να γίνουν πληροφορία ποιοτική, πλούσια και με σημαντική χρηστική αξία. Στις μέρες μας, η ανάπτυξη του κλάδου τόσο των κατανεμημένων συστημάτων όσο και του διαδικτύου, μας έχουνε δώσει την δυνατότητα να χρησιμοποιούνται χαμηλοί σε απαιτήσεις υπολογιστικοί πόροι για να επεξεργάζονται παράλληλα μεγάλο όγκο δεδομένων. Ο κλάδος της Πληροφορικής που ασχολείται εκτενώς με αυτά τα συστήματα είναι τα ομότιμα συστήματα ή αλλιώς p2p συστήματα και ο κατανεμημένος υπολογισμός.
Η παρούσα διπλωματική εργασία έχει ως στόχο να βρίσκει σε κατανεμημένο περιβάλλον σημεία στις δύο διαστάσεις. Ορίζεται, δηλαδή, ένας χώρος από κ – διαστάσεις που είναι το πλέγμα (grid), στον οποίο ο χρήστης προσπαθεί να εντοπίσει σημεία που τον ενδιαφέρουν δημιουργώντας έτσι ερωτήματα εύρους. Το σύστημα θα ψάχνει να βρει το αποτέλεσμα στο ερώτημα αυτό για να καταλήξει σε ποιο από τα άλλα ορθογώνια τμήματα του πλέγματος εμπλέκεται και στην συνέχεια αυτά (τα τμήματα) θα επιστρέφονται. Πιο συγκεκριμένα, το πλέγμα μας χωρίζεται σε τετράγωνες περιοχές και κάθε κόμβος του κατανεμημένου δικτύου αναλαμβάνει να φιλοξενήσει τα σημεία της κάθε τετράγωνης περιοχής. Όλοι αυτοί οι κόμβοι οργανώνονται σε ένα hadoop cluster και τα δεδομένα εισάγονται στην κατανεμημένη βάση δεδομένων HBase που βασίζεται στην αρχιτεκτονική του BigTable της Google File System. Ο τρόπος που οργανώνονται τα δεδομένα στην HBase είναι κατανεμημένος και γίνεται χρήση των B+ -δέντρων. Η χρησιμότητα των B+ -δέντρων σε συνδυασμό με το κατανεμημένο πλαίσιο εργασίας του Hadoop, έγκειται στο γεγονός ότι με την χρήση των απαραίτητων εργαλείων τόσο της HBase όσο και του Hadoop FS, μπορούμε να γνωρίζουμε σε ποιόν κόμβο του hadoop cluster είναι αποθηκευμένοι οι ζητούμενοι κόμβοι του B+ -δέντρου και έτσι να επιτυγχάνεται η γρήγορη ανάκτηση των αποτελεσμάτων σε ένα ερώτημα εύρους.
Η διάρθρωση της εργασίας έχει ως εξής: Στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στις έννοιες του κατανεμημένου υπολογισμού πάνω σε κατανεμημένα περιβάλλοντα. Στο δεύτερο γίνεται μια αναφορά στα ομότιμα δίκτυα (p2p) και πιο συγκεκριμένα αναλύεται το δίκτυο επικάλυψης του BATON που έχει δενδρική δομή όμοια με αυτή του Β+ -δέντρου. Στο τρίτο κεφάλαιο αναφέρεται μια υλοποίηση δεικτοδότησης και απάντησης σε ερωτήματα εύρους στο Νέφος Υπολογιστών με χρήση βασικών δομών δεδομένων B+ -δέντρου. Επίσης, η ART Autonomous Range Tree δομή παρουσιάζεται η οποία μπορεί να υποστηρίξει ερωτήματα εύρους σε τόσο ευρείας κλίμακας σε μη κεντρικοποιημένα περιβάλλοντα και μπορεί να κλιμακώνεται σε σχέση με τον αριθμό των κόμβων, καθώς και με βάση τα στοιχεία που είναι αποθηκευμένα. Η ART δομή ξεπερνά τις πιο δημοφιλείς μη κεντρικοποιημένες δομές, συμπεριλαμβανομένου του Chord (και μερικοί από τους διαδόχους του), του ΒΑΤΟΝ (και τον διάδοχό του) και των Skip-Graphs. Στο τέταρτο και πέμπτο κεφάλαιο, αντίστοιχα, γίνεται μια αναφορά στα βασικότερα σημεία της αρχιτεκτονικής και της λειτουργίας του Hadoop Framework και της HBase. Στο έκτο κεφάλαιο, βρίσκεται η περιγραφή της υλοποίησης της παρούσης διπλωματικής εργασίας μαζί με τους αλγορίθμους και τον τρόπο λειτουργίας τους. Στο επόμενο γίνεται η αξιολόγηση των πειραματικών αποτελεσμάτων της παρούσης διπλωματικής εργασίας καθώς, και το τι συμπεράσματα προκύπτουν μέσα από την αξιολόγηση. Τέλος, στο τελευταίο και όγδοο κεφάλαιο γίνεται η αποτίμηση της διπλωματικής εργασίας, καθώς αναφέρονται τα βασικά της μέρη, όπως επίσης και πιθανές προεκτάσεις που θα βελτίωναν την απόδοση του συστήματος. / Traditionally, the human need for information was one of those seeking to satisfy as much as possible. Information is in every way a valuable tool in decision making and people quickly realized its importance, especially in modern times, when the Information Technology gave the public access to the vast volume of data, which can be further processed into information. What seems to be now a challenge that IT specialists have to face is finding and implementing new methods of fast and inexpensive data collection, efficient storing of data and constructive data analysis, in order to turn them into quality, rich and useful information. Nowadays, the devel-opment of both the field of distributed systems and the Internet gave us the possibility of using computational resources with low requirements for simultaneous processing of large amounts of data. The IT field that deals extensively with these systems are peer-to-peer systems (p2p) and distributed computing.
The present dissertation aims at finding points in a distributed environment in the two-dimensional space. A space of k – dimensions is defined, i.e. the grid, in which the user tries to identify points of interest creating range queries. The system will search to find the result in this question to come up with the rectangular section of the grid that is involved and then these sections will be returned. More specifically, the grid is divided into square areas, and each node of the distributed network will accommodate points of each square area. All these nodes are organized into a hadoop cluster and the data is imported into the HBase distributed database based on BigTable architecture of the Google File System. In HBase data is organized in a distributed way and B+ -trees are used. The utility of B+ -trees in conjunction with the distributed framework of Hadoop lies on the fact that using the necessary tools of both HBase and Hadoop FS we can know in which hadoop cluster node the requested B+ -tree nodes are stored and thus achieve fast results retrieval in a range query.
The structure of the project is as follows: The first chapter is an introduction to the concepts of distributed computing over distributed environments. The second is a reference to peer-to-peer networks (p2p) and more specifically the BATON overlay network, which has a tree structure similar to that of the B+ -tree, is analyzed. The third chapter deals with an indexation and answering implementation on range queries in the Computer Cloud using B+ -tree basic data structures. Also, ART Autonomous Range Tree structure is presented which can support range queries in such large-scale decentralized environments and can scale in terms of the number of nodes as well as in terms of the data items stored. ART outperforms the most popular decentralized structures, including Chord (and some of its successors), BATON (and its successor) and Skip-Graphs. In the fourth and fifth chapter respectively a reference is made to the main points of Hadoop Framework and HBase architecture and operation. The sixth chapter is the description of the implementation of this dissertation together with the algorithms and how they operate. The next chapter is the evaluation of the experimental results of this dissertation and of the conclusions that derive from the evaluation. Finally, the eighth and last chapter is an overview of the dissertation, mentioning its basic parts, as well as possible extensions that would improve the system performance.
|
234 |
Σχεδιασμός και υλοποίηση πολυκριτηριακής υβριδικής μεθόδου ταξινόμησης βιολογικών δεδομένων με χρήση εξελικτικών αλγορίθμων και νευρωνικών δικτύωνΣκρεπετός, Δημήτριος 09 October 2014 (has links)
Δύσκολα προβλήματα ταξινόμησης από τον χώρο της
Βιοπληροφορικής όπως η πρόβλεψη των microRNA γονιδιών και η πρόβλεψη των πρωτεϊνικών αλληλεπιδράσεων (Protein- Protein Interactions) απαιτούν ισχυρούς ταξινομητές οι οποίοι θα πρέπει να έχουν καλή ακρίβεια ταξινόμησης, να χειρίζονται ελλιπείς τιμές, να είναι ερμηνεύσιμοι, και να μην πάσχουν από το πρόβλημα ανισορροπίας κλάσεων. Ένας ευρέως χρησιμοποιούμενος ταξινομητής είναι τα νευρωνικά δίκτυα, τα οποία ωστόσο χρειάζονται προσδιορισμό της αρχιτεκτονικής τους και των λοιπών παραμέτρων τους, ενώ και οι αλγόριθμοι εκμάθησής τους συνήθως συγκλίνουν σε τοπικά ελάχιστα. Για τους λόγους αυτούς, προτείνεται μία πολυκριτηριακή εξελικτική μέθοδος η οποία βασίζεται στους εξελικτικούς αλγορίθμους ώστε να βελτιστοποιήσει πολλά από τα προαναφερθέντα κριτήρια απόδοσης των νευρωνικών δικτύων, να βρει επίσης την βέλτιση αρχιτεκτονική καθώς και ένα ολικό ελάχιστο για τα συναπτικά τους βάρη. Στην συνέχεια, από τον πληθυσμό που προκύπτει χρησιμοποιούμε το σύνολό του ώστε να επιτύχουμε την ταξινόμηση. / Hard classification problems of the area of Bioinformatics, like microRNA prediction and PPI prediction, demand powerful classifiers which must have good prediction accuracy, handle missing values, be interpretable, and not suffer from the class imbalance problem. One wide used classifier is neural networks, which need definition of their architecture and their other parameters, while their training algorithms usually converge to local minima. For those reasons, we suggest a multi-objective evolutionary method, which is based to evolutionary algorithms in order to optimise many of the aforementioned criteria of the performance of a neural network, and also find the optimised architecture and a global minimum for its weights. Then, from the ensuing population, we use it as an ensemble classifier in order to perform the classification.
|
235 |
Αναγνώριση προτύπων από εικόνεςΚωτσιόπουλος, Χάρης 06 November 2014 (has links)
Η παρούσα διπλωματική εργασία ασχολείται με ένα σημαντικό ερευνητικό πρόβλημα του πεδίου της υπολογιστικής όρασης το οποίο είναι η Αναγνώριση Προτύπων (pattern recognition) μέσα από εικόνες. Πιο συγκεκριμένα, θα μελετήσουμε τον σχεδιασμό και την υλοποίηση ενός συστήματος αναγνώρισης αντικειμένων από ψηφιακές εικόνες καθώς και την ταξινόμησή τους σε κατηγορίες (image classification). / This thesis deals with an important research problem field of computer vision which is pattern recognition through images. In particular, we will study the design and implementation of a system to recognize objects from digital images and their classification in categories (image classification).
|
236 |
Μελέτη και χρήση τεχνικών τεχνητής νοημοσύνης για διαχείριση ιατρικής πληροφορίαςΣταματοπούλου, Κωνσταντίνα - Μαρία 05 February 2015 (has links)
Η τεχνητή νοημοσύνη στη βιοπληροφορική θεωρείται ένα πολύ σημαντικό βήμα αναφορικά με την κατηγοριοποίηση των ασθενειών, ακόμα και τη θεραπεία αυτών. Μέσω των νευρωνικών δικτύων τεχνητής νοημοσύνης μπορούμε να επεξεργαστούμε ιατρική πληροφορία και να κατηγοριοποιήσουμε μοτίβα καίριας σημασίας όσον αφορά την ιατρική διάγνωση. Βέβαια, καθώς στη λήψη αποφάσεων πάντα εισχωρεί ο παράγοντας της αβεβαιότητας, μία από τις πιο κατάλληλες προσεγγίσεις, η οποία προσομοιώνει τον τρόπο που κάθε άνθρωπος λαμβάνει αποφάσεις, είναι η ασαφής λογική. Συνδιάζοντας την ασαφή λογική με τη γνώση ειδικών μπορούμε να μοντελοποιήσουμε σύνθετα φαινόμενα και να αποφανθούμε για τη φύση αυτών. Σε αυτή τη διπλωματική εργασία υλοποιείται ένα ασαφές έξυπνο σύστημα που έχει ως σκοπό να μοντελοποιήσει πέντα καρδιολογικής φύσεως ασθένειες, χρησιμοποιώντας υλικό το οποίο προέρχεται από τη γνώση ειδικών στον τομέα της καρδιολογίας: στεφανιαία νόσος, υπέρταση, κολπική μαρμαρυγή, καρδιακή ανεπάρκεια, διαβήτης. Επιπλέον, το σύστημα, σε συνεργασία με το αρμόδιο ιατρικό προσωπικό, παραμετροποιήθηκε και στη συνέχεια έγινε προσπάθεια βελτιστοποίησής του μέσω της ενσωμάτωσης νευρωνικών δικτύων. Η αποδοτικότητά του αξιολογήθηκε ευνοϊκά μέσα από μία ομάδα ιατρών, δίνοντας ελπίδες για μία νέα εποχή στον τρόπο διεξαγωγής ιατρικής διάγνωσης. Το συγκεκριμένο σύστημα θα αποτελέσει τμήμα του Cardiosmart365, ενός ολοκληρωμένου συστήματος για τη δια βίου παρακολούθηση ασθενών με καρδιολογικά προβλήματα, την έγκαιρη διάγνωση και τη βέλτιστη διαχείριση περιπτώσεων εκτάκτου ανάγκης. Σε αυτό το έξυπνο ασαφές σύστημα προσαρτάται η γνώση που προκύπτει μέσα από τα νευρωνικά δίκτυα, με την οποία και επιτυγχάνεται αυτόματα η βελτιστοποίησή του. / Arti cial intelligence (AI) in bioinformatics is considered to be a great step towards
disease classi cation, or even disease treatment. AI gives the opportunity through
arti cial neural networks (ANNs) to process medical information and classify pat-
terns, something of great importance, as far as medical diagnosis is conserned. How-
ever, since there is always the factor of uncertainty in decision making, fuzzy logic is
considered to be one of the most suitable approximations, since it deals with reason-
ing that is approximate rather than xed and exact, thus closer to human reasoning.
Therefore, based on human expert knowledge they are capable of modeling complex
phenomena.
In this diploma thesis, we implement a fuzzy expert system, consisting of ve
subsystems, concerning ve cariological diseases, incorporating expert knowledge on
this particular eld: coronary artery disease, hypertension, atrial brillation, heart
failure, and diabetes. Moreover, the parameters were con gured, in cooperation with
experts on the eld, and optimization e orts were made through the integration
of neural networks. Evaluated by a group of doctors, the e ciency was rated as
satisfactory, giving hope for a new era in the way medical diagnosis is conducted.
This system will be a part of Cardiosmart365, an integrated system for lifelong
cardiologic patient monitoring, early detection of emergency, and optimal process
management of the emergency incident. In the fuzzy expert system implemented,
knowledge through neural networks is incorporated, thus achieving automatic opti-
mization.
|
237 |
Distributed processing techniques for parameter estimation and efficient data-gathering in wireless communication and sensor networks / Κατανεμημένες τεχνικές επεξεργασίας για εκτίμηση παραμέτρων και αποδοτική συλλογή δεδομένων σε ασύρματα δίκτυα επικοινωνιών και αισθητήρωνBogdanovic, Nikola 07 May 2015 (has links)
This dissertation deals with the distributed processing techniques for parameter estimation and efficient data-gathering in wireless communication and sensor networks.
With the aim of enabling an energy aware and low-complexity distributed implementation of the estimation task, several useful optimization techniques that generally yield linear estimators were derived in the literature. Up to now, most of the works considered that the nodes are interested in estimating the same vector of global parameters. This scenario can be viewed as a special case of a more general problem where the nodes of the network have overlapped but different estimation interests.
Motivated by this fact, this dissertation states a new Node-Specific Parameter Estimation (NSPE) formulation where the nodes are interested in estimating parameters of local, common and/or global interest. We consider a setting where the NSPE interests are partially overlapping, while the non-overlapping parts can be arbitrarily different. This setting can model several applications, e.g., cooperative spectrum sensing in cognitive radio networks, power system state estimation in smart grids etc. Unsurprisingly, the effectiveness of any distributed adaptive implementation is dependent on the ways cooperation is established at the network level, as well as the processing strategies considered at the node level.
At the network level, this dissertation is concerned with the incremental and diffusion cooperation schemes in the NSPE settings. Under the incremental mode, each node communicates with only one neighbor, and the data are processed in a cyclic manner throughout the network at each time instant. On the other hand, in the diffusion mode at each time step each node of the network cooperates with a set of neighboring nodes.
Based on Least-Mean Squares (LMS) and Recursive Least-Squares (RLS) learning rules employed at the node level, we derive novel distributed estimation algorithms that undertake distinct but coupled optimization processes in order to obtain adaptive solutions of the considered NSPE setting.
The detailed analyses of the mean convergence and the steady-state mean-square performance have been provided. Finally, different performance gains have been illustrated in the context of cooperative spectrum sensing in cognitive radio networks. Another fundamental problem that has been considered in this dissertation is the data-gathering problem, sometimes also named as the sensor reachback, that arises in Wireless Sensor Networks (WSN). In particular, the problem is related to the transmission of the acquired observations to a data-collecting node, often termed to as sink node, which has increased processing capabilities and more available power as compared to the other nodes. Here, we focus on WSNs deployed for structural health monitoring.
In general, there are several difficulties in the sensor reachback problem arising in such a network. Firstly, the amount of data generated by the sensor nodes may be immense, due to the fact that structural monitoring applications need to transfer relatively large amounts of dynamic response measurement data. Furthermore, the assumption that all sensors have direct, line-of-sight link to the sink does not hold in the case of these structures.
To reduce the amount of data required to be transmitted to the sink node, the correlation among measurements of neighboring nodes can be exploited. A possible approach to exploit spatial data correlation is Distributed Source Coding (DSC). A DSC technique may achieve lossless compression of multiple correlated sensor outputs without establishing any communication links between the nodes. Other approaches employ lossy techniques by taking advantage of the temporal correlations in the data and/or suitable stochastic modeling of the underlying processes. In this dissertation, we present a channel-aware lossless extension of sequential decoding based on cooperation between the nodes. Next, we also present a cooperative communication protocol based on adaptive spatio-temporal prediction. As a more practical approach, it allows a lossy reconstruction of transmitted data, while offering considerable energy savings in terms of transmissions toward the sink. / Η παρούσα διατριβή ασχολείται με τεχνικές κατανεμημένης επεξεργασίας για εκτίμηση παραμέτρων και για την αποδοτική συλλογή δεδομένων σε ασύρματα δίκτυα επικοινωνιών και αισθητήρων.
Το πρόβλημα της εκτίμησης συνίσταται στην εξαγωγή ενός συνόλου παραμέτρων από χρονικές και χωρικές θορυβώδεις μετρήσεις που συλλέγονται από διαφορετικούς κόμβους οι οποίοι παρακολουθούν μια περιοχή ή ένα πεδίο. Ο στόχος είναι να εξαχθεί μια εκτίμηση που θα είναι τόσο ακριβής όσο αυτή που θα πετυχαίναμε εάν κάθε κόμβος είχε πρόσβαση στην πληροφορία που έχει το σύνολο του δικτύου. Στο πρόσφατο σχετικά παρελθόν έγιναν διάφορες προσπάθειες που είχαν ως σκοπό την ανάπτυξη ενεργειακά αποδοτικών και χαμηλής πολυπλοκότητας κατανεμημένων υλοποίησεων του εκτιμητή. Έτσι, υπάρχουν πλέον στη βιβλιογραφία διάφορες ενδιαφέρουσες τεχνικές βελτιστοποίησης που οδηγούν σε γραμμικούς, κυρίως, εκτιμητές. Μέχρι τώρα, οι περισσότερες εργασίες θεωρούσαν ότι οι κόμβοι ενδιαφέρονται για την εκτίμηση ενός κοινού διανύσματος παραμέτρων, το οποίο είναι ίδιο για όλο το δίκτυο. Αυτό το σενάριο μπορεί να θεωρηθεί ως μια ειδική περίπτωση ενός γενικότερου προβλήματος, όπου οι κόμβοι του δικτύου έχουν επικαλυπτόμενα αλλά διαφορετικά ενδιαφέροντα εκτίμησης.
Παρακινημένη από αυτό το γεγονός, αυτή η Διατριβή ορίζει ένα νέο πλαίσιο της Κόμβο-Ειδικής Εκτίμησης Παραμέτρων (ΚΕΕΠ), όπου οι κόμβοι ενδιαφέρονται για την εκτίμηση των παραμέτρων τοπικού ενδιαφέροντος, των παραμέτρων που είναι κοινές σε ένα υποσύνολο των κόμβων ή/και των παραμέτρων που είναι κοινές σε όλο το δίκτυο. Θεωρούμε ένα περιβάλλον όπου η ΚΕΕΠ αναφέρεται σε ενδιαφέροντα που αλληλεπικαλύπτονται εν μέρει, ενώ τα μη επικαλυπτόμενα τμήματα μπορούν να είναι αυθαίρετα διαφορετικά. Αυτό το πλαίσιο μπορεί να μοντελοποιήσει διάφορες εφαρμογές, π.χ., συνεργατική ανίχνευση φάσματος σε γνωστικά δίκτυα ραδιοεπικοινωνιών, εκτίμηση της κατάστασης ενός δικτύου μεταφοράς ενέργειας κλπ. Όπως αναμένεται, η αποτελεσματικότητα της οποιασδήποτε κατανεμημένης προσαρμοστικής τεχνικής εξαρτάται και από τον συγκεκριμένο τρόπο με τον οποίο πραγματοποιείται η συνεργασία σε επίπεδο δικτύου, καθώς και από τις στρατηγικές επεξεργασίας που χρησιμοποιούνται σε επίπεδο κόμβου. Σε επίπεδο δικτύου, αυτή η διατριβή ασχολείται με τον incremental (κυκλικά εξελισσόμενο) και με τον diffusion (διαχεόμενο) τρόπο συνεργασίας στο πλαίσιο της ΚΕΕΠ. Στον incremental τρόπο, κάθε κόμβος επικοινωνεί μόνο με ένα γείτονα, και τα δεδομένα από το δίκτυο υποβάλλονται σε επεξεργασία με ένα κυκλικό τρόπο σε κάθε χρονική στιγμή. Από την άλλη πλευρά, στον diffusion τρόπο σε κάθε χρονική στιγμή κάθε κόμβος του δικτύου συνεργάζεται με ένα σύνολο γειτονικών κόμβων. Με βάση τους αλγορίθμους Ελαχίστων Μέσων Τετραγώνων (ΕΜΤ) και Αναδρομικών Ελαχίστων Τετραγώνων (ΑΕΤ) οι οποίοι χρησιμοποιούνται ως κανόνες μάθησης σε επίπεδο κόμβου, αναπτύσσουμε νέους κατανεμημένους αλγόριθμους για την εκτίμηση οι οποίοι αναλαμβάνουν ευδιακριτές, αλλά συνδεδεμένες διαδικασίες βελτιστοποίησης, προκειμένου να αποκτηθούν οι προσαρμοστικές λύσεις της εξεταζόμενης ΚΕΕΠ. Οι λεπτομερείς αναλύσεις για τη σύγκλιση ως προς τη μέση τιμή και για τη μέση τετραγωνική απόδοση σταθερής κατάστασης έχουν επίσης εξαχθεί στο πλαίσιο αυτής της Διατριβής. Τέλος, όπως αποδεικνύεται, η εφαρμογή των προτεινόμενων τεχνικών εκτίμησης στο πλαίσιο της συνεργατικής ανίχνευσης φάσματος σε γνωστικές ραδιοεπικοινωνίες, οδηγεί σε αισθητά κέρδη απόδοσης.
Ένα άλλο βασικό πρόβλημα που έχει μελετηθεί στην παρούσα εργασία είναι το πρόβλημα συλλογής δεδομένων, επίσης γνωστό ως sensor reachback, το οποίο προκύπτει σε ασύρματα δίκτυα αισθητήρων (ΑΔΑ). Πιο συγκεκριμένα, το πρόβλημα σχετίζεται με την μετάδοση των λαμβανόμενων μετρήσεων σε έναν κόμβο συλλογής δεδομένων, που ονομάζεται sink node, ο οποίος έχει αυξημένες δυνατότητες επεξεργασίας και περισσότερη διαθέσιμη ισχύ σε σύγκριση με τους άλλους κόμβους. Εδώ, έχουμε επικεντρωθεί σε ΑΔΑ που έχουν αναπτυχθεί για την παρακολούθηση της υγείας κατασκευών. Σε γενικές γραμμές, σε ένα τέτοιο δίκτυο προκύπτουν πολλές δυσκολίες σε ότι αφορά το sensor reachback προβλήμα. Πρώτον, η ποσότητα των δεδομένων που παράγονται από τους αισθητήρες μπορεί να είναι τεράστια, γεγονός που οφείλεται στο ότι για την παρακολούθηση της υγείας κατασκευών είναι απαραίτητο να μεταφερθούν σχετικά μεγάλες ποσότητες μετρήσεων δυναμικής απόκρισης. Επιπλέον, η υπόθεση ότι όλοι οι αισθητήρες έχουν απευθείας μονοπάτι μετάδοσης, με άλλα λόγια ότι βρίσκονται σε οπτική επαφή με τον sink node, δεν ισχύει στην περίπτωση των δομών αυτών.
Για να μειωθεί η ποσότητα των δεδομένων που απαιτούνται για να μεταδοθούν στον sink node, αξιοποιείται η συσχέτιση μεταξύ των μετρήσεων των γειτονικών κόμβων. Μία πιθανή προσέγγιση για την αξιοποίηση της χωρικής συσχέτισης μεταξύ δεδομένων σχετίζεται με την Κατανεμημένη Κωδικοποίηση Πηγής (ΚΚΠ). Η τεχνική ΚΚΠ επιτυγχάνει μη απωλεστική συμπίεση των πολλαπλών συσχετιζόμενων μετρήσεων των κόμβων χωρίς να απαιτεί την οποιαδήποτε επικοινωνία μεταξύ των κόμβων. Άλλες προσεγγίσεις χρησιμοποιούν απωλεστικές τεχνικές συμπίεσης εκμεταλλευόμενες τις χρονικές συσχετίσεις στα δεδομένα ή / και κάνοντας μία κατάλληλη στοχαστική μοντελοποίηση των σχετικών διαδικασιών. Σε αυτή τη Διατριβή, παρουσιάζουμε μία επέκταση της διαδοχικής αποκωδικοποίησης χωρίς απώλειες λαμβάνοντας υπόψιν το κανάλι και βασιζόμενοι σε κατάλληλα σχεδιασμένη συνεργασία μεταξύ των κόμβων. Επιπρόσθετα, παρουσιάζουμε ενα συνεργατικό πρωτόκολλο επικοινωνίας που στηρίζεται σε προσαρμοστική χωρο-χρονική πρόβλεψη. Ως μια πιο πρακτική προσέγγιση, το πρωτόκολλο επιτρέπει απώλειες στην ανακατασκευή των μεταδιδόμενων δεδομένων, ενώ προσφέρει σημαντική εξοικονόμηση ενέργειας μειώνοντας των αριθμό των απαιτούμενων μεταδόσεων προς τον sink node.
|
238 |
Σχεδιασμός και ανάπτυξη αλγορίθμου συσταδοποίησης μεγάλης κλίμακας δεδομένωνΓούλας, Χαράλαμπος January 2015 (has links)
Υπό το φάσμα της νέας, ανερχόμενης κοινωνίας της πληροφορίας, η σύγκλιση των υπολογιστών με τις τηλεπικοινωνίες έχει οδηγήσει στην συνεχώς αυξανόμενη παραγωγή και αποθήκευση τεράστιου όγκου δεδομένων σχεδόν για οποιονδήποτε τομέα της ανθρώπινης ενασχόλησης. Αν, λοιπόν, τα δεδομένα αποτελούν τα καταγεγραμμένα γεγονότα της ανθρώπινης ενασχόλησης, οι πληροφορίες αποτελούν τους κανόνες, που τα διέπουν. Και η κοινωνία στηρίζεται και αναζητά διακαώς νέες πληροφορίες. Το μόνο που απομένει, είναι η ανακάλυψη τους.
Ο τομέας, που ασχολείται με την συστηματική ανάλυση των δεδομένων με σκοπό την εξαγωγή χρήσιμης γνώσης ονομάζεται μηχανική μάθηση. Υπό αυτό, λοιπόν, το πρίσμα, η παρούσα διπλωματική πραγματεύεται την μηχανική μάθηση ως μια ελπίδα των επιστημόνων να αποσαφηνίσουν τις δομές που διέπουν τα δεδομένα και να ανακαλύψουν και να κατανοήσουν τους κανόνες, που “κινούν” τον φυσικό κόσμο.
Αρχικά, πραγματοποιείται μια πρώτη περιγραφή της μηχανικής μάθησης ως ένα από τα βασικότερα δομικά στοιχεία της τεχνητής νοημοσύνης, παρουσιάζοντας ταυτόχρονα μια πληθώρα προβλημάτων, στα οποία μπορεί να βρει λύση, ενώ γίνεται και μια σύντομη ιστορική αναδρομή της πορείας και των κομβικών της σημείων.
Ακολούθως, πραγματοποιείται μια όσο το δυνατόν πιο εμπεριστατωμένη περιγραφή, μέσω χρήσης εκτεταμένης βιβλιογραφίας, σχεδιαγραμμάτων και λειτουργικών παραδειγμάτων των βασικότερων κλάδων της, όπως είναι η επιβλεπόμενη μάθηση (δέντρα αποφάσεων, νευρωνικά δίκτυα), η μη-επιβλεπόμενη μάθηση (συσταδοποίηση δεδομένων), καθώς και πιο εξειδικευμένων μορφών της, όπως είναι η ημί-επιβλεπόμενη μηχανική μάθηση και οι γενετικοί αλγόριθμοι.
Επιπρόσθετα, σχεδιάζεται και υλοποιείται ένας νέος πιθανοτικός αλγόριθμος συσταδοποίησης (clustering) δεδομένων, ο οποίος ουσιαστικά αποτελεί ένα υβρίδιο ενός ιεραρχικού αλγορίθμου ομαδοποίησης και ενός αλγορίθμου διαμέρισης. Ο αλγόριθμος δοκιμάστηκε σε ένα πλήθος διαφορετικών συνόλων, πετυχαίνοντας αρκετά ενθαρρυντικά αποτελέσματα, συγκριτικά με άλλους γνωστούς αλγορίθμους, όπως είναι ο k-means και ο single-linkage. Πιο συγκεκριμένα, ο αλγόριθμος κατασκευάζει συστάδες δεδομένων, με μεγαλύτερη ομοιογένεια κατά πλειοψηφία σε σχέση με τους παραπάνω, ενώ το σημαντικότερο πλεονέκτημά του είναι ότι δεν χρειάζεται κάποια αντίστοιχη παράμετρο k για να λειτουργήσει.
Τέλος, γίνονται προτάσεις τόσο για περαιτέρω βελτίωση του παραπάνω αλγορίθμου, όσο και για την ανάπτυξη νέων τεχνικών και μεθόδων, εναρμονισμένων με τις σύγχρονες τάσεις της αγοράς και προσανατολισμένων προς τις απαιτητικές ανάγκες της νέας, αναδυόμενης κοινωνίας της πληροφορίας. / In the spectrum of a new and emerging information society, the convergence of computers and telecommunication has led to a continuously increasing production and storage of huge amounts of data for almost any field of human engagement. So, if the data are recorded facts of human involvement, then information are the rules that govern them. And society depends on and looking earnestly for new information. All that remains is their discovery.
The field of computer science, which deals with the systematic analysis of data in order to extract useful information, is called machine learning. In this light, therefore, this thesis discusses the machine learning as a hope of scientists to elucidate the structures that govern the data and discover and understand the rules that "move" the natural world.
Firstly, a general description of machine learning, as one of the main components of artificial intelligence, is discussed, while presenting a variety of problems that machine learning can find solutions, as well as a brief historical overview of its progress.
Secondly, a more detailed description of machine learning is presented by using extensive literature, diagrams, drawings and working examples of its major research areas, as is the supervised learning (decision trees, neural networks), the unsupervised learning (clustering algorithms) and more specialized forms, as is the semi-supervised machine learning and genetic algorithms.
In addition to the above, it is planned and implemented a new probabilistic clustering algorithm, which is a hybrid of a hierarchical clustering algorithm and a partitioning algorithm. The algorithm was tested on a plurality of different datasets, achieving sufficiently encouraging results, as compared to other known algorithms, such as k-means and single-linkage. More specifically, the algorithm constructs data blocks, with greater homogeneity by majority with respect to the above, while the most important advantage is that it needs no corresponding parameter k to operate.
Finally, suggestions are made in order to further improve the above algorithm, as well as to develop new techniques and methods in keeping with the current market trends, oriented to the demanding needs of this new, emerging information society.
|
239 |
Discovery of gene interactions in regulatory networks using genomic data mining and computational intelligence methods / Ανακάλυψη των (αιτιώδων) σχέσεων αλληλεπίδρασης στο δίκτυο ρύθμισης γονιδίων, με χρήση προηγμένων μεθόδων τεχνητής νοημοσύνης, βασιζόμενες στην εξόρυξη πληροφορίας από δεδομένα συνολικής γονιδιωματικής κλίμακοςDragomir, Andrei 16 December 2008 (has links)
The advent of efficient genome sequencing tools and high-throughput experimental biotechnology has lead to an enormous progress in life sciences. Among the most important innovations is the microarray technology. It allows to quantify the expression of thousands of genes simultaneously by measuring the hybridization from a tissue of interest to probes on a small glass or plastic slide. Before launching into microarray research it is important to recall that the characteristics of this data include a fair amount of noise and an atypical dimensionality (which makes difficult the use of classic statistics tools – experimental samples in the order of dozens and measured parameters in thousands or tens of thousands). Therefore, the main goal of this thesis is the development of adequate computational methods and algorithms, capable of extracting valuable biological knowledge from this type of data.
Applications of microarray technology as a tool for gene expression analysis range from the assignment of functional categories for genes of unknown biological function (based on the analysis of genes with already established biological role), to precise and early diagnosis of different tumor malignancies. However, the main goal of computational analysis of gene expression data is the extraction of regulatory knowledge at genetic level that may be used to provide a broader understanding on the functioning of complex cellular systems. In this direction, revealing the structures of regulatory networks based of gene expression data becomes a pivotal task.
The thesis contributes with a framework for the discovery of biological functional category of genes based on the synergy of ICA and a dynamic SOM-based clustering algorithm, that accurately finds groups of co-regulated genes, while identifying interesting regulatory signals within the data with the help of ICA decomposition. We also pursue the task of molecular characterization of different tumor types using gene expression profiling, by providing a novel method for tissue samples classification, based on an ensemble of classifiers sequentially trained on reweighted versions of the data. The algorithm, known as boosting, is adapted to peculiarities of gene expression data and employed in conjunction with SVMs. Additionally, the novel concept of finding predictive genes whose signatures are significant for phenotype discrimination is treated.
Finally, the thesis presents a method developed for reverse-engineering gene regulatory networks based on recurrent neuro-fuzzy networks, which exploits the advantages of fuzzy-based models, in terms of results interpretability, and those of neural systems, in terms of computational power and time series prediction capabilities. / H έλευση ικανών υπολογιστικών εργαλείων για την μελέτη της γενομικής ακολουθίας και της ερευνητικής βιοτεχνολογίας υψηλής ανάλυσης, οδήγησε σε μια τεράστια πρόοδο στις επιστήμες ζωής. Μεταξύ των πιο σημαντικών καινοτομιών είναι η τεχνολογία μικροσυστοιχιών. H τεχνολογία αυτή επιτρέπει την ποσοτικοποίηση της έκφρασης χιλιάδων γονιδίων ταυτόχρονα, μετρώντας τον υβριδισμό από έναν ιστό ενδιαφέροντος έως σε δείγματα σε μικρό γυαλί η σε πλαστικά τσιπ. Πριν ξεκινήσουμε την έρευνα πάνω στις μικροσυστοιχίες είναι σημαντικό να θυμόμαστε ότι τα χαρακτηριστικά των δεδομένων αυτής περιλαμβάνουν αρκετό ποσό θορύβου και ένα μη τυπικό αριθμό διαστάσεων (το οποίο καθιστά δύσκολη την χρήση κλασσικών στατιστικών μεθόδων – μέγεθος δείγματος σε δωδεκάδες και μέγεθος χαρακτηριστικών σε χιλιάδες η δεκάδες η εκατοντάδες). Επομένως, ο κύριος στόχος αυτής της διδακτορικής εργασίας είναι η ανάπτυξη ικανών υπολογιστικών μεθόδων και αλγόριθμων έτσι ώστε να εξάγουν πολύτιμη βιολογική γνώση από τον συγκεκριμένο τύπο δεδομένων.
Εφαρμογές της τεχνολογίας μικροσυστοιχιών σαν ένα εργαλείο για την ανάλυση έκφρασης γονιδίων ξεκινούν από την εύρεση και απόδοση λειτουργικών κατηγοριών για γονίδια άγνωστης βιολογικής λειτουργικότητας (βασισμένη στην ανάλυση των γονιδίων ήδη εδραιωμένου βιολογικού ρόλου) έως την ακριβή και πρώιμη διάγνωση διαφορετικών κακοήθων όγκων. Όμως ο κύριος στόχος της υπολογιστικής ανάλυσης της έκφρασης γονιδίων είναι η εξαγωγή ρυθμιζόμενης γνώσης στο γενετικό επίπεδο το οποίο μπορεί να χρησιμοποιηθεί ώστε να παρέχει μία ευρύτερη κατανόηση της λειτουργίας πολύπλοκων κυτταρικών συστημάτων. Σε αυτή την κατεύθυνση, το να αναδεικνύεις τις δομές ρυθμιστικών δικτύων βασισμένων στην έκφραση γονιδίων γίνεται καίριο έργο.
Η διδακτορική διατριβή συνεισφέρει στο πλαίσιο για την ανακάλυψη βιολογικά λειτουργικών κατηγοριών γονιδίων βασισμένη στην συνεργία της ΙCA και της δυναμικού βασισμένου στη SOM ομαδοποίηση αλγορίθμου η οποία με ακρίβεια βρίσκει ομάδες γονιδίων που συν-ρυθμίζονται ενώ παράλληλα αναγνωρίζει ενδιαφέροντα ρυθμιστικά σήματα μέσα στα δεδομένα με τη βοήθεια της ΙCA αποδόμησης. Eπίσης, προσανατολιζόμαστε στην εύρεση του μοριακού χαρακτηρισμού διαφορετικών τύπων όγκων χρησιμοποιώντας το προφίλ της γονιδιακής έκφρασης, βασισμένο σε ένα σύνολο κατηγοριοποιητών οι οποίοι εκπαιδεύτηκαν σειριακά σε επανασταθμισμένες παραλλαγές των δεδομένων. Ο αλγόριθμος, γνωστός και σαν boosting, έχει προσαρμοστεί στις ιδιαιτερότητες των δεδομένων έκφρασης γονιδίου και εφαρμόζεται σε συνδυασμό με τα SVMs.
Επιπλέον, εξετάζεται η πρωτοποριακή τεχνική της εύρεσης προβλέψιμων τιμών των οποίων οι υπογραφές είναι σημαντικές για τον χαρακτηρισμό φαινότυπου.
Τελικά, η παρούσα διδακτορική διατριβή παρουσιάζει μια μέθοδο που αναπτύχθηκε για αντίστροφα μηχανικά ελεγχόμενα από γονίδια νευρωνικά δίκτυα βασισμένα σε αναδρομικά νευρωνικά δίκτυα τύπου fuzzy, τα οποία αξιοποιούν τα πλεονεκτήματα των μοντέλων τύπου fuzzy σε βάση επεξηγηματικότητας αποτελεσμάτων, και αυτών των νευρωνικών δικτύων σε βάση υπολογιστικής δύναμης και ικανότητας πρόβλεψης χρονοσειρών.
|
240 |
Computational intelligence methods on biomedical signal analysis and data mining in medical recordsVladutu, Liviu-Mihai 05 May 2009 (has links)
This thesis is centered around the development and application of computationally effective
solutions based on artificial neural networks (ANN) for biomedical signal analysis and data
mining in medical records. The ultimate goal of this work in the field of Biomedical Engineering is to provide the clinician with the best possible information needed to make an accurate diagnosis (in our case of myocardial ischemia) and to propose advanced mathematical models for recovering the complex dependencies between
the variables of a physical process from a set of perturbed observations. After describing some of the types of ANN mainly used in this work, we start designing
a model for pattern classification, by constructing several local models, for neighborhoods of
the state space. For this task, we use the novel k-windows clustering algorithm, to automatically detect neighborhoods in the state space. This algorithm, with a slight modification (unsupervised k-windows algorithm) has the ability to endogenously determine the number of clusters present in the data set during the clustering process. We used this method together with the other 2 mentioned below (NetSOM and sNet-SOM) for the problem of ischemia detection.
Next, we propose the utilization of a statistically extracted distance measure in the
context of Generalized Radial Basis Function (GRBF) networks. The main properties of
the GRBF networks are retained in a new metric space, called Statistical Distance Metric
(SDM). The regularization potential of these networks can be realized with this type of
distance. Furthermore, the recent engineering of neural networks offers effective solutions for learning smooth functionals that lie on high dimensional spaces.We tested this solution
with an application from bioinformatics, one example from data mining of commercial
databases and finally with some examples using medical databases from a Machine Learning Repository.
We continue by establishing the network self-organizing map (NetSOM) model, which
attempts to generalize the regularization and ordering potential of the basic SOM from
the space of vectors to the space of approximating functions. It becomes a device for the ordering of local experts (i.e. independent neural networks) over its lattice of neurons and for their selection and coordination.
Finally, an alternative to NetSOM is proposed, which uses unsupervised ordering based on Self-organizing maps (SOM) for the "simple" regions and for the "difficult" ones a two-stage learning process. There are two differences resulted from the comparison with the previous model (NetSOM), one is that we replaced a fixed-size of the SOM with a dinamically expanded map and second, the supervised learning was based this time on Radial Basis Functions (RBF) Networks and Support Vector Machines (SVM). There are two fields in which this tool (called sNet-SOM) was used, namely: ischemia detection and Data Mining. / Η παρούσα διδακτορική διατριβή είναι επικεντρωμένη γύρω από την ανάπτυξη
και εφαρμογή, με χαμηλές υπολογιστικές απαιτήσεις, βασισμένες σε Τεχνητά Νευρωνικά
Δίκτυα, για την Ανάλυση Βιοϊατρικών σημάτων και Data Mining σε Ιατρικά Δεδομένα.
Απώτερος σκοπός της παρούσης διατριβής στον τομέα της Βιοϊατρικής
Τεχνολογίας είναι να παρέχει στους ιατρούς με την καλύτερη δυνατή πληροφόρηση για
να κάνουν μια ακριβή διάγνωση (στην περίπτωση του ισχαιμικού μυοκαρδίου) και να
προτείνει αναπτυγμένα μαθηματικά μοντέλα για να ανακάμψει πολύπλοκες εξαρτήσεις
μεταξύ τον μεταβλητών μιας φυσικής διεργασίας από ένα σύνολο διαφορετικών
παρατηρήσεων.
Μετά την περιγραφή μερικών από τους βασικούς τύπους τεχνητών Νευρωνικών
Δικτύων που χρησιμοποιούνται στην παρούσα διατριβή, εμείς αρχίσαμε να σχεδιάζουμε
ένα μοντέλο για ταξινόμηση προτύπων κατασκευάζοντας πολλά τοπικά μοντέλα
γειτονικά με τον παρόντα χώρο. Για αυτό το σκοπό εμείς χρησιμοποιούμε το αλγόριθμο
για clustering k-windows για να ανιχνεύει αυτόματα γειτονιές στον παρόντα χώρο. Αυτός
ο αλγόριθμος με μια ελαφριά τροποποίηση έχει την ικανότητα να καθορίζει ενδογενώς
την παρουσία του αριθμού τον clusters στο σύνολο τον δεδομένων κατά την διάρκεια της
διαδικασίας του clustering. Όταν η διαδικασία του clustering ολοκληρώνεται ένα
εκπαιδευμένο Εμπροσθοτροφοδοτούμενο Νευρωνικό Δίκτυο δρα ως ο τοπικός
προβλέπτης για κάθε cluster.
Εν συνεχεία, προτείνουμε τη χρήση εξαγόμενης στατιστικής μετρητικής απόστασης,
μέσα στο γενικότερο πλαίσιο των δικτύων ( GRBF). Οι κύριες λειτουργίες των GRBF
(Generalized Radial Basis Functions) δικτύων διατηρούνται στο καινούργιο μετρητικό
χώρο. Η δυναμική κανονικοποίηση αυτών των δικτύων μπορεί να πραγματοποιηθεί με
αυτό τον τύπο αποστάσεων. Επιπλέον η πρόσφατη τεχνολογία των ΝΝ (Neural
Networks) προσφέρει αποτελεσματικές λύσεις για τη μάθηση ομαλών συναρτήσεων που βρίσκεται σε υψηλούς διαστατικούς χώρους. Δοκιμάσαμε αυτή τη λύση σε εφαρμογή
βιοπληροφορικής, μία από εμπορικές βάσεις δεδομένων και τέλος με μερικά
παραδείγματα χρησιμοποιώντας βάσεις δεδομένων από το UCI (University of California at Irvine) από το ιατρικό πεδίο.
Συνεχίζοντας, καθιδρύουμε το δίκτυο NetSOM (network Self-Οrganizing Map),
που προσπαθεί να γενικεύσει (generalize) την κανονικοποίηση (regularization) και να
δώσει δυναμικές εντολές (ordering) του βασικού SOM από το διανυσματικό χώρο στο
χώρο των προσεγγιστικών συναρτήσεων. Αποτελεί μια εντολοδόχο διαδικασία για τους
τοπικούς ειδικούς πάνω από το πλέγμα των νευρώνων και για την επιλογή και το
συντονισμό τους.
Τέλος, αναλύεται μια εναλλακτική λύση του NetSOM, που χρησιμοποιεί μη
εκπαιδευμένες εντολές βασισμένες στο SOMs για τις “απλές ” περιοχές και για τις
“δύσκολες ” μια διαδικασία μάθησης 2-επιπέδων. Υπάρχουν 2 διαφορές στα
αποτελέσματα από την σύγκριση με το προηγούμενο μοντέλο (NetSOM), η πρώτη είναι
ότι αντικαταστήσαμε (we replaced) a fixed-size των SOM με ένα πιο δυναμικό ταίριασμα (mapping) και η δεύτερη, η εκπαιδευόμενη εκμάθηση βασίστηκε αυτή τη φορά στην RBF και στις μηχανές υποστήριξης διανυσμάτων (SVM). Αυτό το εργαλείο
χρησιμοποιήθηκε στην αναγνώριση των ισχαιμιών και εξόρυξη δεδομένων από βάσεις
δεδομένων.
|
Page generated in 0.0397 seconds