Spelling suggestions: "subject:"αναγνώριση"" "subject:"αναγνώρισης""
41 |
Μέθοδοι αυτόματης αναγνώρισης περιεχομένου που παράγεται από χρήστες (User Generated Content) στον Παγκόσμιο ιστόΛάμπος, Βασίλειος 08 May 2013 (has links)
Εκατομμύρια ανθρώπων επιλέγουν καθημερινά να χρησιμοποιήσουν τον Παγκόσμιο Ιστό για ένα ευρύ σύνολο δραστηριοτήτων. Ο αριθμός των χρηστών του διαδικτύου αυξάνεται συνεχώς, όπως επίσης και το σύνολο των διαφορετικών δραστηριοτήτων που μπορούν να εκτελεστούν μέσω ιστοσελίδων και υπηρεσιών του διαδικτύου. Οι χρήστες του Παγκόσμιου Ιστού καθημερινά συμμετέχουν σε διάφορες ψηφιακές δραστηριότητες, οριοθετώντας με αυτόν τον τρόπο τη ψηφιακή τους «ζωή». Κάθε χρήστης μπορεί να στείλει μήνυμα με το ηλεκτρονικό ταχυδρομείο, να επικοινωνήσει και να δημιουργήσει σχέσεις με άλλους χρήστες του Παγκόσμιου Ιστού, να επισκεφτεί ιστότοπους για να ικανοποιήσει τις ενημερωτικές του ανάγκες ή να διατηρεί ένα προσωπικό προφίλ σε έναν ή περισσότερους ιστότοπους κοινωνικής δικτύωσης. Παράλληλα, όλο και περισσότεροι χρήστες του Παγκόσμιου Ιστού χρησιμοποιούν τα ηλεκτρονικά καταστήματα για τις αγορές τους, επιτυγχάνοντας την απευθείας σύνδεση της έρευνας αγοράς με την αγορά προϊόντων ή υπηρεσιών, ενώ ο σχολιασμός και οι απόψεις άλλων χρηστών για προϊόντα και υπηρεσίες αποτελεί άλλο ένα αναμφισβήτητο πλεονέκτημα των ηλεκτρονικών καταστημάτων.
Αποτέλεσμα της αυξανόμενης δραστηριοποίησης των χρηστών είναι η συνεχής αύξηση του όγκου των κειμενικών δεδομένων που έχουν παραχθεί από χρήστες (user generated text content - UGTC) στις ιστοσελίδες του Παγκόσμιου Ιστού. Οι δικτυακές κοινότητες αυξάνονται συνεχώς σε μέγεθος και αριθμό, ενώ ταυτόχρονα οι ιστότοποι και οι υπηρεσίες του Παγκόσμιου Ιστού προσφέρουν όλο και περισσότερες δυνατότητες στους χρήστες τους για να δημιουργήσουν, να συντηρήσουν και να δημοσιοποιήσουν περιεχόμενο κειμένου που έχει παραχθεί από τους ίδιους. Αποτέλεσμα της αλληλεπίδρασης των χρηστών αλλά και χρηστών και ιστοσελίδων, είναι ότι ένα αρκετά μεγάλο μέρος της διαδικτυακής πληροφορίας με το οποίο έρχεται σε επαφή ο μέσος χρήστης καθημερινά, έχει παραχθεί από άλλους χρήστες και όχι από τους δημιουργούς του ιστοτόπου.
Η μελέτη των χαρακτηριστικών του περιεχομένου που έχει παραχθεί από χρήστες είναι κομβικό σημείο σε μια σειρά ερευνητικών πεδίων. Χαρακτηριστικό παράδειγμα αποτελούν οι μελέτες στα πλαίσια του πεδίου της εξόρυξης άποψης (opinion mining), οι οποίες βασίζονται στο περιεχόμενο των χρηστών για να αλιεύσουν τις απόψεις για ένα θέμα ή ένα προϊόν. Μελέτες, όπως οι παραπάνω, είναι ιδιαίτερα χρήσιμες στην ανάπτυξη σύγχρονων εμπορικών εφαρμογών, που θα προσφέρουν στον καταναλωτή δυνατότητα πληρέστερης ενημέρωσης για τις συναλλαγές που πρόκειται να πραγματοποιήσει. Άλλες περιπτώσεις αφορούν στην ανάλυση των γλωσσολογικών χαρακτηριστικών των κειμενικών δεδομένων που έχουν συνταχθεί από χρήστες. Επίσης, η μελέτη των χαρακτηριστικών του περιεχομένου που έχει παραχθεί από χρήστες του Παγκόσμιου Ιστού είναι ιδιαίτερα σημαντική στη μελέτη του social web, καθώς είναι δυνατόν να προκύψουν χρήσιμα συμπεράσματα τόσο για την εξέλιξή του στο χώρο και στο χρόνο, όσο και για την περαιτέρω εξέλιξη του, προσφέροντας στους χρήστες νέες δυνατότητες μέσα από σύγχρονες εφαρμογές που θα αναπτυχθούν. Σε κάθε περίπτωση, το περιεχόμενο των ιστοσελίδων του Παγκόσμιου Ιστού μπορεί θεωρητικά να κατηγοριοποιηθεί σε δυο κατηγορίες: στα δεδομένα των δημιουργών των ιστοσελίδων και στα δεδομένα που προέκυψαν από τους χρήστες των ιστοσελίδων κατά την αλληλεπίδρασή τους με αυτές.
Στόχος της παρούσας μελέτης είναι να μελετήσει το κατά πόσο είναι εφικτή και με ποιόν τρόπο η αυτόματη αναγνώριση ύπαρξης ή μη περιεχομένου κειμένου του Παγκόσμιου Ιστού που έχει παραχθεί από χρήστες. Στα πλαίσια της παρούσας μεταπτυχιακής εργασίας θα εντοπιστούν χαρακτηριστικά, τα οποία θα επιτρέψουν τον αυτόματο εντοπισμό των κειμενικών δεδομένων χρηστών σε μια ιστοσελίδα.
Γενικά σε μια ιστοσελίδα υπάρχουν τρεις πηγές πληροφοριών, οι οποίες μπορούν να χρησιμοποιηθούν κατά τη διαδικασία προσδιορσμού του user generated content (UGC): το περιεχόμενο της ιστοσελίδας, το περιβάλλον εμφάνισής της (συνδεσιμότητα με άλλες σελίδες και anchor text) και η δομή της, η οποία περιγράφεται από τα html tags (πχ ο τίτλος της σελίδας, οι λέξεις που παρουσιάζονται με bold κλπ). Η προτεινόμενη μεθοδολογία συνίσταται στην εφαρμογή τεχνικών ανάλυσης της ιστοσελίδας που σκοπό έχουν τον καθορισμό ενός συνόλου χαρακτηριστικών γνωρισμάτων της (features). Το σύνολο των γνωρισμάτων αυτών αποτελείται από τρία επιμέρους είδη χαρακτηριστικών γνωρισμάτων, τα γλωσσολογικά χαρακτηριστικά γνωρίσματα (textual features), τα χαρακτηριστικά γνωρίσματα δομής της ιστοσελίδας (Html tags), και τα χαρακτηριστικά γνωρίσματα απεικόνισης ή εμφάνισης της ιστοσελίδας (Visual and Visually Central Features). Από τα καθορισμένα χαρακτηριστικά θα επιλεγούν πειραματικά εκείνα, τα οποία θα συμμετάσχουν αποδοτικότερα στον αλγόριθμο προσδιορισμού για την ύπαρξη user generated text content σε μια ιστοσελίδα.
Η αξιολόγηση των αποτελεσμάτων της προτεινόμενης μεθόδου θα πραγματοποιηθεί βάσει ενός συνόλου δεδομένων ελέγχου. Τα δεδομένα ελέγχου αποτελούνται από μια συλλογή ιστοσελίδων, για τις οποίες έχει γίνει έλεγχος για το αν περιέχουν user generated text content. Η διαδικασία αξιολόγησης συνίσταται στην σύγκριση των αποτελεσμάτων του αλγορίθμου που προτείνουμε με τα αποτελέσματα που έχουν παραχθεί από την επεξεργασία του συνόλου δεδομένων ελέγχου. Τα συμπεράσματα που θα προκύψουν μπορούν να χρησιμοποιηθούν για την περεταίρω βελτίωση του αλγορίθμου προσδιορισμού ύπαρξης user generated text content, καθώς και για την αξιοποίηση τους σε τεχνικές ανάλυσης και επεξεργασίας του user generated text content από ιστοσελίδες του Παγκόσμιου Ιστού. / Millions of people every day use the Web for a wide range of activities. The number of Internet users is continuously growing, as well as all the different activities that can be performed through websites and Internet services. Web users daily participate in various digital activities, delimiting in this way their digital "life." Each user can send an e-mail, communicate and establish relationships with other web users, visit websites in order to satisfy his information needs, or keep a personal profile in one or more social networking sites. At the same time, more and more web users use online shopping for their purchases, achieving direct connection of the market research by buying products or services, while the commentations and the views of other users for goods and services is another undoubted advantage of online shops.
The users’ increasing activity has as result the continuous raising of the volume data, generated by users (user generated content - UGTC) in Web pages. On-line communities are growing in size and number, while simultaneously websites and web services offer users more and more options, in order to create, preserve and publish text produced by them. Result of the interaction between users and the website users and websites, is that a large part of the online information, in which the user come daily in contact, is produced by others and not by the creators of the website.
The study of the characteristics of the content obtained by users is a key point in a series of searching fields. Typical examples are the studies within the field of mining opinion (opinion mining), which are based on the content of users to catch their opinions on a topic or product. Studies such as the above, are particularly useful in the development of modern commercial applications that can offer the consumer better information for his transactions. Other cases concern the analysis of the linguistic characteristics of textual data compiled by users. Also, the study of the content characteristics generated by users of the World Wide Web is particularly important in the study of the social web, as well as it can yield useful results for both the evolution in space and time, and further development providing users with new capabilities through new applications, which are developed. In any case, the Web content could theoretically be categorized in two categories: data of Web pages creators and the data generated by web users when interacting with them.
The aim of this study is to examine whether it is feasible and with which way the automatic recognition of the text content on the Web produced by users. In this thesis, it will be identified characteristics that allow the automatic detection of textual data of users to a website and its separation from the content that has been produced by the creators of the website. During the planning and design of the proposed method it will initially be studied the inherent characteristics of different types of websites, which are indicative of the presence of these text content users. It will also be studied the usefulness of linguistic and visual features for recognition textual data users at the site, in order to separate it from the official content, that is from content creators.
Generally in a website there are three sources of information that can be used during the process of identifying user generated content (UGC): website content, setting of development (connectivity with other pages and anchor text) and its structure, which is described by the html tags (eg page title, words presented in bold, etc). The proposed methodology is recommended in applying technical analysis website aimed at defining a part of attributes (features). All these attributes consist of three kinds of features, textual features, features of the site structure (Html tags), and imaging features or appearance of the website (Visual and Visually Central Features). From the defined features it will experimentally be selected those, which will efficiently participate in the identification algorithm for the existence user generated text content on a website.
The evaluation results of the proposed method will be held considering specific audit data. The audit data consist of a collection of web pages, which have already been checked whether they contain user generated text content. The process evaluation reccommends comparing the results of the proposed algorithm with the results obtained from processing all audit data. The conclusions can be used to further improvement of the identification algorithm existence of user generated text content, as well as to exploit them in technical analysis and processing of user generated text content from Web pages.
|
42 |
Ανάπτυξη συστήματος ασύρματου ελέγχου ρομπότ με ομιλίαΠαρταουρίδης, Χαράλαμπος 07 June 2013 (has links)
Στην παρούσα διπλωματική εργασία παρουσιάζεται η ανάπτυξη συστήματος ασύρματου ελέγχου, του ρομπότ Amigobot. Το σύστημα ελέγχεται μέσω ομιλίας και χρησιμοποιείται το ανοικτό λογισμικό Olympus. / In this diplomatic work we develop a system for wireless control of the robot Amigobot. The system is controlled through speech and we use the open source software Olympus.
|
43 |
Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας / Automatic segmentation of digital speech signals and application to speech synthesis, speech recognition and language recognitionΜπόρας, Ιωσήφ 19 October 2009 (has links)
Η παρούσα διατριβή εισάγει μεθόδους για τον αυτόματο τεμαχισμό σημάτων ομιλίας. Συγκεκριμένα παρουσιάζονται τέσσερις νέες μέθοδοι για τον αυτόματο τεμαχισμό σημάτων ομιλίας, τόσο για γλωσσολογικά περιορισμένα όσο και μη προβλήματα. Η πρώτη μέθοδος κάνει χρήση των σημείων του σήματος που αντιστοιχούν στα ανοίγματα των φωνητικών χορδών κατά την διάρκεια της ομιλίας για να εξάγει όρια ψευδό-φωνημάτων με χρήση του αλγορίθμου δυναμικής παραμόρφωσης χρόνου. Η δεύτερη τεχνική εισάγει μια καινοτόμα υβριδική μέθοδο εκπαίδευσης κρυμμένων μοντέλων Μαρκώφ, η οποία τα καθιστά πιο αποτελεσματικά στον τεμαχισμό της ομιλίας. Η τρίτη μέθοδος χρησιμοποιεί αλγορίθμους μαθηματικής παλινδρόμησης για τον συνδυασμό ανεξαρτήτων μηχανών τεμαχισμού ομιλίας. Η τέταρτη μέθοδος εισάγει μια επέκταση του αλγορίθμου Βιτέρμπι με χρήση πολλαπλών παραμετρικών τεχνικών για τον τεμαχισμό της ομιλίας. Τέλος, οι προτεινόμενες μέθοδοι τεμαχισμού χρησιμοποιούνται για την βελτίωση συστημάτων στο πρόβλημα της σύνθεσης ομιλίας, αναγνώρισης ομιλίας και αναγνώρισης γλώσσας. / The present dissertation introduces methods for the automatic segmentation of speech signals. In detail, four new segmentation methods are presented both in for the cases of linguistically constrained or not segmentation. The first method uses pitchmark points to extract pseudo-phonetic boundaries using dynamic time warping algorithm. The second technique introduces a new hybrid method for the training of hidden Markov models, which makes them more effective in the speech segmentation task. The third method uses regression algorithms for the fusion of independent segmentation engines. The fourth method is an extension of the Viterbi algorithm using multiple speech parameterization techniques for segmentation. Finally, the proposed methods are used to improve systems in the task of speech synthesis, speech recognition and language recognition.
|
44 |
Αναγνώριση συναισθημάτων από ομιλία με χρήση τεχνικών ψηφιακής επεξεργασίας σήματος και μηχανικής μάθησης / Emotion recognition from speech using digital signal processing and machine learning techniquesΚωστούλας, Θεόδωρος 28 February 2013 (has links)
Η παρούσα διδακτορική διατριβή πραγματεύεται προβλήματα που αφορούν το χώρο της τεχνολογίας ομιλίας, με στόχο τη αναγνώριση συναισθημάτων από ομιλία με χρήση τεχνικών ψηφιακής επεξεργασίας σήματος και μηχανικής μάθησης. Πιο αναλυτικά, στα πλαίσια της διατριβής προτάθηκαν και μελετήθηκαν καινοτόμες μέθοδοι σε μια σειρά από εφαρμογές που αξιοποιούν σύστημα αναγνώρισης συναισθηματικών καταστάσεων από ομιλία. Ο βασικός στόχος των μεθόδων ήταν η αντιμετώπιση των προκλήσεων που παρουσιάζονται όταν ένα σύστημα αναγνώρισης συναισθηματικών καταστάσεων καλείται να λειτουργήσει σε πραγματικές συνθήκες, με αυθόρμητες αντιδράσεις, ανεξαρτήτως ομιλητή.
Πιο συγκεκριμένα, στα πλαίσια της διατριβής, αξιολογήθηκε η συμπεριφορά ενός συστήματος αναγνώρισης συναισθημάτων σε προσποιητή ομιλία και σε διαφορετικές συνθήκες θορύβου, και συγκρίθηκε η απόδοση του συστήματος με την υποκειμενική αξιολόγηση των ακροατών. Επιπλέον, περιγράφηκε ο σχεδιασμός και η υλοποίηση βάση δεδομένων συναισθηματικής ομιλίας, όπως αυτή προκύπτει από την αλληλεπίδραση μη-έμπειρων χρηστών με ένα διαλογικό σύστημα και προτάθηκε ένα σύστημα το οποίο εντοπίζει αρνητικές συναισθηματικές καταστάσεις, στο ανεξάρτητου ομιλητή πρόβλημα, με χρήση μοντέλου Γκαουσιανών κατανομών. Η προτεινόμενη αρχιτεκτονική συνδυάζει παραμέτρους ομιλίας χαμηλού και υψηλού επιπέδου και εφαρμόζεται στα πραγματικά δεδομένα. Επίσης, αξιολογήθηκε και υλοποιήθηκε η πρακτική εφαρμογή ενός συστήματος αναγνώρισης συναισθημάτων βασισμένου σε οικουμενικό μοντέλο Γκαουσιανών κατανομών σε διαφορετικούς τύπους δεδομένων πραγματικής ζωής. Ακόμα, παρουσιάστηκε μια πρωτότυπη αρχιτεκτονική κατηγοριοποίησης για αναγνώριση συνυπαρχόντων συναισθημάτων από ομιλία προερχόμενη από αλληλεπίδραση σε πραγματικά περιβάλλοντα. Σε αντίθεση με γνωστές προσεγγίσεις, η προτεινόμενη αρχιτεκτονική μοντελοποιεί τις συνυπάρχουσες συναισθηματικές καταστάσεις μέσω της κατασκευής μιας πολυσταδιακής αρχιτεκτονικής κατηγοριοποίησης. Τα πειραματικά αποτελέσματα που διενεργήθηκαν υποδεικνύουν ότι η προτεινόμενη αρχιτεκτονική είναι πλεονεκτική για τις συναισθηματικές καταστάσεις που είναι πιο διαχωρίσιμες, γεγονός που οδηγεί σε βελτίωση της συνολικής απόδοσης του συστήματος. / In this doctoral dissertation a number of novel approaches were proposed and evaluated in different applications that utilize emotion awareness. The major target of the proposed methods was facing the difficulties existing, when an emotion recognition system is asked to operate in real-life conditions, where human speech is characterized by spontaneous and genuine formulations.
In detail, within the present dissertation, the performance of an emotion recognition system was evaluated, initially, in acted speech, under different noise conditions, and this performance was compared to the one of human listeners. Further, the design and implementation of a real world emotional speech corpus is described, as this results from the interaction of naive users with a smart home dialogue system. Moreover, a system which utilizes low and high level descriptors was suggested. The suggested architecture leads to significantly better performance in some working points of the integrated system in the dialogue system. Furthermore, we propose a novel multistage classification scheme for affect recognition from real-life speech. In contrast with conventional approaches for affect/emotion recognition from speech, the proposed scheme models co-occurring affective states by constructing a multistage classification scheme. The empirical experiments performed indicate that the proposed classification scheme offers an advantage for those classes that are more separable, which contributes for improving the overall performance of the affect recognition system.
|
45 |
Ανάπτυξη μεθόδων αυτόματης κατηγοριοποίησης κειμένων προσανατολισμένων στο φύλοΑραβαντινού, Χριστίνα 15 May 2015 (has links)
Η εντυπωσιακή εξάπλωση των μέσων κοινωνικής δικτύωσης τα τελευταία χρόνια, θέτει βασικά ζητήματα τα οποία απασχολούν την ερευνητική κοινότητα. Η συγκέντρωση και οργάνωση του τεράστιου όγκου πληροφορίας βάσει θέματος, συγγραφέα, ηλικίας ή και φύλου αποτελούν χαρακτηριστικά παραδείγματα προβλημάτων που πρέπει να αντιμετωπιστούν. Η συσσώρευση παρόμοιας πληροφορίας από τα ψηφιακά ίχνη που αφήνει ο κάθε χρήστης καθώς διατυπώνει τη γνώμη του για διάφορα θέματα ή περιγράφει στιγμιότυπα από τη ζωή του δημιουργεί τάσεις, οι οποίες εξαπλώνονται ταχύτατα μέσω των tweets, των δημοσιευμάτων σε ιστολόγια (blogs) και των αναρτήσεων στο Facebook. Ιδιαίτερο ενδιαφέρον παρουσιάζει το πώς μπορεί όλη αυτή η πληροφορία να κατηγοριοποιηθεί βάσει δημογραφικών χαρακτηριστικών, όπως το φύλο ή η ηλικία. Άμεσες πληροφορίες που παρέχει ο κάθε χρήστης για τον εαυτό του, όπως επίσης και έμμεσες πληροφορίες που μπορούν να προκύψουν από την γλωσσολογική ανάλυση των κειμένων του χρήστη, αποτελούν σημαντικά δεδομένα που μπορούν να χρησιμοποιηθούν για την ανίχνευση του φύλου του συγγραφέα. Πιο συγκεκριμένα, η αναγνώριση του φύλου ενός χρήστη από δεδομένα κειμένου, μπορεί να αναχθεί σε ένα πρόβλημα κατηγοριοποίησης κειμένου. Το κείμενο υφίσταται επεξεργασία και στη συνέχεια, με τη χρήση μηχανικής μάθησης, εντοπίζεται το φύλο. Ειδικότερα, μέσω στατιστικής και γλωσσολογικής ανάλυσης των κειμένων, εξάγονται διάφορα χαρακτηριστικά (π.χ. συχνότητα εμφάνισης λέξεων, μέρη του λόγου, μήκος λέξεων, χαρακτηριστικά που συνδέονται με το περιεχόμενο κ.τ.λ.), τα οποία στη συνέχεια χρησιμοποιούνται για να γίνει η αναγνώριση του φύλου. Στην παρούσα διπλωματική εργασία σκοπός είναι η μελέτη και η ανάπτυξη ενός συστήματος κατηγοριοποίησης κειμένων ιστολογίου και ιστοσελίδων κοινωνικής δικτύωσης, βάσει του φύλου. Εξετάζεται η απόδοση διαφορετικών συνδυασμών χαρακτηριστικών και κατηγοριοποιητών στoν εντοπισμό του φύλου. / The rapid growth of social media in recent years creates important research tasks. The collection and management of the huge information available, based on topic, author, age or gender are some examples of the problems that need to be addressed. The gathering of such information from the digital traces of the users, when they express their opinions on different subjects or they describe moments of their lives, creates trends, which expand through tweets, blog posts and Facebook statuses. An interesting aspect is to classify all the available information, according to demographic characteristics, such as gender or age. The direct clues provided by the users about themselves, along with the indirect information that can come of the linguistic analysis of their texts, are useful elements that can be used for the identification of the authors’ gender. More specifically, the detection of the users’ gender from textual data can be faced as a document classification problem. The document is processed and then, machine learning techniques are applied, in order to detect the gender. The features used for the gender identification can be extracted from statistical and linguistic analysis of the document. In the present thesis, we aim to develop an automatic system for the classification of web blog and social media posts, according to their authors’ gender. We study the performance of different combinations of features and classifiers for the identification of the gender.
|
46 |
Στοχαστική αναγνώριση μηχανικών συστημάτων με υστέρησηΡίζος, Δημοσθένης 20 October 2009 (has links)
Η υστέρηση είναι ένα μη γραμμικό φαινόμενο, το οποίο είναι πολύ κοινό σε διάφορους κλάδους της επιστήμης, συμπεριλαμβανομένων της φυσικής, της μηχανικής και της βιολογίας. Η μαθηματική θεμελίωση του φαινομένου της υστέρησης οφείλεται σε διάφορες εφαρμογές, οι οποίες αποτελούν και τα πρακτικά παραδείγματα, τα οποία την υποστηρίζουν. Για το λόγο αυτόν πλήθος μοντέλων, τα οποία πήραν την ονομασία τους από τους επιστήμονες που τα πρότειναν (π.χ Duhem, Weiss, Preisach κ.ο.κ), πρώτα χρησιμοποιήθηκαν για συγκεκριμένες εφαρμογές και μετά θεωρήθηκαν ως μοντέλα υστέρησης.
Το φαινόμενο της υστέρησης, όπως και η μαθηματική του ανάλυση, έχει μελετηθεί διεξοδικά [1,2] και για το λόγο αυτό έχουν προταθεί αρκετά μαθηματικά εργαλεία. Εντούτοις, το πρόβλημα της αναγνώρισης (επίτευξη μαθηματικών μοντέλων επί τη βάση πειραματικών μετρήσεων) συστημάτων με υστέρηση δεν έχει λάβει τη δέουσα προσοχή ακόμα. Στις περισσότερες των περιπτώσεων, η αναγνώριση περιορίζεται σε πρακτικά ζητήματα (κυρίως για προσομοιώσεις συστημάτων με υστέρηση), κατά τα οποία επιλέγεται ένα συγκεκριμένο μοντέλο υστέρησης και χρησιμοποιείται μία μέθοδος εκτίμησης (π.χ μη-γραμμική βελτιστοποίηση), δίχως να δαπανάται επιπλέον προσπάθεια σε βαθύτερα θεωρητικά θέματα (π.χ κατά πόσο η εκτίμηση είναι η βέλτιστη ή αν είναι μοναδική κ.ο.κ). Αξίζει να σημειωθεί ότι το πρόβλημα της αναγνώρισης είναι βαθύτερο και χρήζει επιπλέον θεωρητικής ανάλυσης βάσει αρχών και εργαλείων από το γνωστικό αντικείμενο της “Θεωρίας Αναγνώρισης Συστημάτων”, έτσι ώστε να επιτυγχάνονται τα βέλτιστα αποτελέσματα.
O πρώτος στόχος της παρούσα διατριβής είναι η ανάπτυξη μεθοδολογίας ανίχνευσης μη γραμμικής συμπεριφοράς (όπως για παράδειγμα η υστέρηση) αποκλειστικά επί τη βάση πειραματικών μετρήσεων. Η βασική ιδέα για την επίτευξη του σκοπού αυτού είναι η χρήση της Συνάρτησης Συνάφειας (Coherence Function), η οποία αναμένεται να μειωθεί με την ύπαρξη μη γραμμικοτήτων [3]. Μετά την ανίχνευση, ο στόχος είναι η ανάπτυξη ολοκληρωμένης μεθοδολογίας για την αναγνώριση φυσικών συστημάτων με υστέρηση, βάσει του μοντέλου ολίσθησης του Maxwell (Maxwell Slip model – [4]). Ο συγκεκριμένος στόχος αντιμετωπίζεται υπό το πρίσμα της θεωρίας αναγνώρισης συστημάτων (System Identification) και ως εκ τούτου τα βασικά θέματα θεωρητικής φύσεως τα οποία αντιμετωπίζονται είναι, τα ακόλουθα:
Η εκ των προτέρων αναγνωρισιμότητα (μοναδικότητα της παραμετροποίησης – uniqueness of representation) της δομής του μοντέλου ολίσθησης του Maxwell.
Η επίδραση των αρχικών καταστάσεων στην εκτίμηση του μοντέλου ολίσθησης του Maxwell.
Ο σχεδιασμός της διεγέρσεως έτσι ώστε τα διαθέσιμα δεδομένα να περιέχουν όλη τη δυνατή πληροφορία για την επιτυχή αναγνώριση του μοντέλου ολίσθησης του Maxwell.
H επιλογή και η αριθμητική εφαρμογή κατάλληλης εκτιμήτριας των παραμέτρων του μοντέλου ολίσθησης του Maxwell.
Η μελέτη της εκ των υστέρων αναγνωρισιμότητας (a posteriori identifiability) του Μοντέλου ολίσθησης του Maxwell.
Η μελέτη της ποιότητας της εκτίμησης του μοντέλου ολίσθησης του Maxwell, το οποίο συνεπάγεται την μελέτη της συνέπειας (consistency) και της ασυμπτωτικής κανονικότητας των εκτιμήσεων (asymptotic normality).
Η διαδικασία επιλογής της δομής (model structure selection) του μοντέλου ολίσθησης του Maxwell.
Ο έλεγχος εγκυρότητας (model validation) του εκτιμώμενου μοντέλου ολίσθησης του Maxwell.
Επί τη βάση των παραπάνω βασικών θεμάτων, αναπτύσσονται κατάλληλα εργαλεία και λεπτομερείς διαδικασίες με σκοπό να δοθούν απαντήσεις.
Προκειμένου να φανερωθεί η πρακτικότητα και εφαρμοσιμότητα των προαναφερθέντων θεωρητικών θεμάτων, είναι αναγκαία η εφαρμογή τους σε ένα πραγματικό σύστημα με υστέρηση. Από το πλήθος των διαθέσιμων συστημάτων αυτού του είδους, επιλέγεται ένα πραγματικό μηχανικό σύστημα με τριβή. Αξίζει να σημειωθεί ότι συστήματα αυτού του είδους όχι μόνο είναι πολύ κοινά σε μηχανολογικές εφαρμογές, άλλα η αναγνώριση τους αποτελεί πρόκληση, λόγω της πολύπλοκης φύσης της υστέρησης που παρουσιάζουν.
Συγκεκριμένα τα εν λόγω συστήματα παρουσιάζουν διαφορετικό είδος υστέρησης ανάλογα με την περιοχή λειτουργίας τους. Έτσι, όταν λειτουργούν στην περιοχή προολίσθησης (δεν παρουσιάζεται μακροσκοπική κίνηση, η σχετική μετατόπισης μεταξύ των επιφανειών που έρχονται σε επαφή είναι της τάξεως των 2 - 5 μm (presliding regime [5]) εμφανίζεται υστέρηση (σχεδόν) ανεξάρτητη του ρυθμού, με χαρακτηριστικά μακράς μνήμης (hysteresis with nonlocal memory) μεταξύ της (μικρο)μετατόπισης και της δύναμης τριβής [6,7,8]. Όσο η σχετική μετατόπιση των επιφανειών που έρχονται σε επαφή αυξάνεται, τότε όλο και περισσότεροι δεσμοί (junctions) σπάνε και τελικά παρατηρείται μακροσκοπική μετατόπιση με αποτέλεσμα το σύστημα να εισέρχεται στην περιοχή ολίσθησης (sliding regime). Στην περιοχή αυτή, ο προηγούμενος τύπος της υστέρησης εξαφανίζεται και εμφανίζεται υστέρηση, μεταξύ της μετατόπισης και της δύναμης τριβής, ρυθμού εξαρτώμενης [8,9,4]. Αξίζει να σημειωθεί ότι ένα σύστημα με τριβή μεταβαίνει από την μια περιοχή λειτουργίας στην άλλη (π.χ κατά την αλλαγή στη φορά της κίνησης) αρκετές φορές ακόμα και κατά την τυπική του λειτουργία. Το γεγονός αυτό καταδεικνύει τη δυσκολία του προβλήματος.
Προκειμένου να επιλυθεί το πρόβλημα της αναγνώρισης μηχανικών συστημάτων με τριβή, αρχικά μελετάται το σύστημα μόνο στην περιοχή προολίσθησης. Για το λόγο αυτό διεξάγονται κατάλληλα πειράματα στην περιοχή αυτή, μετρώνται τα σήματα της μετατόπισης και της τριβής προολίσθησης και εφαρμόζεται αναγνώριση του συστήματος επί τη βάση του Μοντέλου ολίσθησης του Maxwell. Η εφαρμογή της προτεινόμενης μεθοδολογίας οδηγεί σε σχεδόν άψογα αποτελέσματα, καταδεικνύοντας την ικανότητα του μοντέλου ολίσθησης του Maxwell να περιγράφει τη δυναμική του συστήματος στην περιοχή προολίσθησης.
Αφού μελετήθηκε το σύστημα εντός της περιοχής προολίσθησης, το επόμενο βήμα περιλαμβάνει τη γενικότερη (και πιο πιθανή) περίπτωση, κατά την οποία το σύστημα λειτουργεί στη συνδυασμένη περιοχή προολίσθησης - ολίσθησης. Όπως και πριν, διεξάγονται πειράματα και μετρώνται τα σήματα μετατόπισης και τριβής. Αν και η αναγνώριση του συστήματος, μέσω του μοντέλου ολίσθησης του Maxwell στη συνδυασμένη περιοχή, δίνει χειρότερα συγκρινόμενα με τα προηγούμενα, αποτελέσματα, η χρήση του μοντέλου παρουσιάζεται αρκετά υποσχόμενη.
Το γεγονός ότι η αναγνώριση, μέσω του μοντέλου ολίσθησης του Maxwell, στη συνδυασμένη περιοχή προολίσθησης - ολίσθησης οδηγεί σε χειρότερα αποτελέσματα οφείλεται στο ότι η εν λόγω δομή του μοντέλου δεν είναι σε θέση να ερμηνεύσει πλήρως την πολυπλοκότητα της υστέρησης που εμφανίζεται στην περίπτωση αυτή. Έτσι, κρίνεται απαραίτητη η κατάλληλη επέκταση της βασικής δομής. Για το λόγο αυτό προτείνεται κατάλληλη, επί τη βάση της βασική δομής, επέκταση. Η χρήση της νέας δομής του μοντέλου για την αναγνώριση του συστήματος στη συνδυασμένη περιοχή προολίσθησης - ολίσθησης οδηγεί σε εξαιρετική βελτίωση των αποτελεσμάτων, καταδεικνύοντας την καταλληλότητά της. Προκειμένου οι δυνατότητες της νέας δομής να παρουσιαστούν καλύτερα, αναπτύσσεται ένα απλό σύστημα ελέγχου πρόσω-αντιστάθμισης (feedforward), βασισμένο στην προτεινόμενη νέα δομή. Ο παραπάνω έλεγχος έχει ως αποτέλεσμα την επίτευξη εξαιρετικά χαμηλού σφάλματος εντοπισμού (tracking error), υποδεικνύοντας την εξαιρετική αντιστάθμιση της αναπτυσσόμενης τριβής και ως εκ τούτου την ικανότητα της προτεινόμενης δομής να ερμηνεύει τη δυναμική του συστήματος με τριβή, όταν αυτό δουλεύει στην συνδυασμένη περιοχή προολίσθησης - ολίσθησης. / Hysteresis is a nonlinear phenomenon which is common in various branches of science and technology, including physics, mechanics, biology, civil and mechanical engineering. It is well known that many applications stimulate and provide lively support to mathematical construction. For instance, several well - known models which named after the physicists and engineers who proposed them (Rayleigh, Duhem, Weiss, Prandtly, Preisach, Bouc and so on) was entangled with applications before being viewed as models of hysteresis.
The study of hysteresis phenomena as well as their mathematical analysis have been systematically researched [1,2] and several mathematical modelling tools have been proposed. Nevertheless the problem of inverse modelling (that is identifying from available experimental data a model that provides the optimum representation of the system under study) of a system with hysteresis have not been investigated thoroughly. In the most of the cases the hysteresis identification is often limited to practical issues such that postulating a hysteresis model and applying an estimation technique (i.e. nonlinear optimization) for obtaining its parameters. However the problem is much deeper and a more theoretical analysis, employing principles and tools from the "System Identification Theory", should be applied in order the optimum results to be obtained.
The dissertation aims at proposing a methodology for detecting nonlinearities (such as hysteresis) utilizing experimentally obtained excitation - response data only. The key feature for doing so is the Coherence Function, which is expected to be decreased with the appearance of nonlinear behavior [3]. Following this a complete methodology for identifying systems with hysteresis based upon the Maxwell Slip model [4] is established. This problem is addressed from the ``System Identification" point of view, and therefore the critical issues primarily addressed here are:
The a priori identifiability (or uniqueness of representation) of the Maxwell Slip model structure.
The excitation design for achieving ``rich" enough data for the Maxwell Slip model identification purpose.
The selection and numerical implementation of an estimator
The a posteriori identifiability (whether the model can be identified from a actual experiment under real conditions) of the Maxwell Slip model.
The estimator asymptotic statistical properties, such that consistency and asymptotic normality
The model structure selection
The model validation
Based upon these questions, answers are provided and detailed guidelines are established.
In order the established theoretical findings to be solidify and their practicality to be
revealed, their application to an actual system with hysteresis is required. From the huge number of the available systems with hysteresis, a real (experimental) mechanical system with friction is selected. This kind of systems are not only quite common in mechanical engineering applications (friction perhaps is the most common source of nonlinearities in mechanical systems), but also extremely challenging due to its complicated hysteresis nature (different types of hysteresis appear according to the operational regime). In order the latter to be more clear consider that whenever a system with friction operates within presliding regime (no macroscopic movement between the two surface in contact - the relative displacement is approximately 2 – 5 μm for steel materials [5], then there is a (almost) rate-independent hysteresis with nonlocal memory between the displacement and friction force [6,7,4]. As the relative displacement increases then more and more junctions break and finally there is a macroscopic relative motion and therefore the sliding regime begins. In this case the previous type of hysteresis disappears, and a new rate-dependent hysteresis between the displacement and friction force appears [8,9,4]. However, the system transits from the one regime to the other, (i.e at velocity reversals) several time during its typical operation, thus the type of hysteresis appears depends on the operational regime and thus to the system motion. Unavoidably this makes the identification problem quite challenging.
Firstly the system under study is considered within the presliding regime only. Experiments were carried out and actual presliding displacement - friction force signals were obtained. The application of the proposed methodology yields almost excellent results, indicating its ability of capturing the underlying presliding frictional dynamics.
The obvious next step is to consider the most common case, which is operation within both presliding - sliding dynamics. Experiments were implemented and displacement - friction force signals were collected. In this case the identification results based upon the Maxwell Slip model, though not so good as before, appear to be very promising. For that reason a proper extension of the basic Maxwell Slip model structure is proposed and implemented. This modification yields to significant improvement, and excellent results are achieved. In order the potentiality of the proposed extended Maxwell Slip model to be demonstrated better, a simple feedforward friction compensation scheme, based upon the extended model, is implemented. The results demonstrate excellent friction compensation, yielding extremely low tracking error, not only in each operational regime but also during regime transitions.
|
47 |
Ομαδοποίηση δεδομένων υψηλής διάστασηςΤασουλής, Σωτήρης 09 October 2009 (has links)
Η ομαδοποίηση ομαδοποιεί τα δεδομένα βασισμένη μόνο σε πληροφορία που βρίσκεται σε αυτά η οποία περιγράφει τα αντικείμενα και τις σχέσεις τους. Ο στόχος είναι τα αντικείμενα που βρίσκονται σε μια ομάδα να είναι όμοια(ή σχετικά) μεταξύ τους και διαφορετικά απο τα αντικείμενα των άλλων ομάδων. Όσο μεγαλύτερη είναι η ομοιότητα(ή η ομοιογένεια) σε μια ομάδα και όσο μεγαλύτερη είναι η διαφορετικότητα ανάμεσα στις ομάδες τόσο καλύτερη είναι η ομαδοποίηση.
Οι μεθόδοι ομαδοποίησης μπορούν να διακριθούν σε τρείς κατηγορίες, ιεραρχικές, διαχωριστικές, και στις βασισμένες στη πυκνότητα. Οι ιεραρχικοί αλγόριθμοι μας δίνουν ιεραρχίες ομάδων σε μία top-down(συγχωνευτική) ή bottom-up(διαχωριστική) μορφή. Η εργασία αυτή επικεντρώνεται στην ιεραρχική διαχωριστική ομαδοποίηση. Ανάμεσα στους ιεραρχικούς διαχωριστικούς αλγορίθμους ξεχωρίζουμε τον αλγόριθμο Principal Direction Divisive Partitioning (PDDP). Ο PDDP χρησιμοποιεί την προβολή των δεδομένων στα κύρια συστατικά της αντίστοιχης μήτρας συνδιασποράς. Αυτό επιτρέπει την εφαρμογή σε δεδομένα υψηλής διάστασης. Στην εργασία αυτή προτείνεται μια βελτίωση του αλγορίθμου \Principal Direction Divisive Partitioning. Ο προτεινόμενος αλγόριθμος συνδυάζει στοιχεία από την εκτίμηση πυκνότητας και τις μεθόδους βασισμένες στην προβολή με έναν γρήγορο και αποδοτικό αλγόριθμο, ικανό να αντιμετωπίσει δεδομένα υψηλής διάστασης. Τα πειραματικά αποτελέσματα δείχνουν βελτιωμένη απόδοση ομαδοποίησης σε σύγκριση με άλλες δημοφιλείς μεθόδους. Επίσης ερευνάται το πρόβλημα του αυτόματου καθορισμού του πλήθους των ομάδων που είναι πολύ σημαντικό την ανάλυση ομάδων. / Cluster analysis groups data objects based only on information found in the data that describes the objects and their relationships. The goal is that the objects within a group be similar (or related) to one another and different from (or unrelated to) the objects in other groups. The greater the similarity (or homogeneity) within a group and the greater the difference between groups, the better or more distinct the clustering.
Clustering methods can be broadly divided into three categories, hierarchical, partitioning and density-based (while there are other categorisations). Hierarchical algorithms provide nested hierarchies of clusters in a top-down (agglomerative), or bottom-up (divisive) fashion. This work is focused on the class of hierarchical divisive clustering algorithms. Amongst the class of divisive hierarchical algorithms, the Principal Direction Divisive Partitioning (PDDP) algorithm is of particular value. PDDP uses the projection of the data onto the principal components of the associated data covariance matrix. This allows the application to high dimensional data. In this work an improvement of the algorithm PDDP is proposed. The proposed algorithm merges concepts from density estimation and projection-based methods towards a fast and efficient clustering algorithm, capable of dealing with high dimensional data. Experimental results show improved partitioning performance compared to other popular methods. Moreover, we explore the problem of automatically determining the number of clusters that is central in cluster analysis.
|
48 |
Αναγνώριση γονιδιακών εκφράσεων νεοπλασιών σε microarrays / Identification of tumor gene expression from microarraysΤσακανίκας, Παναγιώτης 16 May 2007 (has links)
Η ουσιώδης ανάπτυξη που παρουσίασε η μοριακή παθολογία τα τελευταία χρόνια, είναι συνυφασμένη με την ανάπτυξη της microarray τεχνολογίας. Αυτή η τεχνολογία μας παρέχει μια νέα οδό προσπέλασης υψηλής χωρητικότητας τέτοια ώστε: i. να δίνεται η δυνατότητα ανάλυσης μεγάλης κλίμακας της ισοτοπικής αφθονίας του αγγελιοφόρου RNA (mRNA), ως δείκτη γονιδιακών εκφράσεων (cDNA arrays), ii. να ανιχνεύονται πολυμορφισμοί ή μεταλλάξεις μέσα σε έναν πληθυσμό γονιδίων χρησιμοποιώντας ξεχωριστούς nucleotide πολυμορφισμούς (Single Nucleotide Polymorphisms arrays), iii. και για εξέταση «απώλειας» ή «κέρδους», ή αλλαγές στον αριθμό αντιγραφής κάποιου συγκεκριμένου γονιδίου που σχετίζεται με κάποια ασθένεια (CGH arrays). Η τεχνολογία των microarrays είναι ευλογοφανές να εξελιχθεί σε ακρογωνιαίο λίθο της μοριακής έρευνας στα επόμενα χρόνια, και αυτό γιατί DNA microarrays χρησιμοποιούνται για τον ποσοτικό προσδιορισμό δεκάδων χιλιάδων DNA ή RNA ακολουθιών σε μια και μόνο ανάλυση – πείραμα. Από μια σειρά από τέτοια πειράματα, είναι δυνατόν να προσδιορίσουμε τους μηχανισμούς που ελέγχουν την ενεργοποίηση των γονιδίων σε έναν οργανισμό. Ακόμη η χρήση των microarrays για την επισκόπηση γονιδιακών εκφράσεων είναι μια ραγδαία αναπτυσσόμενη τεχνολογία, η οποία μετακινήθηκε από εξειδικευμένα, σε συμβατικά βιολογικά εργαστήρια. Στην παρούσα διπλωματική εργασία κυρίως, θα αναφερθούμε στα δύο γενικά στάδια της ανάλυσης των microarray εικόνων που μας δίνονται ως απόρρεια των πειραμάτων, που έχουν ως στόχο την εξόρυξη πληροφορίας από αυτές. Τα δύο αυτά στάδια είναι: i. Επεξεργασία εικόνας και εξαγωγή πληροφορίας από αυτήν. ii. Ανάλυση της προκύπτουσας πληροφορίας και αναγνώριση των γονιδιακών εκφράσεων. Όσον αφορά το πρώτο στάδιο θα αναφέρουμε τις βασικές μεθόδους που χρησιμοποιούνται σήμερα από εμπορικά και εκπαιδευτικά πακέτα λογισμικού, οι οποίες μέθοδοι δίνουν και τα καλύτερα αποτελέσματα μέχρι στιγμής. Για το δεύτερο στάδιο, αφού αναφέρουμε τις πιο σημαντικές μεθόδους που χρησιμοποιούνται, θα υλοποιήσουμε μια δική μας μέθοδο και θα την συγκρίνουμε με τις υπάρχουσες.
|
49 |
Computer assisted diagnosis of brain tumors based on statistical methods and pattern recognition techniques / Υπολογιστικό σύστημα αυτόματης διάγνωσης όγκων εγκεφάλου με τη χρήση στατιστικών μοντέλων και μεθόδων αναγνώρισης προτύπωνΓεωργιάδης, Παντελής 05 January 2011 (has links)
Η εισαγωγή της Μαγνητικής Τομογραφίας (ΜΤ) στην κλινική πρακτική και η συμπληρωματική πληροφορία που δίνει η Φασματοσκοπία Μαγνητικού Συντονισμού (ΦΜΣ) συνιστά μια από τις πιο σημαντικές εξελίξεις στη διάγνωση ασθενών με καρκίνο εγκεφάλου [1]. Παρ’ όλα αυτά, οι εικόνες ΜΤ είναι συχνά δύσκολο να ερμηνευθούν από τους ειδικούς λόγω [2] α/ της υποκειμενικότητας και περιορισμένης εμπειρίας του παρατηρητή στην εκτίμηση εικόνων που παράγει η σχετικά νέα αυτή τεχνολογία, β/ των ποικίλων κλινικών χαρακτηριστικών των όγκων (π.χ. τύπος, διαβάθμιση κακοήθειας κλπ.) και γ/ της ιδιαιτερότητας των όγκων στην αντίθεση που παρουσιάζουν με τον περιβάλλοντα ιστό.
Μόνο λιγοστές μελέτες έχουν διεξαχθεί για να χαρακτηρίσουν ιστούς εγκεφάλου μέσω της ανάλυσης ποσοτικών χαρακτηριστικών από εικόνες εγκεφάλου ΜΤ [3, 4]. Ενώ έχει ήδη τονιστεί η αναγκαιότητα συσχετισμού της διαγνωστικής και προγνωστικής πληροφορίας που προέρχεται από εικόνες ΜΤ και σήματα ΦΜΣ στη διεθνή βιβλιογραφία [5], υπάρχουν λιγοστές ανάλογες αναφορές για τον σχεδιασμό και υλοποίηση συστήματος Η/Υ αυτόματης διάγνωσης όγκων εγκεφάλου κάνοντας συνδυασμό ποσοτικής πληροφορίας προερχόμενης από εικόνες ΜΤ και σήματα ΦΜΣ [6, 7].
Οι στόχοι της παρούσας διατριβής εστιάζονται στα παρακάτω:
- στη μελέτη, ανάπτυξη και η υλοποίηση υπολογιστικού συστήματος αυτόματης ταξινόμησης όγκων του εγκεφάλου μέσω της ποσοτικής ανάλυσης εικόνων ΜΤ το οποίο θα βελτιώνει την ακρίβεια ταξινόμησης σε σχέση με ήδη υπάρχοντα συστήματα [4, 8, 9], όπως αυτά περιγράφονται στην διεθνή βιβλιογραφία μεταξύ πρωτογενών και δευτερογενών όγκων εγκεφάλου καθώς και μεταξύ γλοιωμάτων και μηνιγγιωμάτων με την χρήση δέντρου ιεραρχικής απόφασης δύο επιπέδων. Επιπλέον, στην ανάδειξη πως η χρήση ενός μη-γραμμικού πολυωνυμικού μετασχηματισμού ελάχιστων τετραγώνων των
χαρακτηριστικών υφής έχει ως αποτέλεσμα την βελτίωση της ακρίβειας ταξινόμησης του ταξινομητή πιθανοκρατικού νευρωνικού δικτύου.
- στην επέκταση και την βελτίωση του συστήματος αυτόματης ταξινόμησης όγκων του εγκεφάλου χρησιμοποιώντας α/ ογκομετρικές ποσοτικές παραμέτρους εικόνων ΜΤ, β/ ταξινομητή μηχανών διανυσμάτων στήριξης μαζί με τη μεθοδολογία συνάθροισης αποτελεσμάτων ταξινόμησης από τυχαιοποιημένα δείγματα κατηγοριών δημιουργημένων με επαναδειγματοληψία για κάθε κόμβο δέντρου ιεραρχικής απόφασης δύο επιπέδων όπου στο πρώτο επίπεδο πραγματοποιήθηκε διαχωρισμός μεταξύ πρωτογενών και δευτερογενών όγκων εγκεφάλου και στο δεύτερο και μεταξύ γλοιωμάτων και μηνιγγιωμάτων και γ/ έναν τροποποιημένο πυρήνα ακτινικής συνάρτησης βάσης για τον ταξινομητή μηχανών διανυσμάτων στήριξης ο οποίος περιλαμβάνει την τεχνική μη-γραμμικού πολυωνυμικού μετασχηματισμού ελάχιστων τετραγώνων με στόχο την βελτίωση της ακρίβειας ταξινόμησης.
- στην περαιτέρω επέκταση και την βελτίωση του συστήματος αυτόματης ταξινόμησης με την εισαγωγή χαρακτηριστικών προερχόμενων από σήματα ΦΜΣ ώστε να διερευνηθεί εάν η χρήση του μπορεί να βελτιώσει τα αποτελέσματα ταξινόμησης μεταξύ μηνιγγιωμάτων και μονήρων μεταστάσεων.
Τέλος κάνοντας μια περίληψη, η παρούσα διατριβή διαπραγματεύεται τον σχεδιασμό, ανάπτυξη και υλοποίηση μεθόδων και αλγορίθμων για την επεξεργασία και ανάλυση ιατρικών εικόνων, επικεντρώνοντας ειδικότερα στην εφαρμογή των μεθόδων αυτών για την διάγνωση του τύπου των όγκων εγκεφάλου. Τα πιο βασικά συμπεράσματα που απορρέουν από την παρούσα διατριβή είναι τα ακόλουθα: α/ Το σύστημα ταξινόμησης των τύπων των όγκων εγκεφάλου που σχεδιάστηκε και υλοποιήθηκε αυξάνει τα ποσοστά ορθής ταξινόμησης σε σχέση με τα υπάρχοντα. β/ Η κωδικοποίηση των ιδιοτήτων της υφής που προέρχεται από τον σύνολο του όγκου παρέχει επιπρόσθετη πληροφορία στο σύστημα ταξινόμησης αυξάνοντας τα ποσοστά επιτυχούς διαχωρισμού. γ/ Τα χαρακτηριστικά φασματοσκοπίας μαγνητικού συντονισμού αποτελούν επιπρόσθετη αξία στο χαρακτηρισμό του τύπου των όγκων εγκεφάλου μιας και οδήγησαν στην αύξηση του ποσοστού επιτυχούς διαχωρισμού του συστήματος ταξινόμησης. / The process of brain tumor characterization requires a rather intricate assessment of the various Magnetic Resonance (MR) image and spectroscopic features and is typically performed by experienced radiologists. Despite the inherently subjective nature of many of the decisions associated with this process, an expert radiologist is able to perform this task with a significant degree of precision and accuracy. However, in the effort to deliver more effective treatment, clinicians are continuously seeking for greater accuracy in the pathological characterization of brain tissues.
The aim of the present thesis was to design, implement, and evaluate a software classification system for discriminating between different brain tumor types on Magnetic Resonance Imaging (MRI), employing textural and spectroscopic features.
The clinical material consisted of sixty seven T1-weighted post-contrast MR brain images (21 metastases, 19 meningiomas, and 27 gliomas), obtained from patients with verified and untreated intracranial tumors. Thirty-six 2-dimensional textural features (2D), from the image histogram and the co-occurrence and run-length matrices, were extracted from each one of 67 MR-images. Similarly, an equal number of 3-dimensional textural features (3D) were also calculated in the attempt to maximize classification performances. Finally, MR-spectroscopy features were also incorporated for improving classification accuracies.
Classification methods employed included i/ a modified Probabilistic Neural Network (PNN) and Support Vector Machines (SVM) algorithms, incorporating a non-linear Least Squares Features Transformation (LSFT) into the classifiers and ii/ an ensemble classification scheme employing the LSFT-SVM classifier. The LSFT improved classifiers’ performances, increased class separability, and resulted in dimensionality reduction. For evaluating the performance of the designed classification schemes, evaluations were performed by means of the external cross validation process, which is considered indicative of the generalization performance of the designed classification system to ‘unseen’ cases.
It was found that the LSFT features transformation enhanced the performance of the PNN and SVM algorithms, achieving classification accuracies of 73.48 % in distinguishing metastatic from primary tumors and 88.67% in discriminating gliomas from meningiomas. When volumetric 3-dimensional features were employed, these results improved to 88.18% for discriminating between metastatic and primary tumors and 97.33% for distinguishing gliomas from meningiomas. The textural features employed in the design of the optimum classification scheme were associated primarily with image texture homogeneity. Finally, when MR-spectroscopy features were also incorporated, classification accuracy was boosted up from 95% in discriminating meningiomas from metastasis to 100%.
The MR-image features that participated in the optimum feature vector were related to the degree of homogeneity, the amount of randomness and the dispersion of the gray-tone intensity values within the texture of the tumor. These textural characteristics are related to textural parameters that physicians employ in diagnosis and they were proportional to the textural imprint of brain tumors, i.e. gliomas have heterogeneous texture while meningiomas appear to be homogeneous in MR imaging.
The MR-spectroscopy feature that participated in the optimum feature vector was the Choline (Cho) / N-Acetyl Aspartate (NAA) metabolite integral ratio. It was found that both meningiomas and metastases are characterized from low concentrations of NAA while meningiomas exhibit higher concentrations of Cho than metastases, which could be attributed to increased synthesis of tumor cell membranes.
Finally, the proposed system might be of value as an assisting tool for brain tumor characterization on volumetric MRI series.
|
50 |
Αναγνώριση κινδύνου σύγκρουσης αυτοκινήτου με προπορευόμενο με ψηφιακή επεξεργασία σημάτων videoΕυαγγελίου, Κωνσταντίνος 21 October 2011 (has links)
Η αποφυγή συγκρούσεων με αναγνώριση της θέσης και της σχετικής ταχύτητας προπορευόμενων οχημάτων είναι μια άκρως ενδιαφέρουσα εφαρμογή που βρίσκεται σε πειραματικό στάδιο. Η ύπαρξη πολλαπλών αντικειμένων στο οπτικό πεδίο της κάμερας δημιουργεί προβλήματα στον ακριβή εντοπισμό του προπορευόμενου οχήματος, ενώ η έλλειψη βάσεων δεδομένων με κατηγοριοποιημένα παραδείγματα είναι ένα επιπλέον εμπόδιο για την ανάπτυξη της εφαρμογής αυτής.
Στην εργασία αυτή περιγράφονται οι υπάρχουσες εφαρμογές όσον αφορά στο πρόβλημα της μηχανικής όρασης στην αυτοκίνηση, τα προβλήματα που λύνουν αλλά και οι δυσκολίες που συνεχίζουν να υπάρχουν.
Αναφέρονται οι αιτίες της έλλειψης βάσεων δεδομένων με κατηγοριοποιημένα παραδείγματα και αναλύεται η ημιαυτόματη μέθοδος (Random Walker) στην οποία καταφεύγουμε για τον λόγο αυτό.
Εν συνεχεία θα παρουσιαστούν τα αποτελέσματα της ανάπτυξης σε Matlab που πραγματοποιήθηκε, τα συμπεράσματα που προέκυψαν, αλλά και οι μελλοντικές προκλήσεις. / In this diplom work, the ways followed to deal with the issue of mechanical vision in car driving are described. The reasons why there there are not any specific data sets are decribed and the focus of this work is on the Random Walker algorithm.
|
Page generated in 0.0224 seconds