• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 9
  • Tagged with
  • 9
  • 9
  • 5
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Πολλαπλό γραμμικό μοντέλο παλινδρόμησης : στατιστικά συμπεράσματα και εκτιμήσεις

Κιουφεντζή, Όλγα 27 August 2008 (has links)
Η εργασία μου αναφέρεται στην ανάλυση της γραμμικής παλινδρόμησης και στην περαιτέρω ανάλυση των υποθέσεων του γραμμικού μοντέλου παλινδρόμησης σε συνδυασμό με παραδείγματα από την οικονομική θεωρία. Περιέχει ακόμη μια εφαρμογή για την ελαχιστοποίηση του κόστους παραγωγής ηλεκτρικής ενέργειας κάποιων επιχειρήσεων. / My paper concerns in Linear Regression analysis and the further analysis of the hypothesis of the Linear Regression model accompanied with many examples of econometric theory. Also, it concludes an application of minimization of the production cost of electric power of a specific number of companies.
2

Διαχωριστική ανάλυση - λογιστική παλινδρόμηση

Χουντής, Βασίλειος 07 July 2010 (has links)
Στην σημερινή εποχή είναι μεγάλη η ανάγκη να κατατάσσουμε παρατηρήσεις σε γνωστές ομάδες - πληθυσμούς καθώς επίσης και να κάνουμε προβλέψεις. Υπάρχουν πολλές μέθοδοι που κάνουν ή σκοπό έχουν να κατατάσσουν παρατηρήσεις. Στην διπλωματική εργασία περιγράφω δυο από τις σημαντικότερες μεθόδους που χρησιμοποιούνται ευρέως στην στατιστική, την διαχωριστική ανάλυση (discriminant analysis) και την λογιστική παλινδρόμηση (logistic regression). Στο πρώτο μέρος αναφέρω τι είναι η διαχωριστική ανάλυση, δίνω συνοπτικά μερικές εφαρμογές της μεθόδου και περιγράφω την διαφορά από την ανάλυση σε συστάδες. Στην συνέχεια αναλύω τον διαχωρισμό δυο πληθυσμών που ακολουθούν την κανονική κατανομή και τα κριτήρια που πρέπει να λάβουμε υπόψη. Στόχος μας είναι να κατασκευάσουμε μια συνάρτηση που θα διαχωρίζει όσο το δυνατόν καλύτερα τους δυο πληθυσμούς. Πρέπει να σημειώσουμε ότι δεν υπάρχει τέλειος διαχωρισμός, δηλαδή ενδέχεται η συνάρτηση να κατατάσσει λανθασμένα μια παρατήρηση σε μια από τις δυο ομάδες. Για αυτό πρέπει να λάβουμε υπόψη τα κόστη λανθασμένης κατάταξης και τις εκ των προτέρων πιθανότητες. Ο βέλτιστος διαχωρισμός θα πραγματοποιηθεί αν καταφέρουμε να ελαχιστοποιήσουμε το κόστος λανθασμένης κατάταξης. Στο τμήμα 3 βρίσκω την συνάρτηση κατάταξης όταν οι δυο πληθυσμοί έχουν ίσους πίνακες διασποράς (γραμμικός κανόνας κατάταξης) αλλά και όταν έχουν άνισες διασπορές (τετραγωνικός κανόνας κατάταξης). Εφόσον, έχω φτιάξει την συνάρτηση κατάταξης το επόμενο βήμα είναι να την αξιολογήσω. Περιγράφω δυο τρόπους αξιολόγησης (επικύρωσης), τον υπολογισμό του ρυθμού σφάλματος και την holdout διαδικασία. Στο τμήμα 5 αναφέρω την διαχωριστική ανάλυση του Fisher, τι υποθέσεις έκανε και πως κατάφερε να φτάσει στην ίδια συνάρτηση κατάταξης. Στην συνέχεια κάνω μια γενίκευση της διαχωριστικής ανάλυσης αν έχω g πληθυσμούς και δίνω το νέο τύπο της συνάρτησης κατάταξης όταν έχω ίσους και άνισους πίνακες διασποράς (γραμμικό – τετραγωνικό διαχωριστικό σκορ). Ερμηνεύω γεωμετρικά το γραμμικό διαχωριστικό σκορ. Στο τελευταίο τμήμα μελετάω την μέθοδο του Fisher όταν έχω g πληθυσμούς και αποδεικνύω μερικά θεωρήματα. Στο δεύτερος μέρος της διπλωματικής περιγράφω μια άλλη διαδικασία κατάταξης, την λογιστική παλινδρόμηση. Δίνω συνοπτικά μερικές εφαρμογές της μεθόδου και αναλύω πότε χρησιμοποιούμε αυτή την μέθοδο. Ξεκινώντας από το απλό γραμμικό μοντέλο παλινδρόμησης , αναφέρω τα προβλήματα που έχουμε τώρα που η μεταβλητή είναι δυαδική και πως τα αντιμετωπίζουμε, καταλήγοντας στην μορφή που έχει η απλή λογιστική συνάρτηση. Περιγράφω τις ιδιότητες της λογιστικής αποκρινόμενης συνάρτησης και πως προσαρμόζουμε το λογιστικό μοντέλο παλινδρόμησης χρησιμοποιώντας τους εκτιμητές μέγιστης πιθανοφάνειας. Κατόπιν δίνω την ερμηνεία του συντελεστή παλινδρόμησης και δίνω την μορφή της λογαριθμικής συνάρτησης πιθανοφάνειας όταν έχω επαναλαμβανόμενες παρατηρήσεις. Στο τμήμα 4 περιγράφω το πολλαπλό λογιστικό μοντέλο παλινδρόμησης και στο τμήμα 5 πως κατασκευάζεται το μοντέλο. Ελέγχω αν μπορούμε να παραλείψουμε μερικές προβλέπουσες μεταβλητές, χρησιμοποιώντας ένα στατιστικό που λέγεται μοντέλο απόκλισης, αλλά και από τον έλεγχο του λόγου πιθανοφάνειας. Προτού όμως χρησιμοποιήσω το μοντέλο στην πράξη εξετάζω την καταλληλότητα του, δηλαδή αν ικανοποιεί τις ιδιότητες της λογιστικής αποκρινόμενης συνάρτησης και αναζητώ τα outliers και τις παρατηρήσεις που έχουν την μεγαλύτερη επιρροή. Στα τμήματα 7 και 8 περιγράφω τα συμπεράσματα για τις παραμέτρους της λογιστικής παλινδρόμησης και για τον αποκρινόμενο μέσο, ενώ στο τμήμα 9 αναφέρω πως γίνεται η πρόβλεψη καινούριων παρατηρήσεων. Τελειώνοντας αναφέρω την πολύτομη λογιστική παλινδρόμηση και περιγράφω συνοπτικά τις ομοιότητες- διαφορές της διαχωριστικής ανάλυσης και της λογιστικής παλινδρόμησης. / -
3

Μη γραμμική παλινδρόμηση

Τόλιας, Γεώργιος 28 August 2008 (has links)
Μελέτη μη γραμμικών μοντέλων παλινδρόμησης(λογιστικό, εκθετικό, Poisson,γενικευμένα γραμμικά μοντέλα) όσον αφορά διαστημα εμπιστοσύνης, έλεγχο υποθέσεων και καλή προσαρμογή. / Analysis of nonlinear regression models (logistic, exponential, Poisson, generalized linear models) regarding confidence interval estimation, tests and good fit.
4

Ανάλυση διασποράς και παλινδρόμησης με εφαρμογές

Καμπέλη, Πετρούλα 20 September 2010 (has links)
Στη διπλωματική εργασία περιγράφονται και αναπτύσονται δύο στατιστικές μέθοδοι ανάλυσης δεδομένων, Γραμμική Παλινδρόμηση με ποιοτικές μεταβλητές και Ανάλυση διασποράς με έναν και ακολούθως με δύο παράγοντες. Στη συνέχεια οι παραπάνω μέθοδοι εφαρμόζονται σε πραγματικά δεδομένα που προέρχονται από δείγματα νερού ενός κολπίσκου και μελετάται ο βαθμός επίδρασης 3 διαφορετικών βροχοπτώσεων στο pH του νερού. Η εφαρμογή των μεθόδων γίνεται με τη χρήση του στατιστικού πακέτου SPSS. / The thesis described and developed the data analysis of two statistical methods, Linear Regression with qualitative variables and ANOVA one-way analysis, then ANOVA two-way. Moreover, the former methods are applied to real data from gulf water samples and studied the degree of influence of 3 different rainfalls in the water pH. The application of the methods is done using the SPSS statistical package.
5

Μέθοδοι μη παραμετρικής παλινδρόμησης

Βαρελάς, Γεώργιος 08 July 2011 (has links)
Ένα πράγμα που θέτει τους στατιστικολόγους πέρα από άλλους επιστήμονες είναι σχετική άγνοια του κοινού γενικά σχετικά με το τι είναι στην πραγματικότητα το πεδίο της στατιστικής. Ο κόσμος έχει μια μικρή γενική ιδέα του τι είναι η χημεία ή η βιολογία — αλλά τι είναι αυτό ακριβώς που κάνουν οι στατιστικολόγοι; Μία απάντηση στο ερώτημα αυτό έχει ως εξής: στατιστική είναι η επιστήμη που ασχολείται με τη συλλογή, περιληπτική παρουσίαση της πληροφορίας, παρουσίαση και ερμηνεία των δεδομένων. Τα δεδομένα είναι το κλειδί, φυσικά — τα πράγματα από τα οποία εμείς αποκτούμε γνώσεις και βγάζουμε αποφάσεις. Ένας πίνακας δεδομένων παρουσιάζει μια συλλογή έγκυρων δεδομένων, αλλά είναι σαφές ότι είναι εντελώς ανεπαρκής για την σύνοψη ή την ερμηνεία τους.Το πρόβλημα είναι ότι δεν έγιναν παραδοχές σχετικά με τη διαδικασία που δημιούργησε αυτά τα δεδομένα (πιο απλά, η ανάλυση είναι καθαρά μη παραμετρική, υπό την έννοια ότι δεν επιβάλλεται καμία τυπική δομή για τα δεδομένα). Επομένως, καμία πραγματική περίληψη ή σύνοψη δεν είναι δυνατή. Η κλασική προσέγγιση σε αυτή τη δυσκολία είναι να υποθέσουμε ένα παραμετρικό μοντέλο για την υποκείμενη διαδικασία, καθορίζοντας μια συγκεκριμένη φόρμα για την υποκείμενη πυκνότητα. Στη συνέχεια, μπορούν να υπολογιστούν διάφορα στατιστικά στοιχεία και μπορούν να παρουσιαστούν μέσω μιας προσαρμοσμένης πυκνότητας.Δυστυχώς, η ισχύς της παραμετρικής μοντελοποίησης είναι επίσης η αδυναμία της. Συνδέοντας ένα συγκεκριμένο μοντέλο, μπορούμε να έχουμε μεγάλα οφέλη, αλλά μόνο εάν το πρότυπο θεωρείται ότι ισχύει (τουλάχιστον κατά προσέγγιση). Εάν το υποτιθέμενο μοντέλο δεν είναι σωστό, οι αποφάσεις που θα αντλήσουμε από αυτό μπορεί να είναι χειρότερες από άχρηστες, οδηγώντας μας σε παραπλανητικές ερμηνείες των δεδομένων. / A thing that places the statisticians beyond other scientists is relative ignorance of public as generally speaking with regard to what it is in reality the field of statistics. The world does have a small general idea what is chemistry or biology - but what is precisely that statisticians do? An answer in this question has as follows: statistics is the science that deals with the collection, general presentation of information, presentation and interpretation of data. The data are the key, from which we acquire knowledge and make decisions. A table of data presents a collection of valid data, but it is obvious that it is completely insufficient for their synopsis or their interpretation. The problem is that no assumptions have been made about the process that created these data (more simply, the analysis is no parametric, under the significance that is no formal structure is imposed on the data). Consequently, no real summary or synopsis is possible. The classical approach in this difficulty is to assume a parametric model for the underlying process, determining a concrete form for the underlying density. Afterwards, can be calculated various statistical elements and a fitted density can manifest itself. The power of parametric modelling is also its weakness. By linking inference to a specific model, we can have big profits, but only if the model is true. If the assumed model is not correct, the decisions that we will draw from this can be worse than useless, leading us to misleading interpretations of data.
6

Λογιστική παλινδρόμηση & διαχωριστική ανάλυση

Ξενή, Μαρία 26 April 2012 (has links)
Σε αυτή την εργασία ασχοληθήκαμε με δύο μεθόδους, που σκοπός τους είναι να κατατάσσουν τις παρατηρήσεις σε γνωστές ομάδες και στη συνέχεια να κάνουν προβλέψεις για καινούριες παρατηρήσεις. Αυτές οι μέθοδοι είναι η λογιστική παλινδρόμηση (logistic regression) και η διαχωριστική ανάλυση (discriminant analysis). Στο πρώτο κεφάλαιο αναφέραμε περιληπτικά τα μη γραμμικά μοντέλα παλινδρόμησης (αφού και η λογιστική παλινδρόμηση είναι ένα τέτοιο μοντέλο). Απλά αναφέρουμε τη μορφή που έχουν αυτά τα μοντέλα, με ποιες μεθόδους μπορούμε να εκτιμήσουμε τις παραμέτρους παλινδρόμησης, ποια είναι τα διαστήματα εμπιστοσύνης για τους συντελεστές παλινδρόμησης και τη μορφή που θα έχουν οι έλεγχοι υποθέσεων. Στο δεύτερο κεφάλαιο περιγράφουμε τη λογιστική παλινδρόμηση. Η λογιστική παλινδρόμηση είναι χρήσιμη σε καταστάσεις στις οποίες επιθυμούμε να προβλέψουμε την ύπαρξη ή την απουσία ενός χαρακτηριστικού ή ενός συμβάντος. Η πρόβλεψη αυτή βασίζεται στην κατασκευή ενός μοντέλου και συγκεκριμένα στον προσδιορισμό των τιμών που παίρνουν οι συντελεστές. Αυτή η μέθοδος είναι μια γενίκευση της απλή γραμμικής παλινδρόμησης για την περίπτωση όπου η εξαρτημένη μεταβλητή είναι δίτιμη (παίρνει την τιμή 0 όταν το χαρακτηριστικό απουσιάζει και την τιμή 1 όταν υπάρχει το χαρακτηριστικό). Στο τρίτο κεφάλαιο αναλύουμε τη διαχωριστική ανάλυση, η οποία έχει δύο στόχους: να χωρίσει ένα πληθυσμό σε ευδιάκριτες ομάδες και με τη βοήθεια ενός διαχωριστικού κανόνα να κατατάσσει παρατηρήσεις στις ευδιάκριτες ομάδες. Στο τέλος του κεφαλαίου περιγράφουμε τις ομοιότητες και τις διαφορές της διαχωριστικής ανάλυσης και της λογιστικής παλινδρόμησης. Στο τέταρτο και τελευταίο κεφάλαιο απλά δίνουμε ένα παράδειγμα που το λύνουμε με τη μέθοδο της λογιστικής παλινδρόμησης και ένα παράδειγμα που το λύνουμε με τη μέθοδο της διαχωριστικής ανάλυσης. Αυτό το κάνουμε με τη βοήθεια του στατιστικού πακέτου SPSS. / In this work we dealt with two methods, that their aim are to classify the observations in known teams and afterwards to make forecasts for new observations. These methods are the accountant regression (logistic regression) and the bisector analysis (discriminant analysis).
7

Στατιστική ανάλυση δεδομένων ιστικών μικροσυστοιχιών

Δασκαλάκη, Ελευθερία 07 June 2013 (has links)
To PTEN δρα ως ογκοκατασταλτικό γονίδιο, μέσω της δράσης του προϊόντος πρωτεΐνης της φωσφατάσης. Η φωσφατάση εμπλέκεται στη ρύθμιση του κυτταρικού κύκλου εμποδίζοντας τα κύτταρα να αναπτυχθούν και έχοντας σαν αποτέλεσμα την υπερβολικά γρήγορη διαίρεση. Το γονίδιο αυτό έχει ταυτοποιηθεί ως ογκοκατασταλτικό και σε αρκετές περιπτώσεις καρκίνων έχουν εντοπιστεί μεταλλάξεις του. Στην παρούσα διπλωματική εργασία, θα μελετηθεί η δράση του PTEN στο αδενοκαρκίνωμα του παχέως εντέρου και θα εξεταστεί η δυνατότητα χρήσης των επιπέδων έκφρασής του σαν βιοδείκτη για το συγκεκριμένο είδος καρκίνου. Σκοπός της παρούσας διπλωματικής είναι με χρήση κλινικών δεδομένων και της έντασης της έκφρασης της πρωτεΐνης του γονιδίου PTEN, να μελετηθεί με στατιστικές μεθόδους η δυνατότητα πρόβλεψης της βαθμοποίησης και της σταδιοποίησης του αδενοκαρκινώματος του παχέος εντέρου. Για τον σκοπό αυτό χρησιμοποιήθηκαν πραγματικά κλινικά δεδομένα 60 ασθενών που προήλθαν από το κυτταρολογικό εργαστήριο του Νοσηλευτικού Ιδρύματος Μετοχικού Ταμείου Στρατού 417 (Ν.Ι.Μ.Τ.Σ.). Τα δεδομένα αυτά αναλύθηκαν με εφαρμογή της περιγραφικής στατιστικής, της λογιστικής παλινδρόμησης και της πολυμεταβλητής παλινδρόμησης με χρήση του στατιστικού πακέτου R. Παρόλα αυτά κανένα από τα εξαγόμενα στατιστικά μοντέλα δεν βρέθηκε να μπορεί να συσχετίσει την ποσότητα έκφρασης του PTEN γονιδίου με τη βαθμοποίηση και τη σταδιοποίηση του αδενοκαρκινώματος του παχέος εντέρου. Για αυτό τον λόγο καταλήγουμε ότι με χρήση των συγκεκριμένων βιολογικών δεδομένων δεν μπορούμε να επαληθεύσουμε ότι το PTEN γονίδιο είναι βιοδείκτης του αδενοκαρκινώματος του παχέος εντέρου. Μελλοντικά αυτό πρέπει να διερευνηθεί περαιτέρω είτε με τη χρήση επιπλέον κλινικών δεδομένων καθώς το υπάρχον σύνολο δεδομένων περιέχει λίγα δείγματα ασθενών σε σχέση με τις ελεύθερες μεταβλητές του προβλήματος (small sample size problem), είτε με μεθόδους που αυξάνουν τεχνητά τα δείγματα του συνόλου δεδομένων. / PTEN tumor suppressor gene acts as through the action of the protein product of phosphatase. The phosphatase is involved in regulating the cell cycle by preventing cells to grow and the resulting too rapid division. This gene has been identified as tumor suppressor in several cancers identified mutations. In this paper, we studied the effect of PTEN in adenocarcinoma of the colon and consider the possibility of using the levels of expression as biomarker for this type of cancer. The purpose of this thesis is to use clinical data and the intensity of the protein expression of the gene PTEN and be studied using statistical methods for predict the grade and stage of adenocarcinoma of the colon. For this purpose we used real clinical data of 60 patients who came from the cytology laboratory of the hospital in the Army Pension Fund 417 (N.I.M.T.S.). The data were analyzed using the descriptive statistics, regression and multivariate regression using the statistical package R. However none of the extracted statistical models were found to be correlated to the amount of expression of PTEN gene with grade and stage of adenocarcinoma of the colon. For this reason, we conclude that the use of these biological data can not verify that the PTEN gene is a biomarker of adenocarcinoma of the colon. Future should be investigated further or using additional clinical data as the existing data set contains few patient samples relative to the free variables of the problem (small sample size problem), or by methods that increase artificially the samples in the data set.
8

Independent component analysis of evoked potentials for the classification of psychiatric patients and normal controls / Ανάλυση ανεξάρτητων συνιστώσων προκλητών δυναμικών για ταξινόμηση ψυχιατρικών ασθενών και υγιών μαρτύρων

Κοψαύτης, Νικόλαος Ι. 18 February 2009 (has links)
The last twenty years presented increased interest for the study of cerebral processes caused by external events (stimuli). One of the most significant endogenous components of Evoked Potentials is the P600 component. The P600 component may be defined as the most positive peak in the time window between 500 and 800 msec after an eliciting stimulus. This component is thought to reflect the response selection stage of information processing. P600 component is usually less pronounced compared to other components, such as the N100 or the P300. Frequently the P600 component appears as a not-easily discernible secondary peak overlying the ascending negative-going slope of the P300 waveform. In our study we used ERP data from various groups of patients and healthy controls. Patients were recruited from the outpatient university clinic of Eginition Hospital of the University of Athens. The controls were recruited from hospital staff and local volunteer groups. The aim of the study is the implementation of classification systems for these groups, using P600 features. This is usually not achieved well using as features the ERPs amplitude and latency. So for that reason, in our study, we want to extract new features using advanced techniques for processing the original ERPs, such as the Independent Component Analysis (ICA) method. However as a precursor of ICA, is considered the Principal Component Analysis (PCA) method, which we used for comparison reasons to ICA. In the application of ICA we achieve the decomposition of the recorded signals in ICs, supposing temporally independent components and propose ICs selection techniques in order to recompose the P600 component. The next stage was the use of a classification method based on the features extracted using the original data, data extracted through PCA processing and ICA-processed data. First we applied Kolmogorov-Smirnov test to check the normality of the distribution of the features, then we used the Logistic Regression method for classification and finally we have done two implementations of classification using Probabilistic Neural Networks. The first implementation was done with the creation of 15 features from the P600 peak amplitudes from the subjects’ data and the second implementation was done with the creation of four meta-features from the subjects’ P600 amplitude data. The results show that the application of ICA, combined with the logistic regression classification technique, provides notable improvement, compared to the classification performance based on the original ERPs. The main merit of the application is that classification is based on single parameters, i.e. amplitude of the P600 component, or its latency or its termination latency, which are directly related to the brain mechanisms related to ERP generation and pathological processes. / Τα τελευταία 20 χρόνια παρουσιάζεται αυξημένο ενδιαφέρον για την μελέτη εγκεφαλικών επεξεργασιών που προκλήθηκαν από εξωτερικά γεγονότα (ερέθισμα). Ένα από τα πιο σημαντικά ενδογενή συστατικά των Προκλητών Δυναμικών είναι το συστατικό P600. Το συστατικό P600 μπορεί να οριστεί σαν η πιο θετική αιχμή στο χρονικό διάστημα μεταξύ 500 και 800 msec μετά από ένα εκλυτικό ερέθισμα. Το συστατικό αυτό θεωρείται ότι απεικονίζει το στάδιο επιλογής απόκρισης της επεξεργασίας πληροφορίας. Το συστατικό P600 είναι συνήθως λιγότερο έντονο συγκρίνοντας το με άλλα συστατικά, όπως το N100 ή το P300. Συχνά το συστατικό P600 εμφανίζεται ως μια δυσδιάκριτη δεύτερη αιχμή, επικαλύπτοντας την ανοδική αρνητική κλίση της κυματομορφής του P300. Στη μελέτη μας χρησιμοποιήσαμε δεδομένα ΠΔ από ποικίλες ομάδες ασθενών και υγιών μαρτύρων. Οι ασθενείς συλλέχθησαν από τη πανεπιστημιακή κλινική του Αιγηνήτειου Νοσοκομείου του Πανεπιστημίου Αθηνών. Οι υγιείς συλλέχθησαν από το προσωπικό του νοσοκομείου και ομάδες εθελοντών. Ο σκοπός της μελέτης είναι η εφαρμογή συστημάτων ταξινόμησης για αυτές τις ομάδες, χρησιμοποιώντας χαρακτηριστικά του P600. Αυτό συνήθως δεν επιτυγχάνεται καλά χρησιμοποιώντας σαν χαρακτηριστικά το πλάτος και τον λανθάνοντα χρόνο των ΠΔ. Για αυτό το λόγο, στην μελέτη μας, θέλουμε να εξάγουμε νέα χαρακτηριστικά χρησιμοποιώντας προηγμένες τεχνικές για επεξεργασία των αρχικών ΠΔ, όπως τη μέθοδο Ανάλυσης Ανεξαρτήτων Συνιστωσών (ICA). Εντούτοις ως πρόδρομο της ICA, θεωρείται η μέθοδος Ανάλυσης Κύριων Συνιστωσών (PCA), την οποία χρησιμοποιήσαμε για συγκριτικούς λόγους με την ICA. Στην εφαρμογή της ICA προχωρήσαμε στην αποσύνθεση των καταγραφόμενων σημάτων σε Ανεξάρτητες Συνιστώσες και διερευνήσαμε τρεις τεχνικές επιλογής ανεξαρτήτων συνιστωσών μέσω των οποίων επανασυνθέσαμε το συστατικό P600. Το επόμενο βήμα ήταν η χρήση μεθόδου ταξινόμησης βασισμένης στα χαρακτηριστικά που εξάχθηκαν χρησιμοποιώντας τα αρχικά δεδομένα, τα δεδομένα με επεξεργασία PCA και τα δεδομένα με επεξεργασία ICA. Πρώτα εφαρμόσαμε το τεστ Kolmogorov-Smirnov για τον έλεγχο της κανονικότητας της κατανομής των χαρακτηριστικών, μετά χρησιμοποιήσαμε τη μέθοδο Λογαριθμικής Παλινδρόμησης (Logistic Regression) για ταξινόμηση και τελικά πραγματοποιήσαμε δύο εφαρμογές ταξινόμησης χρησιμοποιώντας Πιθανοκρατικά Νευρωνικά Δίκτυα (Probabilistic Neural Networks). Η πρώτη εφαρμογή έγινε με την δημιουργία 15 χαρακτηριστικών από τα πλάτη των αιχμών του P600 από τα δεδομένα των ομάδων και η δεύτερη εφαρμογή έγινε με την δημιουργία τεσσάρων μετά-χαρακτηριστικών από τα δεδομένα των πλατών των ομάδων. Τα αποτελέσματα δείχνουν ότι η εφαρμογή της ICA, συνδυασμένη με την τεχνική ταξινόμησης λογαριθμικής παλινδρόμησης, παρέχει αξιοσημείωτη βελτίωση, συγκριτικά με την απόδοση ταξινόμησης βάση των αρχικών ΠΔ. Η κύρια αξία της εφαρμογής είναι ότι η ταξινόμηση πετυχαίνει ποσοστά μεγαλύτερα του 80% βασιζόμενη σε μία μόνο κάθε φορά παράμετρο, π.χ. το πλάτος του συστατικού P600, ή τον λανθάνοντα χρόνο του ή τον λανθάνοντα χρόνο τερματισμού του, οι οποίες σχετίζονται άμεσα με τους μηχανισμούς του εγκεφάλου σχετικούς με την παραγωγή ΠΔ και τις παθολογικές διαδικασίες.
9

Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας / Automatic segmentation of digital speech signals and application to speech synthesis, speech recognition and language recognition

Μπόρας, Ιωσήφ 19 October 2009 (has links)
Η παρούσα διατριβή εισάγει μεθόδους για τον αυτόματο τεμαχισμό σημάτων ομιλίας. Συγκεκριμένα παρουσιάζονται τέσσερις νέες μέθοδοι για τον αυτόματο τεμαχισμό σημάτων ομιλίας, τόσο για γλωσσολογικά περιορισμένα όσο και μη προβλήματα. Η πρώτη μέθοδος κάνει χρήση των σημείων του σήματος που αντιστοιχούν στα ανοίγματα των φωνητικών χορδών κατά την διάρκεια της ομιλίας για να εξάγει όρια ψευδό-φωνημάτων με χρήση του αλγορίθμου δυναμικής παραμόρφωσης χρόνου. Η δεύτερη τεχνική εισάγει μια καινοτόμα υβριδική μέθοδο εκπαίδευσης κρυμμένων μοντέλων Μαρκώφ, η οποία τα καθιστά πιο αποτελεσματικά στον τεμαχισμό της ομιλίας. Η τρίτη μέθοδος χρησιμοποιεί αλγορίθμους μαθηματικής παλινδρόμησης για τον συνδυασμό ανεξαρτήτων μηχανών τεμαχισμού ομιλίας. Η τέταρτη μέθοδος εισάγει μια επέκταση του αλγορίθμου Βιτέρμπι με χρήση πολλαπλών παραμετρικών τεχνικών για τον τεμαχισμό της ομιλίας. Τέλος, οι προτεινόμενες μέθοδοι τεμαχισμού χρησιμοποιούνται για την βελτίωση συστημάτων στο πρόβλημα της σύνθεσης ομιλίας, αναγνώρισης ομιλίας και αναγνώρισης γλώσσας. / The present dissertation introduces methods for the automatic segmentation of speech signals. In detail, four new segmentation methods are presented both in for the cases of linguistically constrained or not segmentation. The first method uses pitchmark points to extract pseudo-phonetic boundaries using dynamic time warping algorithm. The second technique introduces a new hybrid method for the training of hidden Markov models, which makes them more effective in the speech segmentation task. The third method uses regression algorithms for the fusion of independent segmentation engines. The fourth method is an extension of the Viterbi algorithm using multiple speech parameterization techniques for segmentation. Finally, the proposed methods are used to improve systems in the task of speech synthesis, speech recognition and language recognition.

Page generated in 0.022 seconds