21 |
Απλή & πολλαπλή ανάλυση αντιστοιχιών (simple & multiple correspondence analysis) και πρακτική εφαρμογή τους σε έρευνα αγοράς (market research) με τη χρήση των στατιστικών πακέτων SPSS & MINITABΓεωργιτσόπουλος, Άγγελος 18 June 2014 (has links)
Ένα από τα πιο αποτελεσματικά μέσα για την επιτυχία ενός προϊόντος είναι αναμφισβήτητα η Έρευνα Αγοράς (Market Research). Η έρευνα υλοποιείται σε αντιπροσωπευτικό δείγμα ενός συγκεκριμένου υπό μελέτη πληθυσμού, με απώτερο σκοπό να εξαχθούν συμπεράσματα από την ποσοτική στατιστική επεξεργασία και ανάλυση των δεδομένων σχετικά με τις απόψεις, τις στάσεις και τις συμπεριφορές που διαθέτουν οι καταναλωτές, τις τάσεις και τις προοπτικές ενός κλάδου, το μερίδιο αγοράς που αντιστοιχεί σε κάποιο προϊόν ή επίσης και τη γνώση που έχουν οι καταναλωτές όσον αφορά τη μάρκα ή την εικόνα ενός προϊόντος.
Η στατιστική ανάλυση των αποτελεσμάτων επιτυγχάνεται με χρήση διαφόρων στατιστικών τεχνικών, ανάμεσα στις οποίες περιλαμβάνεται και η Ανάλυση Αντιστοιχιών (Correspondence Analysis).
Η Ανάλυση Αντιστοιχιών (Correspondence Analysis) είναι μια διερευνητική τεχνική ανάλυσης δεδομένων που απεικονίζει γραφικά πίνακες συνάφειας και πολυμεταβλητά κατηγορικά δεδομένα, ενώ παράλληλα τις τελευταίες δεκαετίες έχει σημειώσει ταχύτατη εξέλιξη και ανάπτυξη. Η Ανάλυση Αντιστοιχιών βρίσκει εφαρμογή τόσο στην Έρευνα Αγοράς, ακριβώς λόγω της κατηγορικής φύσεως των δεδομένων που προκύπτουν σε έρευνες τέτοιου τύπου, όσο και γενικότερα στις κοινωνικές επιστήμες όπου συνήθως χρειάζεται ένα στατιστικό «εργαλείο» για να ελέγξει τις αντιστοιχίες- συσχετίσεις μεταξύ των μεταβλητών και να τις αποδώσει με τη βοήθεια ενός γραφήματος.
Σκοπός της παρούσας εργασίας είναι η θεωρητική, πρακτική και υπολογιστική επισκόπηση της συγκεκριμένης στατιστικής μεθόδου καθώς και η υλοποίησή της στα στατιστικά πακέτα SPSS & MINITAB, με τη χρήση κατάλληλων δεδομένων από τον τομέα της Έρευνας Αγοράς. Θα δοθεί έμφαση περισσότερο στην ερμηνεία των αποτελεσμάτων παρά στις μαθηματικές και τεχνικές λεπτομέρειες των διαδικασιών της εφαρμογής. / One of the most effective means for the success of a product is indisputably the Market Research. The research is conducted in a representative sample of a specific population under study with the aim to draw conclusions which are derived from the quantitative statistical processing and analysis of data on the opinions, the attitudes and behaviors that consumers have, the trends and the prospects of a branch, the market share which is corresponding to a product or also the knowledge that consumers have got as far as it concerns the brand or product image.
The statistical analysis of the results is accomplished by using different statistical techniques including Correspondence Analysis.
The Correspondence Analysis is an exploratory data analysis technique that depicts graphically contingency tables and multivariate categorical data, while the last decades it has made rapid progress and development. The Correspondence Analysis is applicable to Market Research, just because of the categorical nature of data obtained in researches of this type and generally in social sciences, where commonly a statistical tool is needed to check on the correspondences- correlations among the variables and yield them through a graph.
The purpose of this study is the theoretical, practical and computational survey of this specific statistical method and its implementation in the statistical packages SPSS & MINITAB by using appropriate data from Market Research. Emphasis will be given more on the interpretation of results despite the mathematical and technical details of the method procedures.
|
22 |
Η παραγοντική ανάλυση των αντιστοιχιών (Correspondence analysis) και εφαρμογή της, με χρήση του Spss, σε δεδομένα έρευνας για την αξιοποίηση Τεχνολογιών Πληροφορίας και Επικοινωνίας (ΤΠΕ) στην πρωτοβάθμια εκπαίδευσηΜαντζούνη, Αικατερίνη 06 December 2013 (has links)
Η παρούσα διπλωματική εργασία ασχολείται με πολυδιάστατα κατηγορικά δεδομένα όπως αυτά προκύπτουν από συλλογή μέσω ερωτηματολογίων. Για να αναλυθεί όμως ένα ερωτηματολόγιο το οποίο περιλαμβάνει πλήθος ερωτήσεων-μεταβλητών και να εξάγουμε ορισμένα χρήσιμα συμπεράσματα θα πρέπει, πρώτα από όλα να γίνει η κατάλληλη κωδικοποίηση των δεδομένων. Χρησιμοποιώντας στατιστικές τεχνικές και μεθόδους κατάλληλες για κατηγορικά δεδομένα μπορούμε πιο εύκολα να μελετήσουμε τις σχέσεις μεταξύ των μεταβλητών. Για τον σκοπό αυτό, παρουσιάζουμε και αναλύουμε τη θεωρία της Παραγοντικής Ανάλυσης των Αντιστοιχιών και της Πολλαπλής Παραγοντικής Ανάλυσης των Αντιστοιχιών. Ύστερα, αναλύουμε τα αποτελέσματα που δίνουν οι μέθοδοι όταν τις χρησιμοποιήσουμε για την ανάλυση του ερωτηματολογίου. Τα συμπεράσματα που προκύπτουν έχουν ιδιαίτερο ενδιαφέρον. Η δυναμικότητα των μοντέλων αυτών παρουσιάζεται μέσα από μία εφαρμογή από τον χώρο των κοινωνικών επιστημών σε θέματα που αφορούν τα σχολεία και τους μαθητές της Πρωτοβάθμιας εκπαίδευσης.
Στις μεθόδους αυτές δίνεται έμφαση κυρίως στα γραφικά αποτελέσματα αλλά και στις εκτιμήσεις των σκορ των κατηγοριών των μεταβλητών. Όλα τα παραπάνω τα συγκρίνουμε κριτικά μεταξύ τους στη θεωρία και στη πράξη έτσι ώστε ο ενδιαφερόμενος αναγνώστης να κατανοήσει περισσότερο τις μεθόδους αυτές και να αποκομίσει όσο το δυνατόν περισσότερες πληροφορίες που θα τον βοηθήσουν για την εφαρμογή τους. / This dissertation deals with multivariate categorical data of a raw data set produced by a questionnaire designed for a research purpose. However, in order to analyze a questionnaire and extract some fruitful results, that includes a great number of questions-variables, we must first impose a structure on it especially on situations this specific structure is missing. Whenever the structure is imposed, by using statistical techniques and methods designed for categorical data, we can then study more efficiently the relations among the variables in concern for further analyses. The capacity of these models is presented through an application from the social sciences on issues concerning schools and pupils in primary education. The analysis on a smaller subset is further explored by describing the issues of Correspondence Analysis, and Multiple Correspondence Analysis. With these methods, we focus on the interpretation of the results on the graphical displays of the data but also on the estimated category scores of the variables. The above methods described in this dissertation and the results after implementing them are all critically compared with each other at each chapter. This gives to the interesting reader the possibility to fully understand them and to obtain additional information on their implementation.
|
23 |
Diagnostic de systèmes non linéaires par analyse en composantes principales à noyau / Diagnosis of nonlinear systems using kernel Principal Component AnalysisAnani, Kwami Dodzivi 21 March 2019 (has links)
Dans cette thèse, le diagnostic d'un système non linéaire a été réalisé par une analyse de données. Initialement conçue pour analyser les données liées par des relations linéaires, l'Analyse en Composantes Principales (ACP) est couplée aux méthodes à noyau pour détecter, localiser et estimer l'amplitude des défauts sur des systèmes non linéaires. L'ACP à noyau consiste à projeter les données par l'intermédiaire d'une application non linéaire dans un espace de dimension élevée dénommé espace des caractéristiques où l'ACP linéaire est appliquée. Ayant fait la projection à l'aide de noyaux, la détection peut facilement être réalisée dans l'espace des caractéristiques. Cependant, l'estimation de l'amplitude du défaut nécessite la résolution d'un problème d'optimisation non linéaire. Une étude de contributions permet de localiser et d'estimer ces amplitudes. La variable ayant la plus grande contribution est susceptible d'être affectée par un défaut. Dans notre travail, nous avons proposé de nouvelles méthodes pour les phases de localisation et d'estimation des défauts pour lesquelles les travaux existants ont des limites. La nouvelle méthode proposée est basée sur les contributions sous contraintes permettant d'obtenir une reconstruction parcimonieuse des variables. L'efficacité des méthodes proposées est montrée sur un réacteur à agitation continue (CSTR). / In this thesis, the diagnosis of a nonlinear system was performed using data analysis. Initially developed to analyze linear system, Principal Component Analysis (PCA) is coupled with kernel methods for detection, isolation and estimation of faults' magnitude for nonlinear systems. Kernel PCA consists in projecting data using a nonlinear mapping function into a higher dimensional space called feature space where the linear PCA is applied. Due to the fact that the projections are done using kernels, the detection can be performed in the feature space. However, estimating the magnitude of the fault requires the resolution of a nonlinear optimization problem. The variables' contributions make it possible to isolate and estimate these magnitudes. The variable with the largest contribution may be considered as faulty. In our work, we proposed new methods for the isolation and estimation phases for which previous work has some limitations. The new proposed method in this thesis is based on contributions under constraints. The effectiveness of the developed methods is illustrated on the simulated continuous stirred tank reactor (CSTR).
|
24 |
Εφαρμογή της παραγοντικής ανάλυσης για την ανίχνευση και περιγραφή της κατανάλωσης αλκοολούχων ποτών του ελληνικού πληθυσμούΡεκούτη, Αγγελική 21 October 2011 (has links)
Σκοπός της εργασίας αυτής είναι να εφαρμόσουμε την Παραγοντική Ανάλυση στο δείγμα μας, έτσι ώστε να ανιχνεύσουμε και να περιγράψουμε τις καταναλωτικές συνήθειες του Ελληνικού πληθυσμού ως προς την κατανάλωση 9 κατηγοριών αλκοολούχων ποτών. Η εφαρμογή της μεθόδου γίνεται με την χρήση του στατιστικού προγράμματος SPSS.
Στο πρώτο κεφάλαιο παρουσιάζεται η οικογένεια μεθόδων επίλυσης του προβλήματος και στο δεύτερο η μέθοδος που επιλέχτηκε για την επίλυση, η Παραγοντική Ανάλυση. Προσδιορίζουμε το αντικείμενο, τα στάδια σχεδιασμού και τις προϋποθέσεις της μεθόδου, καθώς και τα κριτήρια αξιολόγησης των αποτελεσμάτων.
Τα κεφάλαια που ακολουθούν αποτελούν το πρακτικό μέρος της εργασίας. Στο 3ο κεφάλαιο αναφέρουμε την πηγή των δεδομένων μας και την διεξαγωγή του τρόπου συλλογής τους. Ακολουθεί ο εντοπισμός των «χαμένων» απαντήσεων και εφαρμόζεται η Ανάλυση των Χαμένων Τιμών (Missing Values Analysis) για τον προσδιορισμό του είδους αυτών και την αποκατάσταση τους στο δείγμα. Στην συνέχεια παρουσιάζουμε το δείγμα μας με τη βοήθεια της περιγραφικής στατιστικής και τέλος δημιουργούμε και περιγράφουμε το τελικό μητρώο δεδομένων το οποίο θα αναλύσουμε παραγοντικά.
Στο 4ο και τελευταίο κεφάλαιο διερευνάται η καταλληλότητα του δείγματος για την εφαρμογή της Παραγοντικής Ανάλυσης με τον έλεγχο της ικανοποίησης των προϋποθέσεων της μεθόδου. Ακολουθεί η παράλληλη μελέτη του δείγματος συμπεριλαμβάνοντας και μη στην επίλυση τις ακραίες τιμές (outliers) που εντοπίστηκαν. Καταλήγοντας στο συμπέρασμα ότι οι ακραίες τιμές δεν επηρεάζουν τα αποτελέσματα της μεθόδου, εφαρμόζουμε την Παραγοντική Ανάλυση με τη χρήση της μεθόδου των κυρίων συνιστωσών και αναφέρουμε αναλυτικά όλα τα βήματα μέχρι να καταλήξουμε στα τελικά συμπεράσματα μας. / The purpose of this paper is to apply the Factor Analysis to our sample in order to detect and describe patterns concerning the consumption of 9 categories of alcoholic beverages by the Greek population. For the application of the method, we use the statistical program SPSS.
The first chapter presents the available methods for solving this problem and the second one presents the chosen method, namely Factor Analysis. We specify the objective of the analysis, the design and the critical assumptions of the method, as well as the criteria for the evaluation of the results.
In the third chapter we present the source of our data and how the sampling was performed. Furthermore, we identify the missing values and we apply the Missing Values Analysis to determine their type. We also present our sample using descriptive statistics and then create and describe the final matrix which we analyze with Factor Analysis.
In the fourth and last chapter we investigate the suitability of our samples for applying Factor Analysis. In the sequence, we perform the parallel study of our sample both including and not including the extreme values that we identified (which we call “outliers”). We conclude that the outliers do not affect the results of our method and then apply Factor Analysis using the extraction method of Principal Components. We also mention in detail all steps until reaching our final conclusions.
|
25 |
Structural equation modellingMohanlal, Pramod 06 1900 (has links)
Over the past two decades there has been an upsurge in interest in structural equation
modelling (SEM). Applications abound in the social sciences and econometrics, but
the use of this multivariate technique is not so common in public health research.
This dissertation discusses the methodology, the criticisms and practical problems of
SEM. We examine actual applications of SEM in public health research.
Comparisons are made between multiple regression and SEM and between factor
analysis and SEM. A complex model investigating the utilization of antenatal care
services (ANC) by migrant women in Belgium is analysed using SEM. The
dissertation concludes with a discussion of the results found and on the use of SEM
in public health research. Structural equation modelling is recommended as a tool for
public health researchers with a warning against using the technique too casually. / Mathematical Sciences / M. Sc. (Statistics)
|
26 |
Structural equation modellingMohanlal, Pramod 06 1900 (has links)
Over the past two decades there has been an upsurge in interest in structural equation
modelling (SEM). Applications abound in the social sciences and econometrics, but
the use of this multivariate technique is not so common in public health research.
This dissertation discusses the methodology, the criticisms and practical problems of
SEM. We examine actual applications of SEM in public health research.
Comparisons are made between multiple regression and SEM and between factor
analysis and SEM. A complex model investigating the utilization of antenatal care
services (ANC) by migrant women in Belgium is analysed using SEM. The
dissertation concludes with a discussion of the results found and on the use of SEM
in public health research. Structural equation modelling is recommended as a tool for
public health researchers with a warning against using the technique too casually. / Mathematical Sciences / M. Sc. (Statistics)
|
27 |
Aide à la décision médicale et télémédecine dans le suivi de l’insuffisance cardiaque / Medical decision support and telemedecine in the monitoring of heart failureDuarte, Kevin 10 December 2018 (has links)
Cette thèse s’inscrit dans le cadre du projet "Prendre votre cœur en mains" visant à développer un dispositif médical d’aide à la prescription médicamenteuse pour les insuffisants cardiaques. Dans une première partie, une étude a été menée afin de mettre en évidence la valeur pronostique d’une estimation du volume plasmatique ou de ses variations pour la prédiction des événements cardiovasculaires majeurs à court terme. Deux règles de classification ont été utilisées, la régression logistique et l’analyse discriminante linéaire, chacune précédée d’une phase de sélection pas à pas des variables. Trois indices permettant de mesurer l’amélioration de la capacité de discrimination par ajout du biomarqueur d’intérêt ont été utilisés. Dans une seconde partie, afin d’identifier les patients à risque de décéder ou d’être hospitalisé pour progression de l’insuffisance cardiaque à court terme, un score d’événement a été construit par une méthode d’ensemble, en utilisant deux règles de classification, la régression logistique et l’analyse discriminante linéaire de données mixtes, des échantillons bootstrap et en sélectionnant aléatoirement les prédicteurs. Nous définissons une mesure du risque d’événement par un odds-ratio et une mesure de l’importance des variables et des groupes de variables. Nous montrons une propriété de l’analyse discriminante linéaire de données mixtes. Cette méthode peut être mise en œuvre dans le cadre de l’apprentissage en ligne, en utilisant des algorithmes de gradient stochastique pour mettre à jour en ligne les prédicteurs. Nous traitons le problème de la régression linéaire multidimensionnelle séquentielle, en particulier dans le cas d’un flux de données, en utilisant un processus d’approximation stochastique. Pour éviter le phénomène d’explosion numérique et réduire le temps de calcul pour prendre en compte un maximum de données entrantes, nous proposons d’utiliser un processus avec des données standardisées en ligne au lieu des données brutes et d’utiliser plusieurs observations à chaque étape ou toutes les observations jusqu’à l’étape courante sans avoir à les stocker. Nous définissons trois processus et en étudions la convergence presque sûre, un avec un pas variable, un processus moyennisé avec un pas constant, un processus avec un pas constant ou variable et l’utilisation de toutes les observations jusqu’à l’étape courante. Ces processus sont comparés à des processus classiques sur 11 jeux de données. Le troisième processus à pas constant est celui qui donne généralement les meilleurs résultats / This thesis is part of the "Handle your heart" project aimed at developing a drug prescription assistance device for heart failure patients. In a first part, a study was conducted to highlight the prognostic value of an estimation of plasma volume or its variations for predicting major short-term cardiovascular events. Two classification rules were used, logistic regression and linear discriminant analysis, each preceded by a stepwise variable selection. Three indices to measure the improvement in discrimination ability by adding the biomarker of interest were used. In a second part, in order to identify patients at short-term risk of dying or being hospitalized for progression of heart failure, a short-term event risk score was constructed by an ensemble method, two classification rules, logistic regression and linear discriminant analysis of mixed data, bootstrap samples, and by randomly selecting predictors. We define an event risk measure by an odds-ratio and a measure of the importance of variables and groups of variables using standardized coefficients. We show a property of linear discriminant analysis of mixed data. This methodology for constructing a risk score can be implemented as part of online learning, using stochastic gradient algorithms to update online the predictors. We address the problem of sequential multidimensional linear regression, particularly in the case of a data stream, using a stochastic approximation process. To avoid the phenomenon of numerical explosion which can be encountered and to reduce the computing time in order to take into account a maximum of arriving data, we propose to use a process with online standardized data instead of raw data and to use of several observations per step or all observations until the current step. We define three processes and study their almost sure convergence, one with a variable step-size, an averaged process with a constant step-size, a process with a constant or variable step-size and the use of all observations until the current step without storing them. These processes are compared to classical processes on 11 datasets. The third defined process with constant step-size typically yields the best results
|
Page generated in 0.019 seconds