1 |
Enhancing statistics education with Java appletsYung, Edmund Yau Kong January 2008 (has links)
Advances in global technology have opened up the possibility of new ways of teaching and learning statistics. Armed with the latest WWW technology, educators can now create an interactive learning environment for students to learn statistics by using Java applets. The purpose of this study was to investigate the effects of Java applet-based instruction in comparison with traditional instruction on college students' achievements, attitude and satisfaction in an introductory statistics course. This study was conducted at the Macau Polytechnic using a quasi-experimental, pre-test/post-test non-equivalent control group design. The experimental group involved 37 undergraduate students who received Java applet-based instruction; the control group involved 38 students who received traditional instruction. Results showed that (a) the Java applet-based instruction group had significantly better achievement than did the traditional group; (b) students reported a more positive attitude toward the subject matter after attending the applet based class; furthermore (c) a significantly higher level of satisfaction was found in the Java applet-instruction group. It was concluded that a Java applet based instruction format should be considered as a substitute to the traditional instruction format.
|
2 |
Ομαδοποιημένη οπτικοποίηση γεωγραφικών δεδομένων με χρήση web τεχνολογιώνΧαρπαντίδης, Βασίλειος 05 February 2015 (has links)
Στις μέρες μας ο κόσμος αναζητά συνεχώς νέες πληροφορίες. Η αναζήτηση αυτή πολλές φορές
εξαρτάται ή/και βασίζεται σε γεωγραφικά δεδομένα. Για αυτόν το σκοπό η αποτύπωση της
πληροφορίας στο χάρτη είναι μια κλασική μέθοδος που ακολουθείται.
Αυτή η διπλωματική ξεκίνησε από την παρατήρηση ότι ενώ από τη μία υπάρχει μεγάλος όγκος
πληροφορίας, η αποτύπωσή της στο χάρτη είναι πολύ φτωχή. Σχεδόν όλες οι εφαρμογές με εξαίρεση
τους κολοσσούς της πληροφορικής (Microsoft και Google) αναπαριστούν περιορισμένη ποσότητα
πληροφορίας. Αυτή η παρατήρηση προήλθε από λεπτομερή έρευνα των πρακτικών που ακολουθούνται
τόσο από εμπορικές εφαρμογές, όσο και από αντίστοιχες ερευνητικές δραστηριότητες. Έτσι,
χρησιμοποιώντας κάποιος αυτές τις υπηρεσίες δυσκολεύεται να κατανοήσει τη συνολική πληροφορία
της γεωγραφικής περιοχής που εξετάζει.
Σε αυτήν την εργασία προσπαθούμε να δώσουμε λύση στο παραπάνω πρόβλημα, δηλαδή στην
αποτύπωση της συνολικής πληροφορίας σε κάποια μη ορισμένη εξ αρχής γεωγραφική περιοχή. Το
σύνολο της πληροφορίας, επίσης, δεν είναι στατικό, αλλά αλλάζει σύμφωνα με διάφορα κριτήρια που
μπορεί να επιλέξει ο χρήστης.
Η εργασία θα κινηθεί σε δύο βασικούς πυλώνες. Αρχικά, θα δοθεί λύση στο απλούστερο πρόβλημα της
παρουσίασης στο χρήστη της ποσότητας της πληροφορίας στις αντίστοιχες γεωγραφικές περιοχές. Στη
συνέχεια, αφού χρησιμοποιηθεί η λύση αυτού του προβλήματος θα γίνει μια προσπάθεια να λυθεί το
πιο σύνθετο πρόβλημα της ομαδοποίησης της εμφανιζόμενης στοιχείων πληροφορίας στις γεωγραφικές
περιοχές που εξετάζονται από το χρήστη. Οι λύσεις των δύο αυτών προβλημάτων θα βασιστούν στην
ομαδοποίηση. Το πρώτο πρόβλημα θα λυθεί με τη χρήση του αλγορίθμου ομαδοποίησης σε πλέγμα και
το δεύτερο θα βασιστεί στη χρήση μερικών παραλλαγών του αλγορίθμου Minimum Description
Length (MDL). Παρόλο που φαίνεται ότι θα ακολουθηθούν κλασικοί αλγόριθμοι η διπλωματική αυτή
θα τους χρησιμοποιήσει με πρωτοφανή τρόπο (δε βρέθηκε αντίστοιχη χρήση στη βιβλιογραφία) και σε
πολλά λεπτά σημεία θα δοθούν καινοτόμες λύσεις.
Οι δύο αυτές λύσεις δε θα υλοποιηθούν απλά σε ένα εργαστηριακό σύστημα, όπου κάποιος έμπειρος
χρήστης (ο ερευνητής) θα μπορεί να πραγματοποιεί πειράματα, αλλά σε μία σύγχρονη web εφαρμογή.
Απόρροια αυτής της επιλογής είναι η εφαρμογή που θα παραχθεί από την υλοποίηση αυτής της
διπλωματικής να είναι άμεσα προσπελάσιμη από όλον τον κόσμο. Αυτό είναι ένα ακόμη προτέρημα
αυτής της εργασίας.
Συνοψίζοντας η εργασία θα ολοκληρωθεί με ένα συνοπτικό σχολιασμό των λύσεων και των
αποτελεσμάτων τους σε ένα πραγματικό σύνολο δεδομένων. Σε αυτά τα αποτελέσματα θα
παρατηρηθεί η λογική συσχέτιση των αποτελεσμάτων των ομαδοποιημένων σημείων σε σχέση με τις
γεωγραφικές περιοχές. / Nowadays information is produced everywhere. So a great amount of data exists. Spatial data analysis and visualization is a hot trend and a dynamic map like google maps is the best so far solution. The problem is that the combination of the massive amount of data and the limited size of the map instead of helping the user may confuse him/her. Now, consider a web application with a dynamic map, presenting the whole information of each place without confusing the user with the huge amount of information. This paper proposes some techniques to present the quantity and the quality of information in any place of the dynamic map. The common factor of all the proposed techniques is the grouping via some algorithms like grid clustering.
|
3 |
Statistical analysis of Likert data on attitudesJavaras, Kristin Nicole January 2004 (has links)
Researchers interested in measuring people's underlying attitudes towards an object (e.g., abortion) often collect Likert data by administering a survey. Likert data consist of surveyees' responses to statements about the object, where responses fall into ordered categories running from `Strongly agree' to `Strongly disagree' or into a `Don't Know / Can't Choose' category. Two examples of Likert data are used for illustrative purposes. The first dataset was collected by the author from American and British graduate students at Oxford University and contains items measuring underlying abortion attitudes. The second dataset was taken from British and American responses to the 1995 National Identity Survey (NIS) and contains items measuring underlying national pride and immigration attitudes. A model for Likert data and underlying attitudes is introduced. This model is more principled than existing models. It treats people's underlying attitudes as latent variables, and it specifies a relationship between underlying attitudes and responses that is consistent with attitudinal research. Further, the formal probability model for responses allows people's interpretation of the response categories to differ. The model is fitted by maximising an appropriate likelihood. Variants of the model are used to analyse Likert data in three contexts; in each, the method using our model compares favourably to existing methods. First, the model is used to visualise the structure underlying the abortion attitude data. This method of visualization produces more sensible plots than analogous multivariate data visualization methods. Second, the model is used to select the statements whose responses (in the abortion attitude data) best reflect underlying abortion attitudes. Our method of statement selection more closely adheres to attitude researchers' stated aims than popular methods based on sample correlations. Third, the model is used to investigate how underlying national pride varies with nationality in the NIS data and also how underlying abortion attitude varies with gender, religious status, and nationality in the abortion attitude data. Unlike methods currently used by social scientists to model the relationship between attitudes and covariates, our method controls for the effects of differing response category interpretation. As a result, inferences about group differences in underlying attitudes are more robust to group differences in response category interpretation.
|
4 |
Χρήση της OLAP τεχνικής στην οπτικοποίηση κανόνων Data mining / Visualization of Data mining rules using OLAPΓκίζα, Ειρήνη 27 August 2008 (has links)
Η διαδικασία εξόρυξης από δεδομένα [Data Mining] αποτελεί μια συνεχώς αναπτυσσόμενη διαδικασία ανακάλυψης γνώσης μέσω της εξαγωγής μέχρι πρότινος άγνωστης πληροφορίας από μεγάλες εμπορικές και επιστημονικές βάσεις δεδομένων. Η διαδικασία εξόρυξης από δεδομένα εξάγει κανόνες δια μέσου της επεξεργασίας κατηγορικών ή αριθμητικών δεδομένων, από βάσεις πολλών διαστάσεων (> από 4 χαρακτηριστικά). Η ταξινόμηση, η ομαδοποίηση και η συσχέτιση αποτελούν τις πιο γνωστές και πλέον χρησιμοποιούμενες τεχνικές Data Mining. Ωστόσο συνήθως και οι κανόνες που εξάγονται από τα δεδομένα μπορεί να είναι πολλοί και δυσνόητοι στον τελικό χρήστη/ αναλυτή ο οποίος ενδέχεται να μην είναι εξοικειωμένος με τις τεχνικές της Μηχανικής Μάθησης. Προκειμένου να επιλυθεί αυτό το πρόβλημα τα τελευταία έτη έχουν αναπτυχθεί διάφορες τεχνικές οπτικοποίησης (Visualization) τόσο των δεδομένων που χρησιμοποιούνται κατά τη διαδικασία Data Mining (ανεπεξέργαστα δεδομένα) όσο και των κανόνων που εξάγονται από την εφαρμογή της. Όλες οι τεχνικές οπτικοποίησης προσπαθούν να εκμεταλλευτούν την αντιληπτική ικανότητα του χρήστη στην κατανόηση των εξαγόμενων προτύπων. Επιπρόσθετα ο χρήστης τείνει να εμπιστεύεται περισσότερο ένα αποτέλεσμα όταν το κατανοεί πλήρως. Ο σκοπός των τεχνικών οπτικοποίησης συνίσταται ακριβώς σε αυτό. Στη διεθνή βιβλιογραφία έχουν παρουσιαστεί αρκετές μέθοδοι οπτικής παρουσίασης των δεδομένων ενώ τα τελευταία χρόνια η επιστημονική κοινότητα έχει εστιάσει το ενδιαφέρον της και στην οπτικοποίηση των αποτελεσμάτων του Data Mining.
Στόχος της παρούσας διπλωματικής εργασίας είναι πέρα από την παράθεση των τεχνικών οπτικής παρουσίασης των εξαγόμενων κανόνων των διαδικασιών συσχέτισης [association], ταξινόμησης [classification] και [clustering] που έχουν παρουσιαστεί από την επιστημονική κοινότητα την τελευταία εικοσαετία, η παρουσίαση μιας νέας τεχνικής οπτικοποίησης των κανόνων data mining με χρήση της τεχνολογίας On Line Analytical Processing [OLAP]. Σε πιο ειδικό πλαίσιο, η προτεινόμενη τεχνική χρησιμοποιεί το δυσδιάστατο πίνακα που χρησιμοποιούν τα περισσότερα OLAP μοντέλα και την έννοια της ιεραρχίας προκειμένου να οπτικοποιήσει ένα σημαντικό αριθμό κανόνων data mining και από τις τρεις (3) προαναφερόμενες τεχνικές. Επίσης, παρουσιάζονται τα πειραματικά αποτελέσματα της οπτικοποίησης που δείχνουν πώς η προτεινόμενη τεχνική είναι χρήσιμη στην ανάλυση και στην κατανόηση των εξαγόμενων κανόνων. / Data Mining is an emerging knowledge discovery process of extracting previously unknown, actionable information from very large scientific and commercial databases. Usually, a data mining process extracts rules by processing high dimensional categorical and/or numerical data (> 4 attributes). Classification, Clustering and Association constitute for the most well known Data Mining tasks.
However, in the data mining context often the user has to analyze hundreds of extracted rules in order to grasp valuable knowledge. Thus, the analysis of such rules by means of visual tools has evolved rapidly in recent years. Visual data mining attempts to take advantage of humans’ ability to perceive pattern and structure in visual form. The end user trusts more a result if he understand it completely. And this is the purpose of visual techniques. There have been proposed many techniques for visualizing the data in literature, whereas the last years many researchers have focused on the visualization of data mining results (knowledge visualization).
Researchers have developed many tools to visualize data mining rules. However, few of these tools can handle effectively more than some dozens of data mining rules. In this thesis, we propose a new visualization technique of data mining rules based On Line Analytical Processing [OLAP]. More specifically, the proposed technique utilizes the standard two dimensional cross-tabulation table of most OLAP models in order to visualize even a great number of data mining rules from all techniques. We also present experimental results that demonstrate how the proposed technique is useful and helpful for analyzing and understanding extracted data mining rules.
|
5 |
Δομική ανάλυση χρονικά εξελισσόμενων γραφημάτων : ιδιότητες, μοντέλα και εφαρμογές / Structural analysis of time evolving graphs : properties, models and applicationsΜαλλιαρός, Φραγκίσκος 07 October 2011 (has links)
Τα τελευταία χρόνια έχει παρατηρηθεί ιδιαίτερο ερευνητικό ενδιαφέρον στη μελέτη δικτύων (γραφημάτων) που προκύπτουν από διάφορες κοινωνικές, τεχνολογικές και επιστημονικές δραστηριότητες. Χαρακτηριστικά παραδείγματα αποτελούν το γράφημα του Διαδικτύου, το γράφημα του Παγκοσμίου Ιστού, κοινωνικά δίκτυα αναπαράστασης της αλληλεπίδρασης των ατόμων στην κοινωνία ή των χρηστών σε υπηρεσίες κοινωνικής δικτύωσης, δίκτυα μοντελοποίησης της συνεργασίας μεταξύ οντοτήτων, βιολογικά δίκτυα, κ.α.. Βασικό χαρακτηριστικό των γραφημάτων αυτών αποτελεί το μεγάλο μέγεθός τους, κάτι που πολλές φορές δυσχαιρένει την ανάλυση και μελέτη τους. Επιπλέον, τα γραφήματα αυτά στις περισσότερες περιπτώσεις δεν είναι στατικά, αλλά εξελίσσονται στο χρόνο με την προσθήκη-διαγραφή κόμβων και ακμών. Έτσι, ορισμένα από τα ερωτήματα που προκύπτουν και έχουν απασχολήσει την ερευνητική κοινότητα είναι πώς μπορούμε να αναλύσουμε τέτοιου είδους γραφήματα και να εξάγουμε ενδιαφέρουσα πληροφορία, ποια είναι η δομή των γραφημάτων αυτών, καθώς και ο τρόπος με τον οποίο δομούνται και εξελίσσονται στο χρόνο.
Ένα σημαντικό θέμα που σχετίζεται με τη δομή των γραφημάτων αυτών, αποτελεί η έννοια της ανθεκτικότητας. Γενικά, ένα γράφημα χαρακτηρίζεται ως ανθεκτικό, αν έχει τη δυνατότητα να διατηρήσει τη δομή του και τις ιδιότητες συνεκτικότητας που κατέχει, ύστερα από την απώλεια ενός μέρους των κόμβων και ακμών του. Η ιδιότητα της ανθεκτικότητας σε πραγματικά γραφήματα είναι άμεσα συνυφασμένη με την έννοια της δομής κοινοτήτων (community structure), δηλαδή της οργάνωσης των κόμβων σε ομάδες με υψηλό πλήθος συνδέσεων μεταξύ κόμβων της ίδιας ομάδας και μικρό πλήθος μεταξύ κόμβων που ανήκουν σε διαφορετικές ομάδες.
Πώς μπορούμε να κάνουμε μια γρήγορη εκτίμηση των ιδιοτήτων ανθεκτικότητας ενός γραφήματος, χωρίς να επιτελέσουμε μια διαδικασία διαγραφής κόμβων και ακμών όπου σε κάθε βήμα υπολογίζεται η συνεκτικότητα; Με άλλα λόγια, υπάρχει κάποιος δείκτης (μετρική) που μπορεί να μας ενημερώσει τόσο για την ανθεκτικότητα όσο και για τις ιδιότητες δομής κοινοτήτων ενός γραφήματος, ο οποίος θα μπορεί να υπολογιστεί αρκετά γρήγορα ακόμα και για γραφήματα με εκατομμύρια κόμβους και ακμές; Επιπλέον, εάν το γράφημα εξελίσσεται στο χρόνο, τι μπορούμε να πούμε για την ανθεκτικότητά του και κατ' επέκταση, για τις ιδιότητες δομής κοινοτήτων που διαθέτει; Υπάρχει κάποια κοινή ιδιότητα (πρότυπο) στα κοινωνικά γραφήματα που σχετίζεται με τη χρονική εξέλιξη των ιδιοτήτων αυτών;
Στα πλαίσια της παρούσας εργασίας προσπαθούμε να απαντήσουμε τα παραπάνω ερωτήματα, μελετώντας τις ιδιότητες επέκτασης κοινωνικών γραφημάτων μεγάλης κλίμακας. Αρχικά παρουσιάζουμε μια μετρική που έχει τη δυνατότητα να χαρακτηρίσει τόσο την ανθεκτικότητα όσο και τις ιδιότητες δομής κοινοτήτων ενός γραφήματος και περιγράφουμε πώς μπορούμε να την υπολογίσουμε αποδοτικά και αποτελεσματικά εκμεταλλευόμενοι ορισμένες ιδιαίτερες φασματικές ιδιότητες των πραγματικών γραφημάτων. Στη συνέχεια, εφαρμόζουμε τη μετρική αυτή σε ένα μεγάλο πλήθος στατικών κοινωνικών γραφημάτων μεγάλης κλίμακας και παρατηρούμε ορισμένες ενδιαφέρουσες ιδιότητες που σχετίζονται με την ανθεκτικότητά του και κατ΄ επέκταση με τις ιδιότητες δομής κοινοτήτων που εμφανίζουν. Μελετάμε πώς οι ιδιότητες αυτές αλλάζουν στον χρόνο, καθώς το γράφημα εξελίσσεται και παρατηρούμε ορισμένα ενδιαφέροντα πρότυπα. Τέλος, παρουσιάζουμε πώς μπορούμε να εντοπίσουμε ανωμαλίες σε γραφήματα που εξελίσσονται στο χρόνο, μελετώντας τις ιδιότητες που σχετίζονται με την ανθεκτικότητά του. / Over the last few years there has been a lot of interest in the study of complex network
structures (or graphs) arising in many diverse settings. Characteristic examples
are networks from the domain of sociology (e.g., social networks), technological and
information networks (e.g., the Internet, the Web, email exchange networks, social
interaction networks over social media applications), biological networks (e.g., protein interactions), collaboration and citation networks (e.g., coauthorship networks), and many more. A basic characteristic of these networks is their large scale (size), which in many cases hinder their study. Moreover, the graphs usually are not static, but they evolve over time with the addition/deletion of nodes and edges. A large amount of research work has been devoted on understanding the structure, the organization and the evolution of these networks, with many interesting results.
One important aspect which is related to the structure of such graphs, is the notion of robustness. Generally, a graph is characterized as robust, if it is capable to retain its structure and its connectivity properties after the loss of a portion of its nodes and edges. The property of robustness in real-world graphs is closely related to the notion of community structure, where the network is organized based on a modular architecture, presenting well-defined clusters with large inter-cluster and small intra-cluster edge density. We expect that the robustness of a network with good community structure will be poor, since it can be easily become disconnected with the removal of
the edges which connect the different clusters.
How can we do this estimation quickly without removing edges and nodes and
measuring the connectivity? In other words, is there a robustness and community
structure index (metric) which can be computed fast enough, even for graphs with
millions of nodes and edges? Moreover, if the network evolves over time, what can we
say about its robustness, and as an extension, about its community structure? Is there a common pattern in social graphs that govern the time evolution of these properties?
In this thesis, we tackle the problem of estimating the robustness properties of a
graph quickly, studying the expansion properties of several real-world
time-evolving social graphs. First, we present a metric which can be used to characterize both the robustness and the community structure properties of a graph. We present how to efficiently and effectively compute this measure, exploiting the special spectral properties
of real-world graphs. Then, we apply this method to several large static social graphs,
and we observe some interesting properties that are related to their robustness. We
study how these properties change over time, while the graph evolves, and we observe
interesting patterns. Finally, we show how to spot outliers and detect anomalies in
graphs that evolve over time, examining the change of the robustness properties of a
graph.
|
Page generated in 0.0253 seconds