Η εργασία αυτή περιλαμβάνει στην συνέχεια τέσσερα κεφάλαια τα οποία έχουν ως εξής.
Στο κεφάλαιο 2 περιγράφονται τα σύγχρονα εργαλεία ανάλυσης κειμένου αλλά και οι βάσεις δεδομένων (Corpus) που είναι διαθέσιμα. Περιγράφεται επίσης η βάση δεδομένων που χρησιμοποιούμε για να εξάγουμε πειραματικά αποτελέσματα.
Στο κεφάλαιο 3, γίνεται εισαγωγή στα n-grams και αναπτύσσονται τα βασικότερα μέτρα ομοιότητας τα οποία είναι απαραίτητα για τον διαχωρισμό του ύφους γραφής από ηλεκτρονικό κείμενο.
Στο κεφάλαιο 4 παρουσιάζονται τα πειραματικά αποτελέσματα που έχουν ληφθεί με τα n-grams. Σε αυτά περιλαμβάνονται και τα δίκτυα νευρωνίων.
Τέλος στο κεφάλαιο 5 δίνονται τα συμπεράσματα και προτάσεις για περαιτέρω έρευνα στον τομέα αυτόν. / This work includes then four chapters which are as follows.
Chapter 2 describes the modern text analysis tools and databases (Corpus) that are available. Also describes the database used to derive test results.
In Chapter 3, are inserted into n-grams and developed the basic similarity measures which are necessary to separate the writing style of electronic text.
Chapter 4 presents the experimental results obtained with n-grams. These include neural networks.
Finally in Chapter 5 are given conclusions and suggestions for further research in this area
Identifer | oai:union.ndltd.org:upatras.gr/oai:nemertes:10889/8715 |
Date | 31 March 2015 |
Creators | Αναστοπούλου, Ελένη |
Contributors | Αναστασόπουλος, Βασίλης, Anastopoulou, Eleni, Φωτόπουλος, Σπυρίδων, Οικονόμου, Γεώργιος |
Source Sets | University of Patras |
Language | gr |
Detected Language | Greek |
Type | Thesis |
Rights | 0 |
Page generated in 0.002 seconds