Return to search

Αναγνώριση γλώσσας κειμένου με βάση στατιστικά μοντέλα

Στην παρούσα διπλωματική εργασία, κατασκευάστηκε μία βάση
δεδομένων κειμένων (corpus) με κείμενα τεσσάρων θεματικών ενοτήτων
από δέκα Ευρωπαϊκές γλώσσες. Κατόπιν πάνω στη βάση αυτή έγιναν
πειράματα αναγνώρισης γλώσσας κειμένου, βασισμένα σε στατιστικά
μοντέλα και εξάχθηκαν χρήσιμα συμπεράσματα που επιβεβαιώνουν την
υπάρχουσα θεωρία για την ικανότητα αναγνώρισης γλώσσας ενός
κειμένου χρησιμοποιώντας τη μέθοδο των Ν-γραμμάτων. / In this thesis, we constructed a multilingual and multidomain corpus.We then used the corpus to extract statistical information on language recognition rates using the N-gramms method.

Identiferoai:union.ndltd.org:upatras.gr/oai:nemertes:10889/5951
Date16 April 2013
CreatorsΤσέλιος, Βασίλειος
ContributorsΦακωτάκης, Νικόλαος, Tselios, Vasileios, Φακωτάκης, Νικόλαος, Σγάρμπας, Κυριάκος
Source SetsUniversity of Patras
Languagegr
Detected LanguageGreek
TypeThesis
Rights12

Page generated in 0.001 seconds