1 |
Σύνθεση με δεσμευμένο θέμα στην Αγγλική και τη νέα Ελληνική : θεωρητική ανάλυση και υπολογιστική επεξεργασίαΠετροπούλου, Ευανθία 05 March 2012 (has links)
Η παρούσα διατριβή ασχολείται με τη συγκριτική μελέτη λέξεων στην Αγγλική
και τη Νέα Ελληνική που περιέχουν δεσμευμένα μορφολογικά στοιχεία, δηλαδή
μορφήματα που δεν απαντώνται ανεξάρτητα στο λόγο. Στην Αγγλική οι λέξεις αυτές
είναι γνωστές με τον όρο «νεοκλασικά σύνθετα», καθώς τα δεσμευμένα στοιχεία που
περιέχουν έχουν αρχαιοελληνική ή λατινική προέλευση. Στη Νέα Ελληνική πρόκειται
για μία κατηγορία ρηματικών συνθέτων, που περιέχουν ένα δεσμευμένο θέμα
ρηματικής προέλευσης σε τελική θέση. Σημαντικό χαρακτηριστικό των εν λόγω
λέξεων είναι ότι ένα μεγάλο ποσοστό αυτών ανήκει σε ειδικά επιστημονικά και
τεχνικά λεξιλόγια. Στόχος της μελέτης είναι ο άμεσος συσχετισμός των λέξεων
αυτών στις δύο γλώσσες από μορφολογική άποψη, με απώτερο σκοπό τη βέλτιστη
υπολογιστική τους επεξεργασία.
Για τις ανάγκες της παρούσας συγκροτήθηκαν δύο σώματα δεσμευμένων
θεμάτων που εμφανίζονται σε τελική θέση μέσα σε λέξεις της Αγγλικής και της Νέας
Ελληνικής, τα οποία αποτέλεσαν τα κύρια γλωσσικά δεδομένα, τόσο για την
θεωρητική ανάλυση, όσο και για την υπολογιστική επεξεργασία των υπό εξέταση
λέξεων. Λαμβάνοντας υπόψη τις θεωρητικές απόψεις που έχουν διατυπωθεί, τα
δεδομένα που προέκυψαν από την εξέταση των σωμάτων δεσμευμένων στοιχείων,
καθώς και την παρουσία των λέξεων με δεσμευμένα στοιχεία κατά τη διάρκεια
εξέλιξης της κάθε γλώσσας, πραγματοποιείται η μορφολογική τους ανάλυση, που
έχει ως αποτέλεσμα τον άμεσο συσχετισμό τους με την αναγνώριση αντίστοιχων
δομών στις εν λόγω λέξεις.
Με βάση τα συμπεράσματα της θεωρητικής ανάλυσης επιχειρείται η δημιουργία
ενός συστήματος υπολογιστικής μορφολογικής επεξεργασίας των εν λόγω λέξεων,
που διέπεται από κοινές αρχές και κοινούς κανόνες για τις δύο γλώσσες, με στόχο
την όσο το δυνατόν αποτελεσματικότερη και οικονομικότερη περιγραφή του
φαινομένου, για χρήση σε ένα πλήθος εφαρμογών της γλωσσικής επεξεργασίας. Ο
φορμαλισμός που χρησιμοποιείται αποτελεί έναν λεξιλογικό μεταγλωττιστή (LEXC)
που είναι ιδιαίτερα κατάλληλος για τον ορισμό λεξιλογίων φυσικών γλωσσών και
βασίζεται στις μεθόδους πεπερασμένων καταστάσεων. / This PhD thesis deals with the comparative study of words containing bound morphological stems in English and Modern Greek (MG) and their computational processing. A great number of these words, also known as neoclassical compounds, belong to technical and scientific terminologies. The linguistic database used for the theoretical analysis and the computational processing proposed in this study, consists of two corpora, especially built for and appended in the current study, containing bound stems as final elements in words of English and MG. According to the theoretical analysis proposed, compounds with bound stems in the two languages share similar structures. The proposed system for the computational processing of these words, based on the the conclusions of the theoretical analysis, makes use of finite state methods, specifically the Xerox Lexical Compiler (LEXC) and offers an efficient way of implementing the phenomenon of neoclassical compounding in modern languages.
|
Page generated in 0.012 seconds