Headedness in word formation and lexical semantics : evidence from Italiot and Cypriot

Ανδρέου, Μάριος 27 April 2015 (has links)
The thesis aims to sort out some of the confusions associated with head, focusing on headedness in Word Formation and Lexical Semantics. In particular, the purpose of my thesis is to enquire into the notion head with focus on the following three issues: (a) delimitation, (b) position, and (c) presence and absence of head in morphological configurations. In a nutshell, the main proposals with respect to headedness in morphology and lexical semantics are as follows: (a) Most of the assumed head-like notions, such as the subcategorizand, the morphosyntactic locus, and the obligatory constituent, might very well not be relevant to the head-nonhead asymmetry. (b) The head for the purposes of morphology should be identified with the category determinant and with the ontological class determinant as far as lexical semantics is concerned. (c) The enquiry into the postulation of functions and arguments reveals that non-argument taking inflection and derivation should be accounted for by the mechanism of subordination of functions without indexation of arguments. This has implications for the way we classify morphemes in lexical semantics. (d) With respect to the position of head, the phenomenon of left-headed [N N]N compounds in Italiot-Greek should not be studied independently of the same phenomenon evident in previous evolutionary stages and in other dialects. (e) In addition, morphology does not combine and manipulate asymmetric relations only (see Di Sciullo 2005), for morphemic order is amenable to change and variation may arise inside the morphological system of a language. (f) From a diachronic point of view, the order of constituents in compounds may not be autonomous from syntax since the head-nonhead linearization inside compounds cannot change without previous change in the head-nonhead order in syntactic constructions. (g) With respect to the absence of head, the analysis of the compound patterns which are considered to be exocentric reveals that exocentric compounds are bracketing paradoxes which involve compounding and derivation in this particular order. In this respect, I part company with previous analyses which identify exocentricity based on the hyponymy test and which collapse exocentricity and semantic non-compositionality. / Η παρούσα διατριβή εξετάζει την έννοια κεφαλή (head) στο επίπεδο της Μορφολογίας και της Λεξικής Σημασιολογίας με έμφαση στα εξής τρία ερωτήματα: (α) ορισμός, (β) θέση, και (γ) παρουσία και απουσία κεφαλής σε μορφολογικούς σχηματισμούς. Συνοπτικά οι βασικές προτάσεις σχετικά με την έννοια της κεφαλής είναι οι εξής: (α) Αρκετές από τις έννοιες με τις οποίες έχει ταυτιστεί η κεφαλή, όπως ο υποκατηγοριοποιητής, δεν είναι σχετικές με την ασυμμετρία κεφαλής-μη κεφαλής. (β) η κεφαλή πρέπει να ταυτιστεί με τον κατηγοριακό καθοριστή σε επίπεδο μορφολογίας και με τον οντολογικό καθοριστή σε επίπεδο λεξικής σημασιολογίας. (γ) Η εφαρμογή της έννοιας κεφαλή στο σχηματισμό σημασιολογικά πολύπλοκων σχηματισμών δείχνει ότι η κλίση, η προθηματοποίηση, και η αξιολογική μορφολογία, οι οποίες δεν φέρουν ορίσματα, πρέπει να αναλυθούν με βάση το μηχανισμό της υπόταξης λειτουργιών χωρίς την προσθήκη ενδείκτη. Η πρόταση αυτή έχει επιπτώσεις στον τρόπο με τον οποίο ταξινομούνται τα μορφήματα σε επίπεδο λεξικής σημασιολογίας. (δ) Όσον αφορά στη θέση της κεφαλής, το φαινόμενο της ύπαρξης αριστερόστροφων συνθέτων στην Κατωιταλική δεν πρέπει να μελετάται ανεξάρτητα από το ίδιο φαινόμενο το οποίο εμφανίζεται τόσο σε άλλες διαλέκτους, όσο και σε προηγούμενες εξελικτικές φάσεις. (ε) Η μορφολογία δεν χειρίζεται μόνο ασυμμετρικές σχέσεις, καθώς η σειρά των μορφημάτων υπόκειται σε αλλαγές. (στ) Από διαχρονική σκοπιά, η σειρά των συστατικών στα σύνθετα μπορεί να μην είναι απόλυτα ελεύθερη, καθώς φαίνεται να επηρεάζεται από τον τομέα της σύνταξης. (ζ) Σχετικά με την απουσία κεφαλής, η ανάλυση των εξωκεντρικών συνθέτων δείχνει ότι τέτοιοι σχηματισμοί είναι δομικά παράδοξα τα οποία συνδυάζουν σύνθεση και παραγωγή.

Το άσεμνο λεξιλόγιο της Νέας Ελληνικής : μια μελέτη των μορφολογικών, σημασιολογικών και πραγματολογικών χαρακτηριστικών του

Χριστοπούλου, Κατερίνα 02 February 2011 (has links)
Στην παρούσα μεταπτυχιακή εργασία, αρχικά, γίνεται λόγος για τα γενικά τυπικά χαρακτηριστικά που διέπουν το άσεμνο λεξιλόγιο, κυρίως της Ελληνικής. Στη συνέχεια, επιχειρείται μια μορφολογική ανάλυση των συστατικών που χρησιμοποιούνται για τον σχηματισμό των λέξεων του άσεμνου λεξιλογίου. Ωστόσο, βασικός στόχος είναι η διερεύνηση των σημασιολογικών και πραγματολογικών χαρακτηριστικών που διέπουν αυτό το ιδιαίτερα ενδιαφέρον τμήμα του λεξιλογίου μας. Παράλληλα, ασχολούμαι με περιπτώσεις υποκορισμού ή μεγέθυνσης μέσα στο άσεμνο λεξιλόγιο, με τους μηχανισμούς δανεισμού, με φαινόμενα ευφημισμού και δυσφημισμού και άλλα. Αναλυτικότερα, στο πρώτο κεφάλαιο, το οποίο λειτουργεί ως εναρκτήριο στάδιο ένταξης στο αντικείμενο μελέτης της εργασίας, παρουσιάζω τα περιθωριακά ιδιώματα της ελληνικής καθώς και τη δομή και λειτουργία των ειδικών λεξιλογίων στα οποία εντάσσεται και το προς εξέταση λεξιλόγιο. Στο τέλος του κεφαλαίου εξετάζω τις διαδικασίες και τους μηχανισμούς δανεισμού που υιοθετούνται για την εισαγωγή νέων λέξεων στην Ελληνική από άλλες γλώσσες, οι οποίες επηρέασαν και εμπλούτισαν με αυτόν τον τρόπο το άσεμνο λεξιλόγιο. Στο δεύτερο κεφάλαιο ασχολούμαι με τις διαδικασίες σχηματισμού των λημμάτων του άσεμνου λεξιλογίου. Μορφολογικές διαδικασίες σχηματισμού λέξεων όπως είναι η παραγωγή και η σύνθεση, αλλά και δομές όπως οι συμφυρμοί, λεξικοποιημένες εκφράσεις κ. ά, θα με απασχολήσουν ιδιαίτερα στο κεφάλαιο αυτό. Το τρίτο κεφάλαιο είναι αφιερωμένο στις εννοιακές σχέσεις, στις σχέσεις δηλαδή των λέξεων με άλλες λέξεις, με τις οποίες σχετίζονται. Το βασικό θεωρητικό πρότυπο πάνω στο οποίο θα βασιστώ για την ανάλυση της λεξικής σημασιολογίας είναι αυτό που προτείνεται από τον Cruse (1986, 2004). Εννοιακές σχέσεις, όπως αυτή της πολυσημίας, της συνωνυμίας, της μετωνυμίας, της μερωνυμίας και της μεταφοράς θα με απασχολήσουν ιδιαίτερα. Στη συνέχεια, στο τελευταίο κεφάλαιο με τίτλο «Άσεμνο λεξιλόγιο και Πραγματολογία» αφού αναφερθώ στα κίνητρα που ωθούν στην χρήση αυτού του λεξιλογίου, θα εξετάσω τις λειτουργίες και τη χρήση των λέξεων αυτών μέσα σε συγκεκριμένα εκφωνήματα. Το περιβάλλον μέσα στο οποίο εμφανίζονται οι λέξεις αυτές αλλά και οι διαφορετικοί πολιτισμοί και η νοοτροπία των ομιλητών, όπως θα δούμε στο κεφάλαιο αυτό παίζει πολύ σημαντικό ρόλο. Ολοκληρώνοντας, θα επικεντρωθώ σε λέξεις που χαρακτηρίζονται ως άσεμνες και μπορούν να θεωρηθούν, με βάση πραγματολογικές μελέτες (μεταξύ αυτών Fraser, 2008) ότι λειτουργούν ως δείκτες οργάνωσης λόγου και συγκεκριμένα ως δείκτες προσοχής (attention markers). / Words are extremely important to people. They constitute a means of communication. It is through them that we express our thoughts, feelings and emotions. They are an integral part of our everyday life and they are with us wherever we go. Every word, of any kind, deserves our full attention and needs to be studied, no matter what kind of vocabulary it may be part of. The present thesis is about a very vibrant and expressive part of our language. It concerns “obscene vocabulary”, a domain on which very few scientific studies have been carried out to date. In this thesis I decided to examine the morphological, semantic and pragmatic aspects of the “obscene vocabulary” of the Modern Greek language. In the first chapter, I present the “marginal” jargons of the Modern Greek language, of which “obscene vocabulary” constitutes a part, based on the existing literature so far. Moreover, I propose an appropriate classification of the Greek data, based on Jay (1997). I also look into cases of euphemisms and calumny, and the way they are used in Modern Greek. In addition, I present some cases of loans concerning not only words, but expressions and even affixes coming from other languages as well. Loans and calques seem to constitute a great part of the Greek “obscene vocabulary”, most of them coming from Italian, French and Turkish. The second chapter is about the way that words and expressions of the “obscene vocabulary” are formed. It seems that this kind of vocabulary is highly productive in compound words. What is more, some prefixes and suffixes of the “purist Greek” which are not very productive in the Modern Greek common vocabulary, combined with popular words, they are frequently used to form “obscene” words, resulting in funny word formations. It should be noted here, that the formation of such words is subject to the same constraints as the rest of the vocabulary of the Modern Greek language. Finally, I look into compound expressions, lexicalized phrases, blends and the diminutive and augmentative suffixes and prefixes which are used in order to make a word sound less offensive, more familiar and even positive. The third chapter consists of a semantic analysis of the “obscene vocabulary” of the Modern Greek language, based on Cruse (1986, 2004) and Veloudis (2005). I look into polysemous and synonymous pairs of words and also into notions such as meronymy, metonymy and metaphors, concerning mostly parts of the human body. Finally, I try to analyze the pragmatic aspects of the Greek “obscene vocabulary” This field concerns the circumstances in which this kind of vocabulary is used, human communication, the intonation and the gestures that accompany the use of “obscene vocabulary” and every possible kind of social and psychological reasons, as well as the motives that make someone use this kind of vocabulary. Different languages reflect different cultures and have a different degree and way of using “obscene vocabulary”.

Αυτόματη εξαγωγή λεξικής - σημασιολογικής γνώσης από ηλεκτρονικά σώματα κειμένων με χρήση ελαχίστων πόρων / Automatic extraction of lexico - semantic knowledge from electronic text corpora using minimal resources

Θανόπουλος, Αριστομένης 25 June 2007 (has links)
Το αντικείμενο της διατριβής είναι η μελέτη μεθόδων αυτόματης εξαγωγής των συμφράσεων και των σημασιολογικών ομοιοτήτων των λέξεων από μεγάλα σώματα κειμένων. Υιοθετείται μια προσέγγιση ελάχιστων γλωσσικών πόρων που εξασφαλίζει την απεριόριστη μεταφερσιμότητα των μεθόδων σε φυσικές γλώσσες και θεματικές περιοχές. Για την αξιολόγηση των προτεινόμενων μεθόδων προτείνονται, αξιολογούνται και εφαρμόζονται μεθοδολογίες με βάση πρότυπες βάσεις λεξικής γνώσης (στην Αγγλική), όπως το WordNet. Για την εξαγωγή των συμφράσεων προτείνονται νέα μέτρα εξαγωγής στατιστικά σημαντικών διγράμμων και γενικά ν-γράμμων που αξιολογούνται θετικά. Για την εξαγωγή των λεξικών - σημασιολογικών ομοιοτήτων των λέξεων ακολουθείται καταρχήν η προσέγγιση ομοιότητας περικειμένων λέξεων με παραθυρικές μεθόδους, όπου μελετώνται το πεδίο συμφραζομένων, το φιλτράρισμα των συνεμφανίσεων των λέξεων, τα μέτρα ομοιότητας, όπου εισάγεται ο παράγοντας του αριθμού κοινών παραμέτρων, καθώς και η αντιμετώπιση συστηματικών σφαλμάτων, ενώ προτείνεται η αξιοποίηση των λειτουργικών λέξεων. Επιπλέον, προτείνεται η αξιοποίηση της ομοιότητας περικείμενων εκφράσεων, που απαντάται συχνά σε θεματικώς εστιασμένα κείμενα, με ένα αλγόριθμο βασισμένο στην ετεροσυσχέτιση ακολουθιών λέξεων. Μελετάται η μεθοδολογία αξιοποίησης των παρατακτικών συνδέσεων ενώ προτείνεται μια μέθοδος ενοποίησης ετερογενών σωμάτων γνώσης λεξικών – σημασιολογικών ομοιοτήτων. Τέλος, η εξαχθείσα γνώση μετασχηματίζεται σε σημασιολογικές κλάσεις με μια συμβολική μέθοδο ιεραρχικής ομαδοποίησης και επίσης ενσωματώνεται επιτυχώς σε ένα διαλογικό σύστημα μηχανικής μάθησης όπου ενισχύει την απόδοση της αναγνώρισης του σκοπού του χρήστη συμβάλλοντας στην εκτίμηση του ρόλου των άγνωστων λέξεων. / The research described in this dissertation regards automatic extraction of collocations and lexico-semantic similarities from large text corpora. We follow an approach based on minimal linguistic resources in order to achieve unrestricted portability across languages and thematic domains. In order to evaluate the proposed methods we propose, evaluate and apply methodologies based on English gold standard lexical resources, such as WordNet. For the extraction of collocations we propose and test a few novel measures for the identification of statistically significant bigrams and, generally, n-grams, which exhibit strong performance. For the extraction of lexico-semantic similarities we follow a distributional window-based approach. We study the contextual scope, the filtering of lexical co-occurrences and the performance of similarity measures. We propose the incorporation of the number of common parameters into the latter, the exploitation of functional words and a method for the elimination of systematic errors. Moreover, we propose a novel approach to exploitation of word sequence similarities, common in technical texts, based on cross-correlation of word sequences. We refine an approach for word similarity extraction from coordinations and we propose a method for the amalgamation of lexico-semantic similarity databases extracted via different principles and methods. Finally, the extracted similarity knowledge is transformed in the form of soft hierarchical semantic clusters and it is successfully incorporated into a machine learning based dialogue system, reinforcing the performance of user’s plan recognition by estimating the semantic role of unknown words.

