Tracing the development of spanish participation constructions : an empirical study of semantic change

The main aim of this thesis is to trace the development of four different constructions
involving auxiliaries and participles through the history of the Spanish language.
These constructions are the perfect construction expressed by haber ‘have’
+ past participle (PTCP), the verbal passive expressed by ser ‘be’ + PTCP, the adjectival
passive expressed by estar ‘be.LOC’ + PTCP and the stative possessive
expressed by tener ‘tener.POSS’ + PTCP.
Specifically, in this thesis I explore changes in the interpretations of these
periphrases, based both on a qualitative and quantitative analysis of corpus data.
I argue that these constructions have undergone a regularization change, and that
this change was mainly motivated by the competition between these participial
constructions for the same interpretations.
In order to test these ideas empirically, I have compiled a large diachronic
corpus of Spanish from the 12th to the 20th century, consisting of more than 39
million words and composed of texts from different sources. This corpus has
been automatically lemmatised and annotated with fine-grained morphosyntactic
tags. In order to do this I have adapted an existing open-source linguistic analyzer
(FreeLing) to allow for the efficient linguistic annotation of the oldest texts in the
corpus. / El principal objetivo de esta tesis es trazar el desarrollo de cuatro construcciones
de participio, formadas por auxiliares y participios en la historia del espa˜nol. Estas
construcciones son la construcci´on de perfecto, expresada por haber + participio
pasado (PTCP), la pasiva verbal expresada por ser + PTCP, la pasiva adjetival
expresada por estar + PTCP y la estativa posesiva expresada por tener + PTCP.
Concretamente, en esta tesis exploro los cambios en las interpretaciones de
estas per´ıfrasis, bas´andome en el an´alisis cualitativo y cuantitativo de datos de
corpus. Defiendo que estas construcciones han sufrido un cambio de regularizaci
´on, y que la motivaci´on principal para este cambio es la competici´on entre
estas construcciones de participio para expresar las mismas interpretaciones.
Para probar estas ideas emp´ıricamente, he compilado un corpus diacr´onico del
espa˜nol, con textos de los siglos XII al XX, que est´a formado por m´as de 39 millones
de palabras y compuesto por documentos de diferentes fuentes. Este corpus
ha sido lematizado y anotado con etiquetas morfosint´acticas. Para realizar esto,
he utilizado una herramienta ya existente de an´alisis ling¨u´ıstico (FreeLing), que
he adaptado previamente para poder anotar de manera eficiente los documentos
m´as antiguos que forman este corpus.
Date16 November 2012
CreatorsSánchez Marco, Cristina
ContributorsEvert, Stefan, Mendívil Giró, José Luis, 1965-, Universitat Pompeu Fabra. Departament de Traducció i Ciències del llenguatge
PublisherUniversitat Pompeu Fabra
Source SetsUniversitat Pompeu Fabra
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion
Format211 p., application/pdf
SourceTDX (Tesis Doctorals en Xarxa)
Rightsinfo:eu-repo/semantics/openAccess, ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

