Spelling suggestions: "subject:"phrase"" "subject:"thrase""
301 |
Selected topics in the grammar of Français Tirailleur : A corpus studyNorden, Anton Harry January 2017 (has links)
This corpus-based study describes some grammatical and lexical features of Français Tirailleur (FT), a pidgin spoken in the French colonial army from the mid-1800’s to the 1950’s. By examining the largest corpus available of the language, this study aims to (1) discern hitherto undescribed or strengthen previous claims about grammatical and lexical features of FT, (2) compare these features with its lexifier language and (3) identify changes over time. The corpus has been manually part-of-speech tagged and all noun phrases have been marked up. The results include a description of the form and function of the FT noun phrase, covering (pro)nouns and their modifiers as well as noun phrases with an embedded prepositional phrase. Furthermore, the apparent diachronic development of the expression même chose is analyzed, along with examples of circumlocution. FT is shown to differ from French in several respects, e.g. in substituting the demonstrative determiners ce(t)/cette with ça, but no signs of substrate influence are found. Contrary to intution about the simplex nature of pidgins, FT appears to follow French in placing certain adjectives before the noun, while postposing others. There remain several interesting aspects to explore in the grammar of FT, among them the elusive, multi-functional items ya and yena. Our further understanding of pidgins would benefit from more data and cross-linguistic comparison. / Denna korpus-baserade studie beskriver några lexikala och grammatiska drag hos Français Tirailleur (FT), ett pidginspråk som talades i franska kolonialarmen från mitten på 1800- till 1950-talet. Genom att undersöka den största tillgängliga korpusen över språket söker denna studie (1) urskilja hittills obeskrivna drag eller styrka existerande hypoteser om språkets natur, (2) jämföra språket med dess lexifierare samt (3) identifiera eventuell diakron variation. Korpusen har ordklasstaggats manuellt och alla nominalfraser har märkts upp. Resultaten innefattar en beskrivning av nominalfrasens form och funktion, en analys av uttrycket même chose och dess historiska utveckling samt ett antal exempel på cirkumlokution. FT skiljer sig från franska i flera avseenden, men inga tecken på substratinfluenser hittades. Trots att pidginspråk brukar kännetecknas av avsevärd förenkling, tycks FT ha bevarat franskans relativt komplexa system med både för- och efterställda adjektiv. Det råder brist på data och tvärlingvistiska jämförelser mellan pidginspråk, men det återstår ännu flertalet intressanta frågor att undersöka i FT-korpusen.
|
302 |
Dos sintagmas nominais aos descritores documentais: estudo de caso na indexação de teses e dissertações da área de DireitoNASCIMENTO, Gustavo Diniz 20 November 2015 (has links)
Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-05-19T18:03:16Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação. Dos Sintagmas Nominais aos Descritores Documentais Estudo de Caso na Indexação de Te.pdf: 3525255 bytes, checksum: 7cb6e4bda3f02eb17e2009285414748d (MD5) / Made available in DSpace on 2016-05-19T18:03:16Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação. Dos Sintagmas Nominais aos Descritores Documentais Estudo de Caso na Indexação de Te.pdf: 3525255 bytes, checksum: 7cb6e4bda3f02eb17e2009285414748d (MD5)
Previous issue date: 2015-11-20 / O uso dos Sintagmas Nominais como instrumentos de organização e recuperação da informação digital vem se mostrando uma alternativa promissora para sistemas de informação. Nesse contexto, a indexação automática por meio de Sintagmas Nominais se mostra como uma alternativa que minimiza alguns problemas encontrados na indexação baseada em palavras isoladas, uma vez que os Sintagmas Nominais se constituem em unidades sintáticas que possuem semântica/sentido específico. No entanto, é notório que nem todos os Sintagmas Nominais que se encontram em um documento digital são representativos do mesmo, o que demonstra por sua vez a necessidade de uma seleção dos Sintagmas Nominais que realmente possam funcionar como descritores documentais. Nesse contexto, o presente trabalho tem como objetivo geral investigar a seleção de sintagmas nominais com valor de descritor no contexto do processo de indexação automática por meio de sintagmas nominais de resumos de teses e dissertações em português da área jurídica. Pretende-se: 1. Investigar o processo de indexação automática por meio de sintagmas nominais; 2. Verificar quais são as características de um Sintagma Nominal como valor de descritor documental; 3. Identificar na literatura científica nacional metodologias para seleção de sintagmas nominais em textos em português, bem como os critérios de seleção de cada metodologia; 4. Planejar experimento, onde os Sintagmas Nominais extraídos são categorizados quanto ao atendimento ou não a critérios de seleção propostos na literatura e quanto ao valor como Descritores, quando semelhantes aos descritores documentais resultantes da indexação manual; 5. Avaliar os critérios de seleção na indexação automática por meio de Sintagmas Nominais para teses e dissertações da área jurídica. Para o alcance dos objetivos propostos, fez-se uso de uma pesquisa bibliográfica e de um experimento. A pesquisa bibliográfica permitiu a identificação de pesquisas voltadas para a indexação automática por meio de Sintagmas Nominais, principalmente no que se refere à seleção de Sintagmas que funcionem como descritores documentais. Com base nas leituras dessas pesquisas, puderam-se identificar vários critérios utilizados para a seleção de Sintagmas. O experimento constituiu-se na aplicação dos critérios identificados na literatura aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações da área jurídica, com o intuito de mensurar a utilidade ou não desses critérios no que diz respeito à seleção de sintagmas nominais descritores. Assim, realizou-se a indexação manual dos documentos, a extração automática dos Sintagmas Nominais constituintes dos mesmos, a categorização dos sintagmas nominais como descritores com base na semelhança aos descritores documentais advindos da indexação manual e a aplicação dos critérios de seleção aos sintagmas nominais extraídos. Por meio do experimento, foram percebidos comportamentos distintos entre cada critério, onde a maioria foi considerada útil para a seleção de sintagmas nominais. / The use of noun phrases as tools for information organization and retrieval has proven to be a promising alternative in information systems. In this context, automatic indexing through the noun phrases shows a new alternative that minimizes some problems encountered in indexing based on single words, given that noun phrases are syntactic units with specific semantic/meaning. However, it is evident that not all the noun phrases in a digital document are representative of the content, which in turn demonstrates the need for a selection of noun phrases that may serve as documentary descriptors. In this context, this work aims to investigate the selection of noun phrases with descriptor value in the context of the automatic indexing process by noun phrases from abstracts of theses and dissertations in the area of law in Portuguese. The specific objectives are: 1. Investigate the automatic indexing process by noun phrases; 2. Identify what are the characteristics of a noun phrase with descriptor value; 3. Identify the methodologies in national scientific literature for selection of noun phrases in texts in Portuguese, as well as the selection criteria of each methodology; 4. Organization of an experiment where each extracted noun phrase is categorized as descriptor and if it meets or not the proposed selection criteria in the literature; 5. Evaluate the selection criteria in the automatic indexing by noun phrases for theses and dissertations in the legal field. To achieve the objectives, it was made use of a bibliographic research and experiment. The literature review allowed the identification of research on automatic indexing by noun phrases, especially criteria used to choose noun phrases that act as documentary descriptors. Based on the readings of this research, it was possible to identify several criteria used for the selection of noun phrases. The experiment consisted in applying the criteria identified in the literature to noun phrases extracted from a set of abstracts of theses and dissertations in the legal field, in order to measure the usefulness or not of these criteria for the selection of noun phrases descriptors. Thus it was made manual indexing of documents, automatic extraction of noun phrases thereof, the categorization of noun phrases as descriptors based on their resemblance to the descriptors of manual indexing and the application of criteria in the extracted noun phrases. Through the experiment, we notice a different behavior for each criterion, where most of the criteria was considered useful for noun phrase selection.
|
303 |
Duas abordagens para a formação de sintagmas fonológicos em Rikbaktsa / Two approaches to phonological phrasing in RikbaktsaPioli, Alexandre Tunis 16 August 2018 (has links)
Orientador: Maria Filomena Spatti Sândalo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-16T18:43:58Z (GMT). No. of bitstreams: 1
Pioli_AlexandreTunis_M.pdf: 14647464 bytes, checksum: d11052859655c3adc334ae80c8920985 (MD5)
Previous issue date: 2010 / Resumo: Esta dissertação tem como objetivos (i) contribuir para o maior conhecimento de aspectos da fonologia da língua Rikbaktsa e (ii) oferecer duas análises para a formação de sintagmas fonológicos nesta língua. O primeiro objetivo é atingido através de uma análise inicial da fonologia entoacional do Rikbaktsa, em que sentenças de diferentes configurações (variando em termos de posições de constituintes) são analisadas conforme o modelo da fonologia entoacional autossegmental-métrica (Pierrehumbert & Beckman 1988, entre outros). Desta análise partem as observações de nível segmental e suprassegmental que contribuem ao alcance do segundo objetivo. As evidências entoacionais sugerem que níveis prosódicos como palavra fonológica, sintagma fonológico e sintagma entoacional são razoavelmente delimitados entoacionalmente, embora seus limites não emerjam de imediato se modelos tradicionais como Nespor & Vogel (1986) e Selkirk (1995) são levados em consideração. Este trabalho oferece, então, percursos de análise no quadro teórico da Teoria da Otimalidade e de uma faceta da fonologia baseada em regras, partindo do pressuposto de que o processo analítico de um e outro modelo podem trazer insights interessantes sobre os fenômenos abordados. Tal discussão foi amplamente estimulada pela literatura recente, notadamente por Nevins & Vaux (2008). A discussão, que inevitavelmente passa por uma comparação entre os pontos-de-vista derivacional e representacional para o fenômeno em análise, encontra seu termo no argumento de que o modelo de Frampton (2008), em que aspectos de ambos se influenciam, oferece uma visão satisfatória para a formação de sintagmas fonológicos na língua, tanto com respeito a um critério conceptual, quanto empírico. / Abstract: This work aims to (i) contribute to the better knowledge of some aspects of the Rikbaktsa phonology and to (ii) offer two approaches to the phonological phrasing in this language. The first goal is fulfilled through an initial analysis of the intonational phonology of Rikbaktsa. Different syntactic configurations (varying in complexity and word order) are analyzed using the autosegmental-metric approach to intonational phonology (Pierrehumbert & Beckman 1988, inter alia). This intonational analysis results in segmental and suprasegmental observations that support the analyses of the following chapters (the second goal of this work). Intonational evidence suggest that prosodic domains such as the phonological word, the phonological phrase and the intonational phrase are delimited by intonation markers. These domains won't emerge automatically if traditional models such as Nespor & Vogel (1986) and Selkirk (1995) are used. This work offers two approaches to the phonological phrasing in this language - in both Optimality Theory and Derivational Phonology-based frameworks -, assuming that good insights can emerge in the analytic process. The discussion, mainly triggered by recent works in the phonological literature such as Nevins & Vaux (2008), also presents an informal comparison between the derivational and representational analyses. This results in the choice of the deffect-driven model by Frampton (2008) as an eligible approach to the phonological phrasing in Rikbaktsa, in which both conceptual and empirical criteria are satisfied in a good measure. / Mestrado / Linguistica / Mestre em Linguística
|
304 |
Estudo da variação do determinante em sintagmas nominais possessivos na historia do Portugues / Study of determiner variation in possessive nominal phrases on Portuguese historyFloripi, Simone Azevedo 26 February 2008 (has links)
Orientador: Charlotte Marie Chambelland Galves / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-10T22:01:12Z (GMT). No. of bitstreams: 1
Floripi_SimoneAzevedo_D.pdf: 1875269 bytes, checksum: b059fb7e8167a29ea9a32a008e7fa4fd (MD5)
Previous issue date: 2008 / Resumo: Esta tese tem por objetivo descrever e analisar, dentro de uma perspectiva diacrônica, a variação do uso do determinante em estruturas com sintagmas nominais (DP) possessivos em 23 textos de autores portugueses nascidos desde o século 16 ao século 19. No período investigado, o emprego do artigo mostrava-se variável, passando, no decorrer dos séculos, para uma obrigatoriedade que se manifesta nos dias de hoje nesse contexto. Esta pesquisa, buscará determinar os contextos afetados pela mudança e delinear uma análise para os fenômenos envolvidos. Como arcabouço teórico utilizaremos uma abordagem minimalista (Chomsky (1995), Kayne (1994) e Schoorlemmer (1998)), tendo como pressupostos teóricos o Modelo de Princípios e Parâmetros. Sobre as características do Português Europeu moderno, período final da mudança investigada, utilizaremos as investigações de Castro (2001, 2006), Castro e Costa (2002), Miguel (2002, 2004) e Brito (2001, 2007) sobre o sintagma possessivo. Os textos utilizados como base de investigação para esta pesquisa diacrônica foram selecionados do Corpus Anotado do Português Histórico Tycho Brahe que se encontram disponíveis na internet no site: www.ime.usp.br/~tycho/corpus. Para o levantamento de dados serão utilizados os textos disponíveis do Corpus Tycho Brahe, pois, assim, poderemos tratar quantitativamente de objetos mais complexos, tanto do ponto de vista do fenômeno envolvido quanto do período considerado; e, com base nesse tratamento quantitativo, faremos uma análise qualitativa sustentável / Abstract: The aim of this thesis is to describe and investigate, within a diachronic perspective, the use of the determiner in possessive noun phrases in 23 Portuguese authors born between the 16th and the 19th century. During the period considered, the use of the article was variable, becoming obligatory at some point, as it can be observed nowadays in European Portuguese. This research will try to verify the contexts affected by the change and to propose an analysis for the observed facts. We adopt a minimalist approach based on Chomsky (1995), Kayne (1994) and Schoorlemmer (1998) within the Principles and Parameters Model. In order to explore the modern European Portuguese characteristics, corresponding to the last stage of the change investigated, we use the analyses by Castro (2001, 2006), Castro e Costa (2002), Miguel (2002, 2004) and Brito (2001, 2007). For our description and analysis, we use literary texts drawn from the Corpus Anotado do Português Histórico Tycho Brahe, which are freely available at www.ime.usp.br/~tycho/corpus / Doutorado / Linguistica / Doutor em Linguística
|
305 |
O papel da prosódia no processamento sintático de sentenças garden-pathAraújo, Vanessa Cristina de 01 March 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-05-13T12:17:42Z
No. of bitstreams: 1
vanessacristinadearaujo.pdf: 1306440 bytes, checksum: de01a0603451122bff6ee752d2078172 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-06-27T20:09:58Z (GMT) No. of bitstreams: 1
vanessacristinadearaujo.pdf: 1306440 bytes, checksum: de01a0603451122bff6ee752d2078172 (MD5) / Made available in DSpace on 2016-06-27T20:09:58Z (GMT). No. of bitstreams: 1
vanessacristinadearaujo.pdf: 1306440 bytes, checksum: de01a0603451122bff6ee752d2078172 (MD5)
Previous issue date: 2013-03-01 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este estudo tem como objetivo investigar a influência da prosódia no processamento sintático de sentenças que possuem ambiguidades estruturais temporárias, conhecidas na literatura psicolinguística como sentenças Garden-Path. Assim, toma-se como hipótese de trabalho que os ouvintes nativos do Português Brasileiro (doravante PB) utilizam as pistas prosódicas como facilitadoras no processamento sintático das sentenças em estudo. Quanto à abordagem teórica utilizada, assume-se o modelo proposto por Corrêa (2006; 2009) que integra teoria linguística, mais especificamente o Programa Minimalista (CHOMSKY, 1995; 1999) com modelos de processamento linguístico como o Bootstrapping Fonológico (MORGAN & DEMUTH, 1996; CHRISTOPHE et al., 1997). Considera-se ainda a Fonologia Prosódica (NESPOR &VOGEL, 1986) que fundamenta a concepção de interface entre os níveis prosódico e sintático. A fim de encontrar evidências a favor da hipótese assumida neste trabalho, foi desenvolvida uma atividade experimental, tendo como base o estudo de Gayle Dede (2010) em língua inglesa. Ouvintes nativos do PB foram expostos a pares de sentenças lexicalmente idênticas, porém com contornos prosódicos distintos. Nas frases (a) utilizaram-se verbos com dupla transitividade como acordava em “Enquanto a mãe acordava os filhos faziam seu café”, seguidos de expressões que podem ser interpretadas como complementos destes (os filhos no exemplo). Já nas frases (b), utilizaram-se verbos intransitivos como caminhava em “Enquanto a mãe caminhava os filhos faziam seu café”, nas quais as expressões que os seguem não podem ser interpretadas como complementos. Os contornos prosódicos, tanto em (a) quanto em (b), levavam a interpretação da expressão temporariamente ambígua, ora como sujeito do verbo da oração principal (condição (P1)), ora como complemento do verbo da oração subordinada (condição (P2)). Os resultados encontrados vão ao encontro da hipótese inicial de que as pistas prosódicas exercem influência no processamento sintático de sentenças Garden Path. / This study investigates the influence of intonational phrase boundaries on the restriction of the syntactic processing of sentences which have temporary structural ambiguities, known in psycholinguistic literature as Garden Path sentences. The working hypothesis is that native listeners of Brazilian Portuguese (BP) uses prosodic cues, more specifically, phonological phrase boundary cues to facilitate the syntactic processing of these sentences. As for the theoretical approach, we assume the model proposed by Corrêa (2006, 2009) that integrates linguistic theory, specifically the Minimalist Program (CHOMSKY, 1995, 1999) with models of language processing as the Phonological Bootstrapping (MORGAN & DEMUTH, 1996; CHRISTOPHE et al., 1997). We also adopt the conception of interface between the prosodic and syntactic levels proposed by the Prosodic Phonology (Nespor & Vogel, 1986). In order to investigate the role of prosodic cues in the syntactic ambiguity resolution, we developed an experimental activity, based on Gayle Dede experiments (2010). BP native listeners were exposed to pairs of lexically identical sentences but with different prosodic contours. In the sentences (a) intransitive subordinate verbs were followed by plausible direct objects as in While the mother woke up the children prepared the breakfast. In the sentences (b) intransitive subordinate verbs were paired with implausible direct objects as in While the mother walked the children prepared the breakfast. Both sentences were unregistered in two prosodic conditions in which the critical segment (the children) were produced as an direct object of the first verb (P2 condition) or as the subject of the second verb object (P1 condition).The results support our hypothesis that prosodic cues facilitate Garden Path sentence syntactic processing by BP native speakers.
|
306 |
A construcionalização lexical snloc atributiva e sua instanciação no portuguêsAguiar, Milena Torres de 30 March 2017 (has links)
Submitted by Josimara Dias Brumatti (bcgdigital@ndc.uff.br) on 2017-03-30T17:44:07Z
No. of bitstreams: 1
Tese Milena Torres de Aguiar.pdf: 1266758 bytes, checksum: daad4f316304632c6467ebeadbf5f5c7 (MD5) / Approved for entry into archive by Josimara Dias Brumatti (bcgdigital@ndc.uff.br) on 2017-03-30T18:01:57Z (GMT) No. of bitstreams: 1
Tese Milena Torres de Aguiar.pdf: 1266758 bytes, checksum: daad4f316304632c6467ebeadbf5f5c7 (MD5) / Made available in DSpace on 2017-03-30T18:01:57Z (GMT). No. of bitstreams: 1
Tese Milena Torres de Aguiar.pdf: 1266758 bytes, checksum: daad4f316304632c6467ebeadbf5f5c7 (MD5) / Baseados na Linguística Funcional Centrada no Uso, estudamos a construção SNLoc
atributiva em uso no português contemporâneo, que resulta da forte integração de suas
subpartes – SN e pronome adverbial locativo. Numa perspectiva pancrônica, tomamos como
base o Corpus do Português, para a análise das sincronias do século XIV ao XIX, e o Corpus
Discurso & Gramática, para investigarmos os usos do século XX. Através desses corpora,
realizamos um estudo prioritariamente qualitativo, mas também quantitativo, dos usos de
SNLoc, e com esse levantamento, comprovamos a hipótese de que SNLoc atributiva é um
membro marginal da classe dos nomes do português, resultante de construcionalização
lexical. A mudança linguística de que resulta tal esquema se inicia em contextos atípicos, nos
usos dêiticos mais referenciais, como os dêiticos físicos (“quando eu tinha três anos... eu caí...
aí tá até a cicatriz aqui...”) e os dêiticos catafóricos (“eu pretendo fazer um outro curso aí na
universidade”). Através de usos como os dêiticos anafóricos (“tem uma passagem assim
maneira da cozinha pra sala... com um balcãozinho... que a gente vai fazer um bar ali”) e os
dêiticos virtuais (“deixa o açúcar ficar moreno... aí bota o óleo... aí vai... bota a galinha... aí
deixa a galinha lá...”), que configuram contextos críticos, sequências linguísticas em que
surgem ambiguidades de sentido e forma, chega-se à construção SNLoc atributiva, em um
contexto de isolamento. São casos como: “daí começaram a correr ... a correr ... a correr e o
homem atrás dele ... daí depois ... ele pegou uma moça lá toda doida ...” Nessa construção há
a cliticização do locativo, que se entrincheira ao SN, formando um novo esquema
construcional da língua, no nível do léxico. Assim, o locativo unido ao SN assume um sentido
de imprecisão e indefinição, distinto de seu sentido original, e juntos constituem a construção
híbrida SNLoc atributiva, um novo par forma e sentido, um esquema de tipo endocêntrico,
complexo, produtivo e parcialmente composicional, resultado de construcionalização lexical.
A macroconstrução SNLoc atributiva, que tem uso recorrente no português contemporâneo,
através de construtos de microconstruções, motivados por contextos semântico-pragmáticos
específicos, tem produtividade maior na modalidade falada, em registros mais informais e em
sequências de fundo narrativo. / Based on Usage-Based Linguistics, we study the SNLoc attributive construction in use
in contemporary Portuguese, resulting from the strong integration of its subparts - SN and
locative adverbial pronoun. In a panchronic perspective, it is taken as basis the Corpus of
Portuguese, for the analysis of synchronicities of the fourteenth century to the nineteenth, and
the Corpus Discurso & Gramática, to investigate the uses of the twentieth century. Through
these corpora, we carried out a primarily qualitative, but also quantitative study of SNLoc
uses, and with this survey, we confirmed the hypothesis that SNLoc attributive is a marginal
member of the class of Portuguese names, resulting from lexical constructionalization. The
linguistic change that results such scheme starts in untypical contexts, in deictic uses more
references, such as physical deictic (“when I was three years old ... I fell ... so there is even
the scar here...”) and cataphoric deictic (“I plan to do another course there at the
university”). Through uses as anaphoric deictic (“there is a nice passageway from the kitchen
to the living room ... with a small balcony ... that we will make a bar there”) and virtual
deictic (“let the sugar turns brown ... then put the oil ... so on ... put the chicken ... then let the
chicken there...”), which constitute critical contexts, linguistic sequences that arise
ambiguities of meaning and form, it reaches to the SNLoc attributive construction, in an
isolating context. There are cases like: “then started running ... running ... running and the
man behind him ... then ... then he took a girl there totally crazy ... " In this contruction there
is the cliticization of the locative, which entrenches to the SN, forming a new constructional
scheme in the language, in the lexical level. Thus, the locative joint to the SN assumes a
meaning of vagueness and uncertainty, distinct from its original meaning, and together
constitute the hybrid SNLoc attributive construction, a new pair form and meaning, a
endocentric type scheme, a complex, productive and partially compositional scheme, the
result of lexical constructionalization. The SNLoc attributive macroconstruction, having
recurrent use in contemporary Portuguese through constructs of microconstructions,
motivated by semantic-pragmatic specific contexts, has increased productivity in spoken
form, in more informal records and background narrative sequences.
|
307 |
Machine Translation Of Fictional And Non-fictional Texts : An examination of Google Translate's accuracy on translation of fictional versus non-fictional texts.Salimi, Jonni January 2014 (has links)
This study focuses on and tries to identify areas where machine translation can be useful by examining translated fictional and non-fictional texts, and the extent to which these different text types are better or worse suited for machine translation. It additionally evaluates the performance of the free online translation tool Google Translate (GT). The BLEU automatic evaluation metric for machine translation was used for this study, giving a score of 27.75 BLEU value for fictional texts and 32.16 for the non-fictional texts. The non-fictional texts are samples of law documents, (commercial) company reports, social science texts (religion, welfare, astronomy) and medicine. These texts were selected because of their degree of difficulty. The non-fictional sentences are longer than those of the fictional texts and in this regard MT systems have struggled. In spite of having longer sentences, the non-fictional texts got a higher BLUE score than the fictional ones. It is speculated that one reason for the higher score of non-fictional texts might be that more specific terminology is used in these texts, leaving less room for subjective interpretation than for the fictional texts. There are other levels of meaning at work in the fictional texts that the human translator needs to capture.
|
308 |
Swedish-English Verb Frame Divergences in a Bilingual Head-driven Phrase Structure Grammar for Machine Translation / Skillnader i verbramar mellan svenska och engelska i en tvåspråkig HPSG-grammatik för maskinöversättningStymne, Sara January 2006 (has links)
In this thesis I have investigated verb frame divergences in a bilingual Head-driven Phrase Structure Grammar for machine translation. The purpose was threefold: (1) to describe and classify verb frame divergences (VFDs) between Swedish and English, (2) to practically implement a bilingual grammar that covered many of the identified VFDs and (3) to find out what cases of VFDs could be solved and implemented using a common semantic representation, or interlingua, for Swedish and English. The implemented grammar, BiTSE, is a Head-driven Phrase Structure Grammar based on the LinGO Grammar Matrix, a language independent grammar base. BiTSE is a bilingual grammar containing both Swedish and English. The semantic representation used is Minimal Recursion Semantics (MRS). It is language independent, so generating from it gives all equivalent sentences in both Swedish and English. Both the core of the languages and a subset of the identified VFDs are successfully implemented in BiTSE. For other VFDs tentative solutions are discussed. MRS have previously been proposed as suitable for semantic transfer machine translation. I have shown that VFDs can naturally be handled by an interlingual design in many cases, minimizing the need of transfer. The main contributions of this thesis are: an inventory of English and Swedish verb frames and verb frame divergences; the bilingual grammar BiTSE and showing that it is possible in many cases to use MRS as an interlingua in machine translation.
|
309 |
Adjektiva v postnominální pozici bez doplnění / Uncomplemented postnominal adjectivesMervová, Lenka January 2016 (has links)
The thesis provides a quantitative survey and a detailed description of noun postmodification by single uncomplemented adjectives, i.e. cases where a modifying adjective phrase represented only by an adjective follows a head noun. The theoretical background of this thesis is based mainly on Randolph Quirk et al.'s A Comprehensive Grammar of the English Language (1985). The data for empirical corpus based research have been drawn from the British National Corpus by the means of a corpus query extracting the sequence noun+adjective+verb. This query returned 6,413 concordance lines out of which, after manual assessment, the resultant sample of 4,627 examples was compiled. The data obtained were further examined and categorized, revealing that up to eleven categories are needed to account for the syntactic, semantic, pragmatic factors, and other communicative implications and lexicalized conventions that motivate the use the postnominal position.
|
310 |
Přeložkové fráze místa a času a jejich pozice ve větě. Kontrastivní analýza mezi francouzštinou a nizozemštinou. / Spatial and Temporal PPs and their Positioning in the Sentence. Contrastive analysis between Dutch and French.Bastin, Thomas January 2015 (has links)
in English This thesis focuses on the spatial and temporal prepositional phrases (PP) and their positioning in French and Dutch. Both languages have different sentence structures, and it was therefore presumed that the positions of the PPs would vary in both languages. The purpose of this thesis was to do an analysis in this field, to describe the possible positions of spatial and temporal PPs and to compare them. The research was done within the functionalist theory of André Martinet. This theory is based on the fact that the main objective of language is communication and that people use various strategies to interpret messages on different levels. It also must be taken into account that various principles influence word order. Sentence structure, strategies and principles are factors that create a complex word order system must be considered when forming each sentence. On this basis, the purpose of this thesis is to describe these factors and demonstrate their usage through analysis of concrete, practical examples.
|
Page generated in 0.0768 seconds