• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 41
  • Tagged with
  • 45
  • 23
  • 20
  • 13
  • 12
  • 11
  • 11
  • 10
  • 10
  • 9
  • 9
  • 8
  • 7
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Tipos de tópicos em português brasileiro: um olhar prosódico-sintático / Topics in Brazilian Portuguese: a study on phonology and prosodic structure

Braga, João Vinicius de Almeida 16 July 2015 (has links)
O presente trabalho levanta a questão da derivação sintática em diferentes contruções de tópico. Essa diferenciação foi estabelecida por Frascarreli & Hinterhölzl (2007) com base na abordagem de Rizzi (1997) que propõe uma estrutura mais articulada para o complexo CP. Assim Frascarelli & Hinterhölzl (2007) realizam um levantamento de corpora determinando três tipos de tópico em sentenças do italiano e do alemão, a saber: a) Tópico conversacional (aboutness topic): informação que é o tema da sentença (REINHART, 1981); b) Tópico contrastivo: constituinte que cria um par opositivo a outro tópico (CHAFE, 1987) c) Tópico familiar: constituinte acessível, geralmente realizado em uma forma pronominal (PESETSKY, 1987). Para dar uma ideia do problema considere os exemplos, abaixo: 1) O JOÃO (*ele) leu o livro de sintaxe (não o Pedro). Foco contrastivo 2) O livro de sintaxe, o João leu ø/ele ontem. Tópico 3) O João, ele leu o livro de sintaxe. Tópico 4) O João, ø leu o livro de sintaxe ontem. Tópico Os autores avaliam o contorno entoacional de cada uma das construções (2 e 3) e a sentença (4) que coloca uma ambiguidade estrutural entre moviemnto e geração na base. Os autores, então, propõem que todas sejam geradas na base deixando a estrutura de cujo sintagma é inequivocamente movido para a expressão de foco, sentença (1). Com base nesse trabalho realizamos um estudo comparativo entre as estruturas de tópico em PB. Contrapomos a entoação de sentenças como as decritas acima e avaliamos se existe um melhor tratamento sintático para tais estruturas, seja derivação via movimento, ou geração na base. No primeiro capítulo apresentamos o problema e a arquitetura da fonética articulatória, autossegmental e métrica e prosódica que embasam o estudo. Em seguida apresentamos alguns estudos já realizados nessa matéria que contam com a descrição prosódica de sentenças neutras do PB e sentenças com foco prosódico sobre o sujeito, além de sentenças com tópicos já levantadas em pesquisas anteriores. No segundo capítulo apresentaremos a teoria sintática que ampara nosso entendimento das estruturas envolvidas e o tipo de derivação em jogo. A teoria gerativa formulada por Chomsky servirá como guia balizador da derivação, especialmente a partir do programa minimalista (COMSKY 1995 e posteriores) Após essa introdução aprsentaremos algns estudos sobre esse conjunto de sentenças os possíveis caminhos a serem seguidos. No terceiro capítulo descrevemos o experimento, no quarto apresentamos e discutimos os resultados. Por fim, o quinto e último capítulo oferece um panorama geral do que foi exposto e as conclusões. / This study is about different topic constructions and their darivations. This differentiation was established by Frascarreli & Hinterhölzl (2007) based on the approach developed by Rizzi (1997), which proposes a more articulated CP structure. So Frascarelli & Hinterhölzl (2007) conducted corpora syrvey and unveal three types of topics in the Italian and German: a) shifting topic (aboutness topic): information that is the subject of the sentence, relativaly (Reinhart, 1981); b) contrastive topic: a phrase that creates a opposition to another pharse (Chafe, 1987) c) familiar topic: a given or accessable constituint (PESETSKY, 1987). To give an ideato this problem, please, consider the examples, below: 1) JOHN (* he) reads the syntax book (not Peter). Contrastive focus 2) The syntax book, John read ø / it yesterday. Topic 3) John, he read the syntax book. Topic 4) John ø syntax read the book yesterday. Topic These sentences ar all fine in BP. Sentence (1) can not have the strong pronoun. Sentence (2) is accetable in both forms either with a strong pronoun or wth the empity category. Sentence (3) is accetable because John is based generated at spell out. Sentence (4) is ambiguous bettween movment or base generation. The authors evaluate the intonation of each one of the structures like (2, 3 and 4) and propose that: they are all based generated leaving the derivation via movment to express focus, sentence (1). Based on this work, we carried out a comparative study of the topic structures in BP. Analizing sentences like (2-4) we stabilishs the intonational contour of them and look for a better treatment for such syntactic structures: derivation via movement, or base generation. In the very first chapter we present the problem and the architecture of the phonetic articulation, the autossegmental and metric phonology and prosodic structure that will guide this study. Then, some previous studies in this area are show wtih the descriptions of the PB neutral sentences and sentences with prosodic focus on the subject, and, also, sentences with already raised topics in the recent past. In the second chapter, we will present the syntactic theory that supports our understanding of the structures involved here and the type of analisys envolved. The generative theory formulated by Chomsky will serve as base line, especially from the Minimalist Program (COMSKY 1995 and laters). After this introduction, we will present some findings on this set of sentences and two possible paths to follow. In the third chapter we describe the experiment, in the fourth we present and discuss the results. Finally, the fifth and final chapter offers an overview of the foregoing and the conclusions.
12

Diagnóstico dos mecanismos disfluentes em orações relativas do português brasileiro / Diagnosis of disfluencies mechanisms in relative clauses of Brazilian portuguese

Thiago Quintanilha da Silva 13 April 2012 (has links)
Alguns estudos na área da Psicolinguística tratam sobre a interrupção da forma natural da fluência da fala. Essas suspensões são denominadas disfluências e podem ser de variados tipos como, por exemplo, repetições, substituições ou pausas. Entre alguns trabalhos sobre disfluências, destaca-se o realizado por Jaeger (2005), que tratou da omissão do relativizador that na língua inglesa e a possibilidade desse fator ser responsável pela criação de disfluências. Nessa mesma linha, objetivamos analisar as disfluências na camada dos relativizadores camada CP em língua portuguesa brasileira. Para isso, tomaram-se dados obtidos por Corrêa et al (2008) sobre produção de orações relativas. Nesse estudo, os autores, buscando verificar a complexidade da formulação de orações relativas, manipularam duas condições: plenamente planejada que reduziria a carga de processamento e, consequentemente, levaria à maior produção de orações relativas padrões e parcialmente planejada a qual aumentaria a carga de processamento e, consequentemente, maior produção de orações relativas cortadoras e resumptivas. Diante disso, sabendo que o planejamento de estruturas mais complexas pode ser um fator que gere mais sentenças disfluentes, resta saber em qual das condições, estipuladas por Corrêa et al (2008), haveria maior caso de disfluências. Acreditamos que a condição parcialmente planejada resultaria mais casos de disfluências em comparação à condição inteiramente planejada. Para verificação de tal hipótese, a presente pesquisa focou suas atenções no banco de dados de Corrêa et al (2008). Após determinados critérios, privilegiamos sentenças de orações relativas genitivas, orações relativas de objeto indireto funcional e orações relativas de objeto indireto lexical, pois tais seriam construções sintáticas mais complexas e passíveis de terem mais casos de disfluências. Identificadas e quantificadas todas as falas de interesse, criamos tabelas para melhor visualização das disfluências em localizações específicas na sentença como, por exemplo, antes da oração relativa (AOR), na oração relativa (NAOR) e depois da oração relativa (DPOR). Com tais dados analisados, verificamos que eles corroboravam a hipótese levantada: na condição parcialmente planejada há mais casos de disfluências do que na condição inteiramente planejada, principalmente quando se é focalizada a localização NAOR. Entre os principais resultados, percebemos que as disfluências do tipo pausas preenchidas aparecem em grande quantidade na localização NAOR, fator que revela uma característica especial da oração relativa. Essa disfluência, nesse trecho da sentença, revela que os falantes não somente fazem uma procura lexical, como também, um planejamento discursivo. Tais resultados nos motivaram a pensar em outras determinadas situações de pesquisa como, por exemplo, a análise das disfluências em sentenças de voz passiva / Some studies in Psycholinguistics area deal with the interruption of the natural form of fluency speech. These suspensions are called disfluencies and can be of various types, for example, repetitions, substitutions or pauses. Among some works about disfluency, the one made by Jaeger (2005) deserves attention. His research dealt with the omission of the relativizer that in English and the possibility of this factor being the responsible for the creation of disfluencies. With this in mind, we aimed to analyze disfluencies in the layer of relativizers - CP layer - in Brazilian Portuguese. For this, data were taken by Côrrea et al (2008) on production of relative clauses. In this study, the authors, trying to verify the complexity of the formulation of relative clauses, manipulated two conditions: totally planned which would reduce the processing load and, consequently, major production of standard relative clauses and partially planned which would increase the processing load and, therefore, major production of gap and resumptive relative clauses. So, knowing that the planning of more complex structures can be a factor that generates more disffluent sentences, the question in which of the conditions stipulated by Corrêa et al (2008), we would find major cases of disfluency. We believe that the condition partly planned results in more cases of disfluencies in comparison with the condition entirely planned. To investigate this hypothesis, this research has focused its attention on the database of Corrêa et al (2008). After certain criterions, were privileged sentences of genitive relative clauses, functional indirect object of relative clauses and lexical indirect object of relative clauses, because these would be syntactic constructions more complex and likely to have more cases of disfluencies. Once identified and quantified all kinds of speech that interested us, there were created tables in order to enable a better visualization of disfluencies in specific locations in sentences, for instance, before the relative clause (BRC), in relative clause (IRC) and after the relative clause (ARC). With such data analyzed, it was found that the data corroborate the hypothesis: in the partially planned condition there are more cases of disfluencies than there are in the totally planned condition, principally when the location IRC is focused. Among the main results, we noticed that the disfluencies such as filled pauses appear in large amounts in IRC location, a factor that reveals a special feature of the relative clause. This disfluency, in this stretch of the sentence, reveals that the speakers are not only looking for a lexical, but also a discursive planning. These results motivated us to think of some other research situations, for example, analysis of disfluencies in the passive voice sentences
13

Diagnóstico dos mecanismos disfluentes em orações relativas do português brasileiro / Diagnosis of disfluencies mechanisms in relative clauses of Brazilian portuguese

Thiago Quintanilha da Silva 13 April 2012 (has links)
Alguns estudos na área da Psicolinguística tratam sobre a interrupção da forma natural da fluência da fala. Essas suspensões são denominadas disfluências e podem ser de variados tipos como, por exemplo, repetições, substituições ou pausas. Entre alguns trabalhos sobre disfluências, destaca-se o realizado por Jaeger (2005), que tratou da omissão do relativizador that na língua inglesa e a possibilidade desse fator ser responsável pela criação de disfluências. Nessa mesma linha, objetivamos analisar as disfluências na camada dos relativizadores camada CP em língua portuguesa brasileira. Para isso, tomaram-se dados obtidos por Corrêa et al (2008) sobre produção de orações relativas. Nesse estudo, os autores, buscando verificar a complexidade da formulação de orações relativas, manipularam duas condições: plenamente planejada que reduziria a carga de processamento e, consequentemente, levaria à maior produção de orações relativas padrões e parcialmente planejada a qual aumentaria a carga de processamento e, consequentemente, maior produção de orações relativas cortadoras e resumptivas. Diante disso, sabendo que o planejamento de estruturas mais complexas pode ser um fator que gere mais sentenças disfluentes, resta saber em qual das condições, estipuladas por Corrêa et al (2008), haveria maior caso de disfluências. Acreditamos que a condição parcialmente planejada resultaria mais casos de disfluências em comparação à condição inteiramente planejada. Para verificação de tal hipótese, a presente pesquisa focou suas atenções no banco de dados de Corrêa et al (2008). Após determinados critérios, privilegiamos sentenças de orações relativas genitivas, orações relativas de objeto indireto funcional e orações relativas de objeto indireto lexical, pois tais seriam construções sintáticas mais complexas e passíveis de terem mais casos de disfluências. Identificadas e quantificadas todas as falas de interesse, criamos tabelas para melhor visualização das disfluências em localizações específicas na sentença como, por exemplo, antes da oração relativa (AOR), na oração relativa (NAOR) e depois da oração relativa (DPOR). Com tais dados analisados, verificamos que eles corroboravam a hipótese levantada: na condição parcialmente planejada há mais casos de disfluências do que na condição inteiramente planejada, principalmente quando se é focalizada a localização NAOR. Entre os principais resultados, percebemos que as disfluências do tipo pausas preenchidas aparecem em grande quantidade na localização NAOR, fator que revela uma característica especial da oração relativa. Essa disfluência, nesse trecho da sentença, revela que os falantes não somente fazem uma procura lexical, como também, um planejamento discursivo. Tais resultados nos motivaram a pensar em outras determinadas situações de pesquisa como, por exemplo, a análise das disfluências em sentenças de voz passiva / Some studies in Psycholinguistics area deal with the interruption of the natural form of fluency speech. These suspensions are called disfluencies and can be of various types, for example, repetitions, substitutions or pauses. Among some works about disfluency, the one made by Jaeger (2005) deserves attention. His research dealt with the omission of the relativizer that in English and the possibility of this factor being the responsible for the creation of disfluencies. With this in mind, we aimed to analyze disfluencies in the layer of relativizers - CP layer - in Brazilian Portuguese. For this, data were taken by Côrrea et al (2008) on production of relative clauses. In this study, the authors, trying to verify the complexity of the formulation of relative clauses, manipulated two conditions: totally planned which would reduce the processing load and, consequently, major production of standard relative clauses and partially planned which would increase the processing load and, therefore, major production of gap and resumptive relative clauses. So, knowing that the planning of more complex structures can be a factor that generates more disffluent sentences, the question in which of the conditions stipulated by Corrêa et al (2008), we would find major cases of disfluency. We believe that the condition partly planned results in more cases of disfluencies in comparison with the condition entirely planned. To investigate this hypothesis, this research has focused its attention on the database of Corrêa et al (2008). After certain criterions, were privileged sentences of genitive relative clauses, functional indirect object of relative clauses and lexical indirect object of relative clauses, because these would be syntactic constructions more complex and likely to have more cases of disfluencies. Once identified and quantified all kinds of speech that interested us, there were created tables in order to enable a better visualization of disfluencies in specific locations in sentences, for instance, before the relative clause (BRC), in relative clause (IRC) and after the relative clause (ARC). With such data analyzed, it was found that the data corroborate the hypothesis: in the partially planned condition there are more cases of disfluencies than there are in the totally planned condition, principally when the location IRC is focused. Among the main results, we noticed that the disfluencies such as filled pauses appear in large amounts in IRC location, a factor that reveals a special feature of the relative clause. This disfluency, in this stretch of the sentence, reveals that the speakers are not only looking for a lexical, but also a discursive planning. These results motivated us to think of some other research situations, for example, analysis of disfluencies in the passive voice sentences
14

Monitoramento de idosos em ambientes internos por meio da análise sintática de dados visuais

Silva, José do Patrocínio dos Santos, 92-98153-4760 05 April 2017 (has links)
Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-08-21T14:44:13Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-08-21T14:44:25Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-08-21T14:44:37Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) / Made available in DSpace on 2017-08-21T14:44:37Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) Previous issue date: 2017-04-05 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Systems for monitoring human activities are used to detect risk situation that may compromise one’s physical integrity or health. These systems support more efficient actions from people responsible for guarding and monitoring the elderly, children, or ill through identification of dangerous activities. This work aims to perform fall recognition of elderly people indoors properly monitored by a camera system. The developed approach uses syntactic descriptions of primitives extracted and characterized from the movements of the elderly. The recognition is given by finite-state automata governed by pre-established grammatical rules. This methodology was applied in several daily situations of elderly people who eventually suffer a fall indoors. The results obtained prove to be satisfactory and point to the feasibility and integration of the methodology in the monitoring systems of elderly activities. / Nos dias atuais, os sistemas para monitoramento de atividades humanas são utilizados para detectar situações de risco ou atividades que possam comprometer a integridade física ou a saúde das pessoas. Esses sistemas favorecem a atuação ou intervenção mais rápida e eficiente de profissionais responsáveis pela guarda e monitoramento de pessoas idosas, crianças ou enfermos a partir da detecção e reconhecimento de ações ou atividades de risco. Este trabalho objetiva realizar o monitoramento e reconhecimento de queda de pessoas idosas em ambiente interno provido por um sistema de câmeras. A grande incidência de queda de idosos tem sido considerada um dos principais problemas de saúde pública e afeta diretamente a economia devido aos custos consideráveis de internação, tratamento e assistenciais. A abordagem desenvolvida utiliza descrições sintáticas de primitivas extraídas e caracterizadas a partir de movimentos de idosos. Esta metodologia foi aplicada em diversas situações cotidianas de pessoas idosas que eventualmente sofrem uma queda em ambientes internos. Os resultados obtidos demonstram-se satisfatórios e apontam para a viabilidade e integração da metodologia aos sistemas de monitoramento de atividades de pessoas idosas.
15

Um estudo descritivo-analítico do Manual de Análise Léxica e Sintática de José Oiticica

Sapaterra, Ana Paula 08 September 2015 (has links)
Made available in DSpace on 2016-04-28T19:34:00Z (GMT). No. of bitstreams: 1 Ana Paula Sapaterra.pdf: 20682646 bytes, checksum: 84025d12b4a11e1f3db19220860fe52a (MD5) Previous issue date: 2015-09-08 / Secretaria da Educação do Estado de São Paulo / This thesis has the aim to describe and analyze the José Oiticica s Lexical and Syntactic Manual Analysis work. For this work we examined all the twelve editions and we certified that the first four ones remained similar in the linguistic aspects. From the fifth one, there was partial a redoing of the work, fact that was kept to the twelfth edition (1958), this was the reason we chose to compare the first (1919) and the fifth (1940) in order to point the permanence and the changes ocurred among the versions. We observed that the second, third and fourfh editions had some improvements , adding morphosis, flexons, root and radical on the second edition definitions, the junction of the two paragraphs in one just and the adding of an erratum on the second edition. These modifications that ocurred from the second to the fourth one don t mean that the volumes were modifyed on the contents; From the fifth edition the redoing of the work was done, like the figure alteration , reason which we were taken to compare the version of 1919 and 1940. We also point the motive of the Manual prodution and for those who it was destined. To develop this research, it was necessary to survey the historical situation of Brazil in the First Republic and the facts that became fundamental on the nation development so idealized by the republicans and, subsequent to challenged, by the anarchists. Some aspects of José Oiticica s life will be approached from the cultural and social spaces were he passed by, about the job that he did as an educator, journalist and writer, about the works produced by him, the turmoils that he suffered due to his engagement with the anarchist ideal. For this we will use as theoretic apparatus the linguistic Ideas History (Auroux, Fávero and Orlandi), in order to seize in the chosen subject - the José Oiticica s Manual - , how and what shape he and the environment are linked in a cause and effect relationship / Esta tese tem como objetivo descrever e analisar a obra Manual de Análise Léxica e Sintática, de José Oiticica. Para tal fim, examinamos as doze edições e constatamos que as quatro primeiras permaneceram idênticas nos aspectos linguísticos. A partir da quinta, houve um refazimento parcial da obra, fato que se manteve até a décima segunda edição (1958), motivo pelo qual escolhemos cotejar a primeira (1919) e a quinta edição (1940) a fim de apontar a permanência e as mudanças ocorridas entre as versões. Observamos que a segunda, a terceira e a quarta edição foram melhoradas com o acréscimo dos conceitos de morfose, flexões, raiz e radical nas definições preliminares da segunda edição, a junção de dois parágrafos em um só e o aditamento de uma errata na 2ª edição. Essas alterações que ocorreram a partir da segunda até a quarta versão não significam que os volumes sofreram modificações no conteúdo; já a partir da quinta, registrou-se o refazimento da obra, como as modificações de quadros , motivo que nos levou a colacionar a versão de 1919 e a de 1940. Também apontamos o porquê da produção do Manual e a quem se destinava. Para desenvolver esta pesquisa, foi necessário fazer um levantamento histórico de como era o Brasil na Primeira República e dos fatos que se tornaram fundamentais na construção da nação tão idealizada pelos republicanos e, posteriormente, contestada pelos anarquistas. Abordar-se-ão, também, aspectos da vida de José Oiticica, dos espaços sociais e culturais por onde transitou, do trabalho que realizou como educador, jornalista e escritor, das obras que produziu e dos problemas que sofreu devido ao seu envolvimento com o ideário anarquista. Para tal, utilizaremos como aparato teórico a História das Ideias Linguísticas (Auroux , Fávero e Orlandi) a fim de apreender no objeto escolhido - o Manual de José Oiticica -, como e de que forma ele e o meio estão interligados numa relação de causa e efeito
16

Um analisador sintático neural multilíngue baseado em transições

Costa, Pablo Botton da 24 January 2017 (has links)
Submitted by Ronildo Prado (ronisp@ufscar.br) on 2017-08-23T18:26:08Z No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-08-23T18:26:15Z (GMT) No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-08-23T18:26:21Z (GMT) No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) / Made available in DSpace on 2017-08-23T18:26:28Z (GMT). No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) Previous issue date: 2017-01-24 / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / A dependency parser consists in inducing a model that is capable of extracting the right dependency tree from an input natural language sentence. Nowadays, the multilingual techniques are being used more and more in Natural Language Processing (NLP) (BROWN et al., 1995; COHEN; DAS; SMITH, 2011), especially in the dependency parsing task. Intuitively, a multilingual parser can be seen as vector of different parsers, in which each one is individually trained on one language. However, this approach can be a really pain in the neck in terms of processing time and resources. As an alternative, many parsing techniques have been developed in order to solve this problem (MCDONALD; PETROV; HALL, 2011; TACKSTROM; MCDONALD; USZKOREIT, 2012; TITOV; HENDERSON, 2007) but all of them depends on word alignment (TACKSTROM; MCDONALD; USZKOREIT, 2012) or word clustering, which increases the complexity since it is difficult to induce alignments between words and syntactic resources (TSARFATY et al., 2013; BOHNET et al., 2013a). A simple solution proposed recently (NIVRE et al., 2016a) uses an universal annotated corpus in order to reduce the complexity associated with the construction of a multilingual parser. In this context, this work presents an universal model for dependency parsing: the NNParser. Our model is a modification of Chen e Manning (2014) with a more greedy and accurate model to capture distributional representations (MIKOLOV et al., 2011). The NNparser reached 93.08% UAS in English Penn Treebank (WSJ) and better results than the state of the art Stack LSTM parser for Portuguese (87.93% × 86.2% LAS) and Spanish (86.95% × 85.7% LAS) on the universal dependencies corpus. / Um analisador sintático de dependência consiste em um modelo capaz de extrair a estrutura de dependência de uma sentença em língua natural. No Processamento de Linguagem Natural (PLN), os métodos multilíngues tem sido cada vez mais utilizados (BROWN et al., 1995; COHEN; DAS; SMITH, 2011), inclusive na tarefa de análise de dependência. Intuitivamente, um analisador sintático multilíngue pode ser visto como um vetor de analisadores sintáticos treinados individualmente em cada língua. Contudo, a tarefa realizada com base neste vetor torna-se inviável devido a sua alta demanda por recursos. Como alternativa, diversos métodos de análise sintática foram propostos (MCDONALD; PETROV; HALL, 2011; TACKSTROM; MCDONALD; USZKOREIT, 2012; TITOV; HENDERSON, 2007), mas todos dependentes de alinhamento entre palavras (TACKSTROM; MCDONALD; USZKOREIT, 2012) ou de técnicas de agrupamento, o que também aumenta a complexidade associada ao modelo (TSARFATY et al., 2013; BOHNET et al., 2013a). Uma solução simples surgiu recentemente com a construção de recursos universais (NIVRE et al., 2016a). Estes recursos universais têm o potencial de diminuir a complexidade associada à construção de um modelo multilíngue, uma vez que não é necessário um mapeamento entre as diferentes notações das línguas. Nesta linha, este trabalho apresenta um modelo para análise sintática universal de dependência: o NNParser. O modelo em questão é uma modificação da proposta de Chen e Manning (2014) com um modelo mais guloso e preciso na captura de representações distribuídas (MIKOLOV et al., 2011). Nos experimentos aqui apresentados o NNParser atingiu 93, 08% de UAS para o inglês no córpus Penn Treebank e resultados melhores do que o estado da arte, o Stack LSTM, para o português (87,93% × 86,2% LAS) e o espanhol (86,95% × 85,7% LAS) no córpus UD 1.2.
17

A negação dupla no português paulistano / The double negation in São Paulo Portuguese

Rocha, Rafael Stoppa 25 March 2013 (has links)
Este trabalho descreve o emprego variável de estruturas de negação na variedade paulistana do português. São três as formas variantes: não pré-verbal (NEG1, p.ex. Não gosto de chocolate), não pré e pós-verbal (NEG2, p. ex. Não gosto de chocolate não) e não pós-verbal apenas (NEG3, p. ex. Gosto de chocolate não). A partir da discussão de restrições discursivo-pragmáticas, define-se o envelope de variação (os contextos em que as formas são semanticamente equivalentes). NEG1 e NEG2 são ambas alternativas quando a proposição que está sendo negada foi direta ou indiretamente ativada no discurso anterior. Quando a informação proposicional é nova no discurso, apenas NEG1 é possível. Já NEG3 parece improdutiva na variedade paulistana: representa menos de 1% em mais de cinco mil ocorrências de sentenças negativas. Os dados analisados foram extraídos de 48 entrevistas sociolinguísticas com paulistanos estratificados em Sexo/gênero, Faixa etária e Escolaridade. Elas foram coletadas pelo Grupo de Estudos e Pesquisa em Sociolinguística da Universidade de São Paulo (GESOL-USP), entre os anos de 2003 e 2010. Além da amostra geral (com todas essas entrevistas), são analisadas duas subamostras menores (24 entrevistas cada), organizadas com base na região da cidade em que vivem os paulistanos (mais central ou mais periférica) e na sua geração (filhos de pais paulistanos ou filhos de migrantes de outros estados brasileiros). Os resultados indicam que a variante NEG2, bastante infrequente (cerca de 6% no conjunto de 48 entrevistas), é favorecida por informantes de escolaridade mais baixa e de 1ª geração na cidade de São Paulo. Algumas análises sugerem ainda que informantes que vivem em bairros mais periféricos favorecem NEG2. Não há indícios, contudo, de correlação entre a variável e Sexo/gênero; tampouco há indício de mudança em curso. No âmbito linguístico, a ativação direta de proposições é o fator que mais fortemente favorece o emprego da variante NEG2, seguido da ausência de marcadores discursivos ou de outros termos negativos na sentença. / This masters thesis describes the variable use of negation structures in São Paulo Portuguese. There are three variants: pre-verbal não (NEG1, e.g. Não gosto de chocolate), pre and post-verbal não (NEG2, e.g. Não gosto de chocolate não) and post-verbal não only (NEG3, e.g. Gosto de chocolate não). All of these sentences mean I dont like chocolate. By discussing discourse-pragmatic restrictions on the use of such structures, the envelope of variation is defined as follows: NEG1 and NEG2 can both be employed when the proposition that is being negated was activated earlier (directly or indirectly) in discourse. When the propositional information is discourse-new, only NEG1 is possible. As for NEG3, it seems very unproductive in São Paulo Portuguese; it occurs in less than 1% of 5,000 tokens of negative sentences. The data was extracted from 48 sociolinguistic interviews with Paulistanos (those born and raised in the city of São Paulo) stratified by sex/gender, age group and level of education. From the general corpus of 48 interviews, two subsamples of 24 interviews each have also been analyzed. One of them is based on the region of the city where the informants live (central or peripheral), whereas the other is based on their generation in the city (Paulistano parents or migrants from other states in Brazil). Results show that NEG2 (an infrequent variant about 6% of the tokens extracted from the 48 interviews) is favored by those with lower level of education and by first generation Paulistanos (that is, by those whose parents were not born and raised in the city). Some analyses suggest that NEG2 is also favored by those groups that live in more peripheral areas of São Paulo. There is no indication of correlation between the variable and sex/gender, nor is there any indication of change in progress. Linguistically, the factor that most favors NEG2 is the direct activation of propositional information in discourse, followed by the absence of discourse markers or other negative elements in the sentence.
18

A negação dupla no português paulistano / The double negation in São Paulo Portuguese

Rafael Stoppa Rocha 25 March 2013 (has links)
Este trabalho descreve o emprego variável de estruturas de negação na variedade paulistana do português. São três as formas variantes: não pré-verbal (NEG1, p.ex. Não gosto de chocolate), não pré e pós-verbal (NEG2, p. ex. Não gosto de chocolate não) e não pós-verbal apenas (NEG3, p. ex. Gosto de chocolate não). A partir da discussão de restrições discursivo-pragmáticas, define-se o envelope de variação (os contextos em que as formas são semanticamente equivalentes). NEG1 e NEG2 são ambas alternativas quando a proposição que está sendo negada foi direta ou indiretamente ativada no discurso anterior. Quando a informação proposicional é nova no discurso, apenas NEG1 é possível. Já NEG3 parece improdutiva na variedade paulistana: representa menos de 1% em mais de cinco mil ocorrências de sentenças negativas. Os dados analisados foram extraídos de 48 entrevistas sociolinguísticas com paulistanos estratificados em Sexo/gênero, Faixa etária e Escolaridade. Elas foram coletadas pelo Grupo de Estudos e Pesquisa em Sociolinguística da Universidade de São Paulo (GESOL-USP), entre os anos de 2003 e 2010. Além da amostra geral (com todas essas entrevistas), são analisadas duas subamostras menores (24 entrevistas cada), organizadas com base na região da cidade em que vivem os paulistanos (mais central ou mais periférica) e na sua geração (filhos de pais paulistanos ou filhos de migrantes de outros estados brasileiros). Os resultados indicam que a variante NEG2, bastante infrequente (cerca de 6% no conjunto de 48 entrevistas), é favorecida por informantes de escolaridade mais baixa e de 1ª geração na cidade de São Paulo. Algumas análises sugerem ainda que informantes que vivem em bairros mais periféricos favorecem NEG2. Não há indícios, contudo, de correlação entre a variável e Sexo/gênero; tampouco há indício de mudança em curso. No âmbito linguístico, a ativação direta de proposições é o fator que mais fortemente favorece o emprego da variante NEG2, seguido da ausência de marcadores discursivos ou de outros termos negativos na sentença. / This masters thesis describes the variable use of negation structures in São Paulo Portuguese. There are three variants: pre-verbal não (NEG1, e.g. Não gosto de chocolate), pre and post-verbal não (NEG2, e.g. Não gosto de chocolate não) and post-verbal não only (NEG3, e.g. Gosto de chocolate não). All of these sentences mean I dont like chocolate. By discussing discourse-pragmatic restrictions on the use of such structures, the envelope of variation is defined as follows: NEG1 and NEG2 can both be employed when the proposition that is being negated was activated earlier (directly or indirectly) in discourse. When the propositional information is discourse-new, only NEG1 is possible. As for NEG3, it seems very unproductive in São Paulo Portuguese; it occurs in less than 1% of 5,000 tokens of negative sentences. The data was extracted from 48 sociolinguistic interviews with Paulistanos (those born and raised in the city of São Paulo) stratified by sex/gender, age group and level of education. From the general corpus of 48 interviews, two subsamples of 24 interviews each have also been analyzed. One of them is based on the region of the city where the informants live (central or peripheral), whereas the other is based on their generation in the city (Paulistano parents or migrants from other states in Brazil). Results show that NEG2 (an infrequent variant about 6% of the tokens extracted from the 48 interviews) is favored by those with lower level of education and by first generation Paulistanos (that is, by those whose parents were not born and raised in the city). Some analyses suggest that NEG2 is also favored by those groups that live in more peripheral areas of São Paulo. There is no indication of correlation between the variable and sex/gender, nor is there any indication of change in progress. Linguistically, the factor that most favors NEG2 is the direct activation of propositional information in discourse, followed by the absence of discourse markers or other negative elements in the sentence.
19

A sintaxe pronominal na variedade afro-indígena de Jurussaca: uma contribuição para o quadro da pronominalização do português falado do Brasil / The pronominal syntax in the afro-indigenous variety of Jurussaca: a contribution to the framework of the pronominalization of the portuguese spoken in Brazil

Ednalvo Apostolo Campos 27 August 2014 (has links)
Esta pesquisa aborda a sintaxe pronominal pessoal da comunidade quilombola de Jurussaca/PA, sob os pressupostos da teoria gerativa, nas versões de Princípios e Parâmetros (Chomsky, 1986) e Minimalista (Chomsky, 1995, 2001). Dentro desse quadro, destacam-se os estudos sobre a categoria pronominal desenvolvidos por Zwicky (1977), Kayne (1975, 1991), Borer (1981), Bonet (1991), Cardinaletti & Starke (1999), Ewerett (1994), Duarte & Matos (2000), Duarte, Matos & Gonçalves (2005), Galves (2001a,b), Galves & Abaurre (2002), Déchaine & Wiltchko (2002), entre outros. Parte-se, inicialmente, da expressão do português brasileiro a partir do viés dicotômico existente entre suas variedades: o PB e o PVB. Essa dicotomia tem sido denominda de polarização sociolinguística do Brasil (LUCCHESI, 2008, 2009). Assume-se (cf. Oliveira et alii, no prelo) o conceito de Português Afro-indígena, relativo às variedades de português popular faladas no Brasil em comunidades rurais que conservam especificidades etnolinguísticas. Propõe-se que essas variedades localizam-se dentro de um continuum de variedades de português brasileiro [+marcadas] (como o português afro-brasileiro e o indígena). Analisa-se, a partir da sócio-história, e das construções sintáticas da expressão da comunidade: pronomes clíticos e tônicos atemáticos; o pronome de 1ª. pessoa nós [ns] em posição pré verbal ou proclítica, entre outras, como parte de fatores sintáticos (e etnolinguísticos) que sugerem uma provável reestruração em certos aspectos da sintaxe pronominal de Jurussaca; apontam para a existência prévia de um forte contato linguístico e são tomados como suporte para as hipóteses assumidas / This research addresses the syntax of the personal pronoun system of the maroon community of Jurussaca/Pa, under the assumptions of generative theory, in its Principles & Parameters (Chomsky, 1986) and Minimalist (Chomsky, 1995, 2001) versions. Within this theoretical framework, the studies of pronominal category developed by Zwicky (1977), Kayne (1975, 1991), Borer (1981), Bonet (1991), Cardinaletti & Starke (1999), Ewerett (1994), Duarte & Matos (2000), Duarte, Matos and Gonçalves (2005), Galves (2001a, b) Galves & Abaurre (2002) Dechaine & Wiltchko (2002), among others, are highlited. The study departs from a consideration of the bias in dichotomy existing between the varieties known as Brazilian Portuguese (BP) and Brazilian Vernacular Portuguese (BVP). This dichotomy has been refered to as the \"sociolinguistics polarization of Brazil\" (LUCCHESI, 2008, 2009). The study assumes the classification Afro-Indigenous Portuguese (cf. Oliveira at al, in press) in relation to to the popular varieties of Portuguese spoken in Brazilian rural communities that preserve ethno-linguistic specificities. It is then proposed that these varieties are located on a continuum of [+ marked] Brazilian Portuguese varieties (such as Afro-Brazilian and Indigenous Portuguese). As from the socio-history of the community it is analyzed syntactic constructions with clitic pronouns and athematic tonic pronouns devoid of thematic role; the 1st person pronoun nós [ns] (we) in the pre-verbal or proclitic positions, among others, are syntactic constructions that suggest \'grammatical restructuring\' and point to the prior existence of a strong language contact and are taken as support for the hypotheses here assumed
20

A sintaxe pronominal na variedade afro-indígena de Jurussaca: uma contribuição para o quadro da pronominalização do português falado do Brasil / The pronominal syntax in the afro-indigenous variety of Jurussaca: a contribution to the framework of the pronominalization of the portuguese spoken in Brazil

Campos, Ednalvo Apostolo 27 August 2014 (has links)
Esta pesquisa aborda a sintaxe pronominal pessoal da comunidade quilombola de Jurussaca/PA, sob os pressupostos da teoria gerativa, nas versões de Princípios e Parâmetros (Chomsky, 1986) e Minimalista (Chomsky, 1995, 2001). Dentro desse quadro, destacam-se os estudos sobre a categoria pronominal desenvolvidos por Zwicky (1977), Kayne (1975, 1991), Borer (1981), Bonet (1991), Cardinaletti & Starke (1999), Ewerett (1994), Duarte & Matos (2000), Duarte, Matos & Gonçalves (2005), Galves (2001a,b), Galves & Abaurre (2002), Déchaine & Wiltchko (2002), entre outros. Parte-se, inicialmente, da expressão do português brasileiro a partir do viés dicotômico existente entre suas variedades: o PB e o PVB. Essa dicotomia tem sido denominda de polarização sociolinguística do Brasil (LUCCHESI, 2008, 2009). Assume-se (cf. Oliveira et alii, no prelo) o conceito de Português Afro-indígena, relativo às variedades de português popular faladas no Brasil em comunidades rurais que conservam especificidades etnolinguísticas. Propõe-se que essas variedades localizam-se dentro de um continuum de variedades de português brasileiro [+marcadas] (como o português afro-brasileiro e o indígena). Analisa-se, a partir da sócio-história, e das construções sintáticas da expressão da comunidade: pronomes clíticos e tônicos atemáticos; o pronome de 1ª. pessoa nós [ns] em posição pré verbal ou proclítica, entre outras, como parte de fatores sintáticos (e etnolinguísticos) que sugerem uma provável reestruração em certos aspectos da sintaxe pronominal de Jurussaca; apontam para a existência prévia de um forte contato linguístico e são tomados como suporte para as hipóteses assumidas / This research addresses the syntax of the personal pronoun system of the maroon community of Jurussaca/Pa, under the assumptions of generative theory, in its Principles & Parameters (Chomsky, 1986) and Minimalist (Chomsky, 1995, 2001) versions. Within this theoretical framework, the studies of pronominal category developed by Zwicky (1977), Kayne (1975, 1991), Borer (1981), Bonet (1991), Cardinaletti & Starke (1999), Ewerett (1994), Duarte & Matos (2000), Duarte, Matos and Gonçalves (2005), Galves (2001a, b) Galves & Abaurre (2002) Dechaine & Wiltchko (2002), among others, are highlited. The study departs from a consideration of the bias in dichotomy existing between the varieties known as Brazilian Portuguese (BP) and Brazilian Vernacular Portuguese (BVP). This dichotomy has been refered to as the \"sociolinguistics polarization of Brazil\" (LUCCHESI, 2008, 2009). The study assumes the classification Afro-Indigenous Portuguese (cf. Oliveira at al, in press) in relation to to the popular varieties of Portuguese spoken in Brazilian rural communities that preserve ethno-linguistic specificities. It is then proposed that these varieties are located on a continuum of [+ marked] Brazilian Portuguese varieties (such as Afro-Brazilian and Indigenous Portuguese). As from the socio-history of the community it is analyzed syntactic constructions with clitic pronouns and athematic tonic pronouns devoid of thematic role; the 1st person pronoun nós [ns] (we) in the pre-verbal or proclitic positions, among others, are syntactic constructions that suggest \'grammatical restructuring\' and point to the prior existence of a strong language contact and are taken as support for the hypotheses here assumed

Page generated in 0.0725 seconds