Global ETD Search

31	A percepção da emoção na fala por nativos e não nativos / The perception of emotional speech by natives and non-natives Daniel Oliveira Peres 24 October 2016 (has links) Esta pesquisa de doutorado tem como intuito investigar a percepção da emoção na fala por nativos e não nativos (falantes nativos do português brasileiro PB, e falantes de língua inglesa sem conhecimento do PB). Esta tese orienta-se pela visão evolucionista (DARWIN,1965 [1872]; PLUTCHIK, 1980, 1984; COSMIDES; TOOBY, 2000), que defende a universalidade das emoções; e pela visão social das emoções (AVERILL, 1980, 1993; HARRÉ, 1986; RUSSELL, 1991), que defende as emoções como produto das interações sociais. Para a análise, foram desenvolvidos 3 experimentos de percepção de fala envolvendo 4 emoções básicas: raiva, medo, tristeza e alegria. O primeiro experimento (piloto) foi baseado na abordagem com emoções básicas e escolha forçada; o segundo na abordagem dimensional das emoções (valência, ativação e dominância); e o terceiro na metodologia thin slicing. Ao todo, 110 informantes participaram dos experimentos, sendo 8 no experimento piloto, 36 no experimento com abordagem dimensional (julgando fala normal e fala delexicalizada) e 76 no experimento com thin slices. Nos dois primeiros experimentos, foram utilizados 32 trechos de fala emotiva espontânea do português brasileiro (PB). No experimento com thin slices, foram selecionados 48 trechos curtos de fala emotiva (PB) com duração de até 1400ms. Os julgamentos dos participantes foram cotejados com os parâmetros acústicos provenientes da análise automática (ExProsodia) e com parâmetros acústicos relacionados à qualidade de voz. Os resultados dos dois primeiros experimentos foram significativos e demonstraram que, de maneira geral, os participantes nativos e não nativos foram capazes de julgar com êxito as emoções. Entretanto, os participantes não nativos não apresentaram resultado significativo no experimento com abordagem dimensional e fala delexicalizada. De acordo com a análise dos dados do experimento com thin slices, ao contrário do que foi encontrado no experimento com abordagem dimensional (fala delexicalizada), não houve diferença significativa entre o desempenho dos nativos e dos não nativos. Embora os achados deste trabalho corroborem uma visão universalista das emoções, eles também dão pistas de que há uma vantagem intragrupo, ou seja, de que os nativos possuem uma habilidade maior em reconhecer as emoções do que os não nativos. Com base nos resultados dos experimentos com limitação de informação dos estímulos (fala delexicalizada e thin slices), a hipótese é a de que a percepção da emoção está sujeita à redundância de informação contida na fala. Dessa forma, a percepção da emoção na fala é possível mesmo com a escassez de informação do sinal acústico. / This study aims to investigate the perception of emotional speech by natives and non-natives. This study is based on the evolutionary view (DARWIN, 1965 [1872]; PLUTCHIK 1980, 1984; COSMIDES; TOOBY, 2000), which claims that the emotions are universally manifested; and the social vision of emotion (AVERILL 1980, 1993; HARRÉ, 1986; RUSSELL, 1991), which claims that emotions are a product of social interactions. In order to do so, three perception experiments were developed involving four basic emotions: anger, fear, sadness and joy. The first experiment pilot was based on the basic emotion approach (fouralternative forced choice); the second was based on the dimensional approach to emotions (valence, activation and dominance); and the third was based on the thin slicing methodology. Altogether, 110 participants performed the experiments, 8 in the pilot experiment, 36 in the experiment with dimensional approach (judging normal and delexicalized speech) and 76 in the experiment with thin slices. In the first two experiments, 32 Brazilian Portuguese (BP) excerpts of emotional speech were selected. In the experiment with thin slices 48 short excerpts of PB emotional speech were selected with duration up to 1400ms. The judgements of the participants were compared to the acoustic parameters from the automatic analysis (ExProsodia) and acoustic parameters related to voice quality. The results of the first two experiments were significant and showed that, in general, native and non-native participants were able to judge successfully emotions. However, non-native participants showed no significant result in the experiment with dimensional approach and delexicalized speech. According to the data analysis of the thin slices experiment showed that there was no significant difference between the natives and nonnatives performances, unlike what was found in the experiment with dimensional approach (delexicalized speech). Although the results of this study support a universalist perspective of emotions, they also give clues that there is an in-group advantage, namely that the natives have a greater ability to recognize emotions than non-natives. The assumption is that the perception of emotion is subject to the redundancy of information contained in the speech, based on the results of the experiments with restrict content stimuli (delexicalized speech and thin slices). Thus, the perception of emotion in speech is possible even with the lack of information of the acoustic signal. Emoção Entoação Fonética acústica Percepção da fala Português do Brasil Acoustic phonetics Brazilian Portuguese Emotion Intonation Speech perception
32	O comportamento do verbo “poder” no português do Brasil Silva, Elias André da 10 October 2012 (has links) Submitted by Amanda Silva (amanda.osilva2@ufpe.br) on 2015-03-10T14:28:12Z No. of bitstreams: 2 Tese.Doutorado.Elias. - CD - BBC.pdf: 1904612 bytes, checksum: 1e03955a3b2ea3c813e5e8a254bf5a06 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-10T14:28:12Z (GMT). No. of bitstreams: 2 Tese.Doutorado.Elias. - CD - BBC.pdf: 1904612 bytes, checksum: 1e03955a3b2ea3c813e5e8a254bf5a06 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2012-10-10 / PPGL; CAPES / O Verbo PODER (Vpoder) faz parte da categoria dos verbos auxiliares, mais precisamente dos auxiliares modais. Todavia, esse verbo não apresenta estrutura semelhante aos demais que recebem a classificação de modalizadores. Este fato constitui-se o cerne central da discussão proposta neste trabalho de tese: a determinação de que o Vpoder não atende aos critérios percebidos nos verbos modais em relação ao seu funcionamento no Português do Brasil (PB) com a função plena e com a função de auxiliar, de forma específica numa comparação com seu par modal, o verbo DEVER. Nesse sentido, ele não possui função lexical dentro do sistema verbal do PB, numa visão mais voltada a uma análise do ponto de vista da análise tradicional da gramática; ou, numa visão da teoria gerativa, não subcategoriza um argumento interno, por não atribuir Caso Acusativo. Para montagem do corpus deste estudo são fontes dos dados o Jornal Folha de S. Paulo, especificamente a seção Tendências e Debates, números publicados no primeiro semestre de 2008; dados de introspecção testados com falantes nativos do PB na região Nordeste; notícias publicadas no Jornal Gazeta de Alagoas; Anúncios publicitários em outdoors de empresas telefônicas e de faculdades; Revistas de notícias como ÉPOCA, ISTO É e VEJA. Além dessas fontes, foram utilizadas também “merchandising” em terminais de auto-atendimento da Loja de Departamento C & A e eventos televisivos. Os argumentos levantados para comprovação de que o Vpoder não possui uso autônomo (pleno) no PB iniciam-se pela determinação de que, nas construções complexas introduzidas por esse verbo, ele funciona apenas como auxiliar do verbo principal (Vp) que aparece mais a sua direita, realizado foneticamente ou elíptico, ao qual cabe o papel de subcategorizador do argumento interno em forma de SN (Sintagma Nominal), SP (Sintagma Preposicional) nessas construções. Para essa comprovação foram aplicados testes propostos por autores como Pontes (1973, precursora dos estudos envolvendo o Vpoder no Brasil, dos quais alguns foram contestados e outros aplicados; além desses outros foram propostos, como o teste do apagamento de V (verbo) e/ou de (SV) Sintagma Verbal. Para os casos em que o Vpoder aparece próximo a expressões de indeterminação como TUDO, NADA, ISSO, ESSE se defende a ocorrência da elipse de Vp ou de SP (Sintagma Verbal) com base no que propõe Matos (1996). O último argumento centrase na comprovação de que a ocorrência isolada do Vpoder no Português do Brasil é agramatical, ou seja, não faz parte da gramática dessa língua. A sua ocorrência no nível da superfície dá-se pela verificação de elipse ou suspensão, numa indicação a um tópico dado anteriormente na frase ou no discurso. Verbo poder Verbos Modais Verbos Plenos Verbos Auxiliares Gramática do Português do Brasil
33	Gramaticalização do foco no português do Brasil e de Portugal: estudo de diferentes sincronias da construção sendo que / Grammaticalization of focus in Portuguese from Brazil and Portugal: study of different synchronicities of the construction being that André Luiz Rauber 26 February 2014 (has links) Esta pesquisa descreve os usos e funções da perífrase sendo que ao longo da sua história (século XVI ao XXI) em duas variedades do português: o português do Brasil (PB) e o português de Portugal (PP). Objetiva demonstrar, a partir de dados empíricos, que tal perífrase é uma construção polifuncional nas duas variedades linguísticas investigadas. No domínio pragmático (DIK, 1989, 1997), ela desempenha, em certos contextos, a função de um marcador de focalização da informação proeminente de um conteúdo comunicado. Essa é a hipótese para a tese aqui defendida: a construção sendo que revelaria a gramaticalização de uma espécie de focalizador no PP e no PB. A base teórica concentra-se numa concepção funcionalista da linguagem, conforme os estudos de Dik (1989, 1997), Halliday (2004), Lehmann (1982, 1985, 1991, 2002) e Givón (1985). O estudo da mudança linguística, sob o escopo da gramaticalização, segue o viés teórico de Heine, Claudi & Hünnemeyer (1991), Heine (1993, 1997), Hopper e Traugott (1993, 2003), Taylor (2006) e Heine e Kuteva (2002). A análise dos mecanismos de (inter)subjetivação, envolvidos na abstratização, segue os estudos de Traugott (1982, 1989, 1995, 2002, 2010), de Traugott & Dasher (2002) e de Langacker (1985, 1987, 1990, 1999, 2007, 2013). A análise do contexto de mudança baseou-se em Heine (2002) e Diewald (2002). A fim de aferir a potencialidade construcional de sendo que, discutiram-se as propostas de Langacker (1987, 2013), Goldberg (1995, 2010), Trousdale (2008, 2013) e Traugott (2012). A amostra investigada constitui-se de dados escritos do PP e do PB, extraídos dos seguintes corpora: o corpusdoportugues.org (DAVIES e FERREIRA, 2006), séculos XIII a XX; a amostra histórica de Tarallo (1991), séculos XIII a XX; e o corpus do Projeto História do Português do Brasil (CASTILHO, 2010), séculos XVIII e XIX. Foram analisadas sincronias do século XX e XXI do PP e do PB, com base nos dados do projeto linguateca.pt, CetenFolha (PB) e CetemPúblico (PP), século XX; além de textos produzidos por estudantes representantes das variedades em estudo, século XXI. Os dados foram analisados sob a perspectiva metodológica de frequência token e type proposta por Bybee e Hopper (2001) e Hopper (1991). Além da hipótese acima apresentada, no decorrer da pesquisa, outras questões surgiram e dizem respeito à sua evolução histórica, à sua alta frequência nas variedades investigadas e à sua proximidade com o distributivo sendos e sendas do espanhol, e com a função partitiva nas línguas românicas. As investigações revelaram que forças, nem sempre concomitantes, mas sistêmicas, como a natureza semântica e funcional da forma SER, o gerúndio, a clivagem, a adjunção ao QUE, contribuíram para a gramaticalização de uma construção, cuja origem remonta ao século XVI como operador causal (RIBEIRO, 1950[1890]). Com o tempo, a construção sendo que teve seus usos alargados tanto no PP quanto no PB. Passou a sofrer os efeitos da frequência (BYBEE; HOPPER, 2001), adequando-se a contextos comunicativos diversos e condicionando-se a reelaborações cognitivas. Como efeito, acumulou outras nuances semânticas, recebendo também reforço pragmático, o que causou um impacto funcional sobre seu uso contemporâneo. / This research describes the uses and functions of the periphrasis being that (sendo que), throughout its history (XVIth to XXIst centuries), in two varieties of Portuguese: Brazil (PB) and Portugal (PP). It intends to demonstrate, by empirical data, that said periphrasis is a polyfunctional construction in both language varieties. In the pragmatic domain (DIK, 1989, 1997), being that has, in certain contexts, the function of a marker targeting the prominent information within a statement. This thesis presents the hypothesis that being that is the grammaticalization of a kind of focus element in both PP and PB. The theoretical basis was mainly formed by the functionalist conception of language as approached in the studies of Dik (1989, 1997), Halliday (2004), Lehmann (1982, 1985, 1991, 2002) and Givón (1985). The study of linguistic change, under the scope of grammaticalization, followed the theories of Claudi & Hünnemeyer (1991), Heine (1993, 1997), Hopper and Traugott (1993, 2003), Taylor (2006), and Heine and Kuteva (2002). For the analysis of the (inter)subjectivity mechanisms involved in abstractization, the studies done by Traugott (1982, 1989 , 1995, 2002 , 2010), Traugott & Dasher (2002 ) and Langacker (1985, 1987, 1990, 1999, 2007, 2013) were used. Change context was analysed based on Heine (2002) and Diewald (2002) and the constructional potential of being that based on Langacker (1987, 2013), Goldberg (1995, 2010), Trousdale (2008, 2013) and Traugott (2012). The corpus investigated was formed by written texts in PP and PB extracted from this sources: the corpusdoportugues.org (DAVIES and FERREIRA, 2006), XIIIth to XXth centuries, the Tarallo historical data (1991), XIIIth to XXth centuries, the corpus of the Brazilian Portuguese History Project (Castilho, 2010), XVIIIth and XIXth centuries. Synchronous data was collected from linguateca.pt project CetenFolha (PB) and CETEMPúblico (PP), XXth century, and texts produced by students representing the PB and PP varieties, XXIst century. The corpus was analyzed using the token and type frequency methodology of Bybee and Hopper (2001) and Hopper (1991). Besides the hypothesis presented, other issues arose, like the historical evolution of the construction, its high frequency in the investigated varieties and its proximity to the distributive Spanish sendos, and the partitive function in the Romance languages. The investigation revealed that strengths, not always concurrent, but systemic, such as the semantic and functional nature of the TO BE form, the gerund, cleft construction, the connection to THAT, all contributed to the grammaticalization of this construction, since the XVIth century. At that time, it was just a causal operator (RIBEIRO, 1950[1890]). Over time, the usage of the construction has expanded in both the PP and PB. It began to suffer the effects of frequency (BYBEE; HOPPER, 2001), adapting to the different communicative contexts and conditioning itself to cognitive reworkings. In effect, it accumulated other semantic nuances and reinforced its pragmatic value, which caused a functional impact on its contemporary use. Foco Gramaticalização Português de Portugal Português do Brasil Sendo que Being that Focus Grammaticalization Portuguese of Brazil Portuguese Portugal
34	A tradução da escrita. Sistema de transposição ortográfica do árabe padrão para o português brasileiro / The translation of writing: a system for Standard Arabic to Brazilian Portuguese orthographic transposition Walter Tsuyoshi Sano 10 October 2011 (has links) Nesta dissertação tomamos por objeto de estudo a romanização, em português, de palavras árabes (e·g, termos, topônimos e antropônimos). Estudamos por que alguns nomes são grafados de maneiras diferentes em um ou outro jornal, por exemplo, analisamos esquemas existentes de romanização e propomos um sistema que seja não apenas conciso e regular, mas também abrangente e minucioso, podendo ser usado tanto por leigos quanto por acadêmicos. Os seis capítulos encontram-se divididos em duas partes. Na primeira parte, abordamos a relação entre transposição ortográfica (i·e, transcrição, transliteração romanização e latinização) e tradução; apresentamos a língua árabe e sua escrita; ressaltamos elementos pertinentes da ortografia do português brasileiro. Na segunda parte, cotejamos oito esquemas de romanização árabeportuguês, apontando suas (des)semelhanças; apresentamos nosso sistema de transposição ortográfica, em seus quatro módulos (leigo simplificado, leigo comum, acadêmico amplo e acadêmico estrito), incluindo exemplos de aplicação em nomes, expressões e um breve texto; concluímos antecipando os desdobramentos da proposta. / This master\'s thesis presents our research concerning the romanization of Arabic words (e·g, technical terms, toponyms and anthroponyms) into Portuguese. We have first studied why the way some nouns and proper names are written varies from source to source, then analysed some of the existing romanization schemes and, finally, proposed a system both concise and regular as well as comprehensive and detailed, one which is suitable for laymen and scholars alike. there are six chapters, distributed in two parts. In the first part, we see four orthographic transposition methods (transcription, transliteration, romanization and latinization) and how they relate to translation; the Arabic language and its writing script; and relevant aspects of the Brazilian Portuguese orthography. In the second part, we compare eight ArabicPortuguese romanization schemes, highlighting their (dis)similarities; introduce all four modules (laymans simplified, laymans common, scholars broad and scholars narrow) of our orthographic transposition system, including samples comprising names, expressions and a small text; and finish off with an assessment on how said proposal may unfold. escrita língua árabe ortografia português do Brasil tradução transliteração. Arabic language Brazilian Portuguese orthography translation transliteration writing
35	A influência da prosódia no processamento de algumas questões totais em português do Brasil Silva, Helicéa Paiva Nascimento da 13 February 2017 (has links) Submitted by Josimara Dias Brumatti (bcgdigital@ndc.uff.br) on 2017-02-13T16:16:34Z No. of bitstreams: 1 Dissertação - Helicéa Paiva Nascimento da Silva.pdf: 3011541 bytes, checksum: 78f08e392ff0eaa23588a0aec7174941 (MD5) / Made available in DSpace on 2017-02-13T16:16:34Z (GMT). No. of bitstreams: 1 Dissertação - Helicéa Paiva Nascimento da Silva.pdf: 3011541 bytes, checksum: 78f08e392ff0eaa23588a0aec7174941 (MD5) / Nesta dissertação, pesquisa-se a possibilidade de a altura entoacional de algumas questões totais no português do Brasil ser o fator de diferenciação para a avaliação pragmática das mesmas como uma pergunta neutra ou uma elocução marcada pela repreensão, através de dois experimentos off-line: um teste de julgamento de valor comunicativo e um teste de julgamento interpretativo com input auditivo. A pesquisa insere-se na linha de pesquisa 1, Teoria e Análise Linguística, do Programa de Pós-Graduação em Estudos da Linguagem, do Instituto de Letras, na Universidade Federal Fluminense, baseando-se nos pressupostos teóricos da Psicolinguística Experimental. Os resultados obtidos apontam para a confirmação de nossa pressuposição de ser a prosódia, aqui identificada pela curva melódica (F0) final dos enunciados interrogativos totais que fizeram parte dos nossos estímulos, o elemento pragmaticamente diferenciador entre uma pergunta total neutra e um enunciado marcado por uma repreensão em português do Brasil. / In this dissertation we research the possibility of the intonational height of some yes/no questions in Brazilian Portuguese affect their pragmatics evaluation as a neutral question or an utterance marked by a reproaching meaning by means of two off-line experiments: a judgment test of communicative value and an interpretative judgment test with auditive input. This research is inserted in the research line 1, Theory and Linguistic Analysis, of the Post-Graduation Program in Languages Studies, at Universidade Federal Fluminense and it is based into the theoretical presumptions of the experimental psycholinguistics. The results suggest the confirmation of our presupposition of being the prosody, here identified by the final melodic curve (F0) of some yes/no questions within our stimulus, the pragmatic element which makes difference between a neutral yes/no question or one marked with the meaning of a reproaching in Brazilian Portuguese. Prosódia Perguntas totais Português do Brasil Psicolinguística Percepção da fala Língua portuguesa Pragmática
36	Anotação automática de papéis semânticos de textos jornalísticos e de opinião sobre árvores sintáticas não revisadas / Automatic semantic role labeling on non-revised syntactic trees of journalistic and opinion texts Nathan Siegle Hartmann 25 June 2015 (has links) Contexto: A Anotação de Papéis Semânticos (APS) é uma tarefa da área de Processamento de Línguas Naturais (PLN) que permite detectar os eventos descritos nas sentenças e os participantes destes eventos (Palmer et al., 2010). A APS responde perguntas como Quem?, Quando?, Onde?, O quê?, e Por quê?, dentre outras e, sendo assim, é importante para várias aplicações de PLN. Para anotar automaticamente um texto com papéis semânticos, a maioria dos sistemas atuais emprega técnicas de Aprendizagem de Máquina (AM). Porém, alguns papéis semânticos são previsíveis e, portanto, não necessitam ser tratados via AM. Além disso, a grande maioria das pesquisas desenvolvidas em APS tem dado foco ao inglês, considerando as particularidades gramaticais e semânticas dessa língua, o que impede que essas ferramentas e resultados sejam diretamente transportados para outras línguas. Revisão da Literatura: Para o português do Brasil, há três trabalhos finalizados recentemente que lidam com textos jornalísticos, porém com performance inferior ao estado da arte para o inglês. O primeiro (Alva- Manchego, 2013) obteve 79,6 de F1 na APS sobre o córpus PropBank.Br; o segundo (Fonseca, 2013), sem fazer uso de um treebank para treinamento, obteve 68,0 de F1 sobre o córpus PropBank.Br; o terceiro (Sequeira et al., 2012) realizou anotação apenas dos papéis Arg0 (sujeito prototípico) e Arg1 (paciente prototípico) no córpus CETEMPúblico, com performance de 31,3 pontos de F1 para o primeiro papel e de 19,0 de F1 para o segundo. Objetivos: O objetivo desse trabalho de mestrado é avançar o estado da arte na APS do português brasileiro no gênero jornalístico, avaliando o desempenho de um sistema de APS treinado com árvores sintáticas geradas por um parser automático (Bick, 2000), sem revisão humana, usando uma amostragem do córpus PLN-Br. Como objetivo adicional, foi avaliada a robustez da tarefa de APS frente a gêneros diferentes, testando o sistema de APS, treinado no gênero jornalístico, em uma amostra de revisões de produtos da web. Esse gênero não foi explorado até então na área de APS e poucas de suas características foram formalizadas. Resultados: Foi compilado o primeiro córpus de opiniões sobre produtos da web, o córpus Buscapé (Hartmann et al., 2014). A diferença de performance entre um sistema treinado sobre árvores revisadas e outro sobre árvores não revisadas ambos no gênero jornalístico foi de 10,48 pontos de F1. A troca de gênero entre as fases de treinamento e teste, em APS, é possível, com perda de performance de 3,78 pontos de F1 (córpus PLN-Br e Buscapé, respectivamente). Foi desenvolvido um sistema de inserção de sujeitos não expressos no texto, com precisão de 87,8% no córpus PLN-Br e de 94,5% no córpus Buscapé. Foi desenvolvido um sistema, baseado em regras, para anotar verbos auxiliares com papéis semânticos modificadores, com confiança de 96,76% no córpus PLN-Br. Conclusões: Foi mostrado que o sistema de Alva-Manchego (2013), baseado em árvores sintáticas, desempenha melhor APS do que o sistema de Fonseca (2013), independente de árvores sintáticas. Foi mostrado que sistemas de APS treinados sobre árvores sintáticas não revisadas desempenham melhor APS sobre árvores não revisadas do que um sistema treinado sobre dados gold-standard. Mostramos que a explicitação de sujeitos não expressos nos textos do Buscapé, um córpus do gênero de opinião de produtos na web, melhora a performance da sua APS. Também mostramos que é possível anotar verbos auxiliares com papéis semânticos modificadores, utilizando um sistema baseado em regras, com alta confiança. Por fim, mostramos que o uso do sentido do verbo, como feature de AM, para APS, não melhora a perfomance dos sistemas treinados sobre o PLN-Br e o Buscapé, por serem córpus pequenos. / Background: Semantic Role Labeling (SRL) is a Natural Language Processing (NLP) task that enables the detection of events described in sentences and the participants of these events (Palmer et al., 2010). SRL answers questions such as Who?, When?, Where?, What? and Why? (and others), that are important for several NLP applications. In order to automatically annotate a text with semantic roles, most current systems use Machine Learning (ML) techniques. However, some semantic roles are predictable, and therefore, do not need to be classified through ML. In spite of SRL being well advanced in English, there are grammatical and semantic particularities that prevents full reuse of tools and results in other languages. Related work: For Brazilian Portuguese, there are three studies recently concluded that performs SRL in journalistic texts. The first one (Alva-Manchego, 2013) obtained 79.6 of F1 on the SRL of the PropBank.Br corpus; the second one (Fonseca, 2013), without using a treebank for training, obtained 68.0 of F1 for the same corpus; and the third one (Sequeira et al., 2012) annotated only the Arg0 (prototypical agent) and Arg1 (prototypical patient) roles on the CETEMPúblico corpus, with a perfomance of 31.3 of F1 for the first semantic role and 19.0 for the second one. None of them, however, reached the state of the art of the English language. Purpose: The goal of this masters dissertation was to advance the state of the art of SRL in Brazilian Portuguese. The training corpus used is from the journalistic genre, as previous works, but the SRL annotation is performed on non-revised syntactic trees, i.e., generated by an automatic parser (Bick, 2000) without human revision, using a sampling of the corpus PLN-Br. To evaluate the resulting SRL classifier in another text genre, a sample of product reviews from web was used. Until now, product reviews was a genre not explored in SRL research, and few of its characteristics are formalized. Results: The first corpus of web product reviews, the Buscapé corpus (Hartmann et al., 2014), was compiled. It is shown that the difference in the performance of a system trained on revised syntactic trees and another trained on non-revised trees both from the journalistic genre was of 10.48 of F1. The change of genres during the training and testing steps in SRL is possible, with a performance loss of 3.78 of F1 (corpus PLN-Br and Buscapé, respectively). A system to insert unexpressed subjects reached 87.8% of precision on the PLN-Br corpus and a 94.5% of precision on the Buscapé corpus. A rule-based system was developed to annotated auxiliary verbs with semantic roles of modifiers (ArgMs), achieving 96.76% confidence on the PLN-Br corpus. Conclusions: First we have shown that Alva-Manchego (2013) SRL system, that is based on syntactic trees, performs better annotation than Fonseca (2013)s system, that is nondependent on syntactic trees. Second the SRL system trained on non-revised syntactic trees performs better over non-revised trees than a system trained on gold-standard data. Third, the explicitation of unexpressed subjects on the Buscapé texts improves their SRL performance. Additionally, we show it is possible to annotate auxiliary verbs with semantic roles of modifiers, using a rule-based system. Last, we have shown that the use of the verb sense as a feature of ML, for SRL, does not improve the performance of the systems trained over PLN-Br and Buscapé corpus, since they are small. Anotação de papéis semânticos Português do Brasil Processamento de línguas naturais Brazilian portuguese Natural language processing Semantic role labeling
37	Gramaticalização do aspecto iterativo no português do Brasil: o verbo viver / Gramaticalization of the iterative aspect in the Brazilian portuguese: the verb to live Santos, Jorge Mariano dos 30 June 2010 (has links) O objetivo deste trabalho consiste na análise do processo de gramaticalização do verbo viver, que parte de sua função original como verbo pleno e assume novas funções, ao ponto de se recategorizar como verbo quase-auxiliar, exprimindo aspecto continuativo. Segundo Heine (1993), verbos plenos produtivos nas línguas podem ser submetidos a processos de auxiliarização em níveis e forças distintos, e esses níveis e forças podem ser representados pelos padrões funcionais do verbo viver. Demonstraremos que esses deslizamentos unidirecionais movidos por abstratização são guiados por processos cognitivos correlacionados à mudança no estatuto categorial do item em processo de gramaticalização. Para fazê-lo, utilizaremos a escala de categorias cognitivas propostas por Heine, Claudi e Hünnemeyer (1991, p. 55): pessoa > objeto > processo > espaço > tempo > qualidade, em sua proposta de versão sugerida no bojo do Grupo de Pesquisa em Mudança Gramatical (Lima-Hernandes, 2009) para: pessoa > objeto > instrumento > espaço > tempo > processo > qualidade. Para realizar essa tarefa, faremos uso de um corpus composto pelos seguintes materiais: i. Dossiês do DEOPS/SP (1924 -1945), nos quais se encontram informações e documentos fundamentais para uma compreensão mais abrangente da vida política, social e cultural de São Paulo na primeira metade do século XX; ii. Debates exibidos na MTV (Music Television edição brasileira), recolhidos em um programa semanal que discute os assuntos mais polêmicos do momento com convidados especialistas, profissionais, estudantes e pessoas comuns. iii. Entrevistas variadas concedidas ao jornal Folha de S. Paulo e à revista VEJA. Com base no corpus escrito, iniciamos um exercício de busca das motivações que fazem o verbo viver ser empregado em funções mais abstratizadas. Essa busca permitirá hipotetizar a rota de mudança e norteará a hipotetização do gatilho que fez com que o falante da língua portuguesa no Brasil reanalisasse expressões linguísticas com o verbo viver pleno em estruturas de auxialirização. / The objective of this research consists in the analysis of the process of grammaticalization of the verb to live, that it has left of its original function as full verb and assumes new functions, to the point of recategorization as Quasi-auxiliary verb, expressing continuative aspect. According to Heine (1993), productive full verbs in the languages can be submitted to auxiliarization processes in distinct levels and strength, and these levels and strength may be represented by the functional standards of the verb to live. We will demonstrate that these unidirectional movements stimulated by abstraction are guided by cognitive processes correlated to the change in the categorial statute of the item in gramaticalization process. To demonstrate it, we will use the scale of cognitive categories presented by Heine, Claudi and Hünnemeyer (1991, p. 55): person > object > process > space > time > quality, in his proposition of version suggested by the Group of Research in Grammatical (Lima-Hernandes, 2009) Change to: person > object > instrument > space > time > process > quality. To carry through this research, we will use corpus arranged by the following materials: i. Dossiers of the DEOPS/SP (1924 -1945), in which it might be possible find basic information and documents that permit a better understanding of the politic, social and cultural life in São Paulo in the first half of century XX; II. Debates shown on MTV (Music Television - Brazilian edition), collected in a weekly program that argues the most controversial subjects of the moment with guests like: specialists, professionals, students and common people. III. Varying interviews granted to Folha de S. Paulo newspaper and to VEJA magazine. On the basis of written corpus, we initiate an exercise of search of the motivations that allow the verb to live being used in more abstracted function. This search will allow to get the hypothesis the change route and guide the hypothecal trigger that made with that the speaker of Portuguese language in Brazil has reanalyzed linguistic expressions with the verb to live in its full meaning in auxiliarization structures. Aspecto verbal Auxiliarização Auxiliarization Brazilian portuguese language Gramaticalização Gramaticalization Português do Brasil Verb to live Verbal aspect Verbo viver
38	A Grammatica portugueza, de Júlio Ribeiro: um corte epistemológico na gramaticografia brasileira e a questão da língua portuguesa no Brasil. / The Portuguese Grammar, by Julio Ribeiro: an epistemological gash in the Brazilian grammaticography and the matter of the Portuguese language in Brazil. Vidal Neto, Jose Bento Cardoso 22 September 2010 (has links) A Grammatica portugueza, de Júlio Ribeiro, publicada em 1881, foi o primeiro compêndio que se ocupou em gramatizar a variante brasileira do Português. Além disso, como apontou Leite (2005a), Ribeiro foi o primeiro gramático a registrar marcas da hiperlíngua brasileira. Esta Dissertação visou a discutir e compreender as condições que possibilitaram a Ribeiro estes pioneirismos, principalmente em relação aos registros do Português do Brasil. Para realizar tal tarefa, estudamos o corte epistemológico realizado pelo autor em nossa gramaticografia, uma vez que Ribeiro negou os principais valores do Racionalismo e vinculou-se ao Naturalismo. Esta mudança teórica - a despeito da manutenção da influência do modelo Prescritivista - alterou a forma pela qual a gramática tradicional deveria descrever a língua e foi, com efeito, relevante para que se incluíssem, pela primeira vez em uma gramática, marcas de nossa variante linguística. Para realizar este estudo, nos atrelamos teórico-metodologicamente aos conceitos de Auroux (1992;1998a), especificamente, no que tange ao processo de gramatização e à hiperlíngua e também no que diz respeito à significativa importância exercida pelos instrumentos lingüísticos. O corpus foi a própria Grammatica, de Ribeiro. O presente trabalho também se enquadra no campo teórico da Historiografia Lingüística, uma vez que visamos a descrever e analisar o tratamento dado por Ribeiro para a questão do Português do Brasil. Por assim procedermos, também contribuímos para os estudos relativos aos modelos epistemológicos pelos quais passou nossa gramaticografia. / The Portuguese Grammar, by Júlio Ribeiro, published in 1881, was the first textbook with the aim of grammatising a Brazilian variant of Portuguese. Moreover, as Leite pointed (2005a), Ribeiro was the first grammarian to register impressions of the Brazilian hyperlanguage. This Dissertation aimed to discuss and comprehend the conditions which made Ribeiro do these pioneerisms, mainly in relation to the Brazilian Portuguese registers. To achieve this task, we studied the epistemological gash made by the author, in our grammaticography, once Ribeiro denied the main values of Rationalism and connected himself with Naturalism. This theoretical change regardless the maintenance of the influence of the Prescriptisvist model, altered the way in which the traditional grammar should describe the language and it was, with effect, relevant to an inclusion, by the first time in a grammar, of marks of our linguistic variant. To accomplish this study, we theoreticmethodologically linked ourselves to the concepts of Auroux (1992; 1998a), especially concerned to the process of grammatisation and to hyperlanguage, and also in relation to the significant importance exerted by the linguistic tools. The corpus was the Grammar istsef, by Ribeiro. The present work also suits the theoretic field of linguistic historiography, since our purpose is to describe and analyse the treatment given by Ribeiro to the issue of the Brazilian Portuguese. Through this approach, we also contributed to the studies relative to the epistemological models, over which our grammaticography has passed. Brazilian hyperlanguage Brazilian portuguese Gramática portuguesa Hiperlíngua brasileira Historiografia linguística Julio Ribeiro Júlio Ribeiro Linguistic historiography Português do Brasil Portuguese grammar
39	Atlas semântico-lexical da região do Grande ABC / Semantic-Lexical Atlas of the Great ABC region Adriana Cristina Cristianini 27 September 2007 (has links) A região do Grande ABC paulista, formada por sete municípios - Santo André, São Bernardo do Campo, São Caetano do Sul, Diadema, Mauá, Ribeirão Pires e Rio Grande da Serra -, tem uma importância considerável no contexto sócio-políticoeconômico- cultural do Brasil. Dentre outras características, percebe-se a grande mobilidade da população, fazendo crer que, atualmente, na região do Grande ABC, há poucos usuários que falam a norma da região. Por isso, faz-se necessário resgatar, o mais rápido possível, a variação semântico-lexical da língua falada no Grande ABC, como forma de se registrar a memória lingüística da comunidade dessa região. A presente tese busca registrar parte desse cabedal lingüístico e tem por objetivo geral descrever a norma semântico-lexical da região do Grande ABC paulista, com vistas ao Atlas Semântico-Lexical da Região do Grande ABC. Com base nos postulados da Geolingüística contemporânea, aplicou-se o Questionário Semântico-Lexical do Projeto ALiB, versão 2001, em nove pontos da região a 36 sujeitos subdivididos em duas faixas etárias - 18 a 30 e 50 a 65 anos de idade - e nos dois gêneros - feminino e masculino. Com as respostas obtidas nas entrevistas, elaborou-se um banco de dados semântico-lexical, disponível em CD-ROM, e, posteriormente, foram os dados tratados e documentados cartograficamente, a fim de que se pudesse elaborar o quadro da diversidade semântico-lexical do falar da região do Grande ABC. Além do referencial teórico-metodológico da Geolingüística e da Lexicologia, a partir de obras de Pottier e Barbosa, utilizou-se a abordagem de Norma efetuada por Coseriu, e complementou-se com noções de Estatística Lexical, propostas por Muller, sobretudo as referentes a freqüência. Ao final, chegou-se a um conjunto de 202 cartogramas lingüísticos, que não apenas revelam a norma semântico-lexical do Grande ABC, como também constituem um retrato, ainda que parcial, do falar paulista. / Located in the state of São Paulo, the region known as the Great ABC paulista is comprised of seven cities: Santo André, São Bernardo do Campo, São Caetano do Sul, Diadema, Mauá, Ribeirão Pires and Rio Grande da Serra. This region has considerable importance in the sociopolitical and economic-cultural contexts in Brazil. Among a number of characteristics, is possible to think that the great populational mobility in this region make possible to believe that, nowadays, there are few users of the linguistic norm of the region. That is the reason why it is necessary to rescue the semantic-lexical variation of the language spoken in the Great ABC area, as a way of registering this community\'s linguistic memory. This work attempts to register part of this linguistic ensemble and its general objective is the description of the semantic-lexical norm of the Great ABC paulista region, in order to build the Semantic- Lexical Atlas of the Great ABC region. Based on the postulates of contemporary Geolinguistics, we have applied the Semantic-Lexical Questionnaire of the AliB Project, version 2001, in nine points of the region, on 36 subjects belonging to both genders - female and male - and subdivided in two age groups - people aged between 18 and 30, and between 50 and 65. The answers obtained during the interviews were the basis for the elaboration of a semantic-lexical database, available on CD-ROM. Afterwards, these data were cartographically treated and documented, so that it would be possible to have a panorama of the semantic-lexical diversity of the Great ABC region\'s speech. Besides the Geolinguistics and Lexicology theoretical and methodological references, such as works by Pottier and Barbosa, we have used the normative approach elaborated by Coseriu, and the notions of Lexical Statistics, proposed by Muller, mainly those concerning with frequency. At last, we have made 202 linguistic cartograms, which not only reveal the semantic-lexical norm of the Great ABC region, but also constitute a portrait, although partial, of the oral speech of the state of São Paulo. Atlas lingüístico Dialetologia Geolingüística Português do Brasil Região do Grande ABC paulista Brazilian Portuguese Dialectology Geolinguistics Great ABC region Linguistic atlas
40	Gramaticalização do aspecto iterativo no português do Brasil: o verbo viver / Gramaticalization of the iterative aspect in the Brazilian portuguese: the verb to live Jorge Mariano dos Santos 30 June 2010 (has links) O objetivo deste trabalho consiste na análise do processo de gramaticalização do verbo viver, que parte de sua função original como verbo pleno e assume novas funções, ao ponto de se recategorizar como verbo quase-auxiliar, exprimindo aspecto continuativo. Segundo Heine (1993), verbos plenos produtivos nas línguas podem ser submetidos a processos de auxiliarização em níveis e forças distintos, e esses níveis e forças podem ser representados pelos padrões funcionais do verbo viver. Demonstraremos que esses deslizamentos unidirecionais movidos por abstratização são guiados por processos cognitivos correlacionados à mudança no estatuto categorial do item em processo de gramaticalização. Para fazê-lo, utilizaremos a escala de categorias cognitivas propostas por Heine, Claudi e Hünnemeyer (1991, p. 55): pessoa > objeto > processo > espaço > tempo > qualidade, em sua proposta de versão sugerida no bojo do Grupo de Pesquisa em Mudança Gramatical (Lima-Hernandes, 2009) para: pessoa > objeto > instrumento > espaço > tempo > processo > qualidade. Para realizar essa tarefa, faremos uso de um corpus composto pelos seguintes materiais: i. Dossiês do DEOPS/SP (1924 -1945), nos quais se encontram informações e documentos fundamentais para uma compreensão mais abrangente da vida política, social e cultural de São Paulo na primeira metade do século XX; ii. Debates exibidos na MTV (Music Television edição brasileira), recolhidos em um programa semanal que discute os assuntos mais polêmicos do momento com convidados especialistas, profissionais, estudantes e pessoas comuns. iii. Entrevistas variadas concedidas ao jornal Folha de S. Paulo e à revista VEJA. Com base no corpus escrito, iniciamos um exercício de busca das motivações que fazem o verbo viver ser empregado em funções mais abstratizadas. Essa busca permitirá hipotetizar a rota de mudança e norteará a hipotetização do gatilho que fez com que o falante da língua portuguesa no Brasil reanalisasse expressões linguísticas com o verbo viver pleno em estruturas de auxialirização. / The objective of this research consists in the analysis of the process of grammaticalization of the verb to live, that it has left of its original function as full verb and assumes new functions, to the point of recategorization as Quasi-auxiliary verb, expressing continuative aspect. According to Heine (1993), productive full verbs in the languages can be submitted to auxiliarization processes in distinct levels and strength, and these levels and strength may be represented by the functional standards of the verb to live. We will demonstrate that these unidirectional movements stimulated by abstraction are guided by cognitive processes correlated to the change in the categorial statute of the item in gramaticalization process. To demonstrate it, we will use the scale of cognitive categories presented by Heine, Claudi and Hünnemeyer (1991, p. 55): person > object > process > space > time > quality, in his proposition of version suggested by the Group of Research in Grammatical (Lima-Hernandes, 2009) Change to: person > object > instrument > space > time > process > quality. To carry through this research, we will use corpus arranged by the following materials: i. Dossiers of the DEOPS/SP (1924 -1945), in which it might be possible find basic information and documents that permit a better understanding of the politic, social and cultural life in São Paulo in the first half of century XX; II. Debates shown on MTV (Music Television - Brazilian edition), collected in a weekly program that argues the most controversial subjects of the moment with guests like: specialists, professionals, students and common people. III. Varying interviews granted to Folha de S. Paulo newspaper and to VEJA magazine. On the basis of written corpus, we initiate an exercise of search of the motivations that allow the verb to live being used in more abstracted function. This search will allow to get the hypothesis the change route and guide the hypothecal trigger that made with that the speaker of Portuguese language in Brazil has reanalyzed linguistic expressions with the verb to live in its full meaning in auxiliarization structures. Aspecto verbal Auxiliarização Gramaticalização Português do Brasil Verbo viver Auxiliarization Brazilian portuguese language Gramaticalization Verb to live Verbal aspect

Search results