Global ETD Search

1	As passivas na produção escrita de brasileiros aprendizes de Espanhol como língua estrangeira / The passive in the written production of brazilian students who learn Spanish as a foreign language Benivaldo Jose de Araujo Junior 22 March 2007 (has links) As construções passivas no Português Brasileiro e no Espanhol apresentam tanto tendências comuns, quanto assimetrias. Este trabalho tem o propósito de investigar os efeitos desse fenômeno na aquisição/aprendizagem de Espanhol por estudantes brasileiros. Inicialmente, propõe-se uma descrição das construções passivas nas duas línguas. Em seguida, faz-se uma análise contrastiva dessas construções no Português Brasileiro e no Espanhol. Finalmente, investiga-se o comportamento das construções passivas (sobretudo as perifrásticas e as lexicais) na produção escrita de brasileiros aprendizes de Espanhol língua estrangeira. Os resultados obtidos na análise dos corpora sugerem algumas hipóteses sobre os fatores que possivelmente influenciam a preferência dos aprendizes por determinadas construções em detrimento de outras / Passive constructions in Brazilian Portuguese and Spanish present both common tendencies and assimetries. The aim of this project is to investigate the effects of such phenomenon on Spanish acquisition/learning process by brazilian students. Initially, a description of passive constructions is proposed for both languages. After that, a contrastive analysis is made of those constructions in Brazilian Portuguese and Spanish. Finally, the behavior of passive constructions is analyzed in the written production of brazilian students who learn Spanish as a foreign language. Results from corpora analysis suggest some hypotheses on the factors which possibly influence learners\' choices for certain constructions to the detriment of others Análise contrastiva Construções passivas Funções pragmáticas Lingüística de corpus Papéis temáticos Contrastive analysis Corpus linguistics Passive constructions Pragmatic functions Thematic roles
2	As passivas na produção escrita de brasileiros aprendizes de Espanhol como língua estrangeira / The passive in the written production of brazilian students who learn Spanish as a foreign language Araujo Junior, Benivaldo Jose de 22 March 2007 (has links) As construções passivas no Português Brasileiro e no Espanhol apresentam tanto tendências comuns, quanto assimetrias. Este trabalho tem o propósito de investigar os efeitos desse fenômeno na aquisição/aprendizagem de Espanhol por estudantes brasileiros. Inicialmente, propõe-se uma descrição das construções passivas nas duas línguas. Em seguida, faz-se uma análise contrastiva dessas construções no Português Brasileiro e no Espanhol. Finalmente, investiga-se o comportamento das construções passivas (sobretudo as perifrásticas e as lexicais) na produção escrita de brasileiros aprendizes de Espanhol língua estrangeira. Os resultados obtidos na análise dos corpora sugerem algumas hipóteses sobre os fatores que possivelmente influenciam a preferência dos aprendizes por determinadas construções em detrimento de outras / Passive constructions in Brazilian Portuguese and Spanish present both common tendencies and assimetries. The aim of this project is to investigate the effects of such phenomenon on Spanish acquisition/learning process by brazilian students. Initially, a description of passive constructions is proposed for both languages. After that, a contrastive analysis is made of those constructions in Brazilian Portuguese and Spanish. Finally, the behavior of passive constructions is analyzed in the written production of brazilian students who learn Spanish as a foreign language. Results from corpora analysis suggest some hypotheses on the factors which possibly influence learners\' choices for certain constructions to the detriment of others Análise contrastiva Construções passivas Contrastive analysis Corpus linguistics Funções pragmáticas Lingüística de corpus Papéis temáticos Passive constructions Pragmatic functions Thematic roles
3	VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil / VerbNet.BR: the semi-automatic construction of an on-line and domain-independent Verb Lexicon for Brazilian Portuguese Scarton, Carolina Evaristo 28 January 2013 (has links) A criação de recursos linguístico-computacionais de base, como é o caso dos léxicos computacionais, é um dos focos da área de Processamento de Línguas Naturais (PLN). Porém, a maioria dos recursos léxicos computacionais existentes é específica da língua inglesa. Dentre os recursos já desenvolvidos para a língua inglesa, tem-se a VerbNet, que é um léxico com informações semânticas e sintáticas dos verbos do inglês, independente de domínio, construído com base nas classes verbais de Levin, além de possuir mapeamentos para a WordNet de Princeton (WordNet). Considerando que há poucos estudos computacionais sobre as classes de Levin, que é a base da VerbNet, para línguas diferentes do inglês, e dada a carência de um léxico para o português nos moldes da VerbNet do inglês, este trabalho teve como objetivo a criação de um recurso léxico para o português do Brasil (chamado VerbNet.Br), semelhante à VerbNet. A construção manual destes recursos geralmente é inviável devido ao tempo gasto e aos erros inseridos pelo autor humano. Portanto, há um grande esforço na área para a criação destes recursos apoiada por técnicas computacionais. Uma técnica reconhecida e bastante usada é o uso de aprendizado de máquina em córpus para extrair informação linguística. A outra é o uso de recursos já existentes para outras línguas, em geral o inglês, visando à construção de um novo recurso alinhado, aproveitando-se de atributos multilíngues/cross-linguísticos (cross-linguistic) (como é o caso da classificação verbal de Levin). O método proposto neste mestrado para a construção da VerbNet.Br é genérico, porque pode ser utilizado para a construção de recursos semelhantes para outras línguas, além do português do Brasil. Além disso, futuramente, será possível estender este recurso via criação de subclasses de conceitos. O método para criação da VerbNet.Br é fundamentado em quatro etapas: três automáticas e uma manual. Porém, também foram realizados experimentos sem o uso da etapa manual, constatando-se, com isso, que ela pode ser descartada sem afetar a precisão e abrangência dos resultados. A avaliação do recurso criado foi realizada de forma intrínseca qualitativa e quantitativa. A avaliação qualitativa consistiu: (a) da análise manual de algumas classes da VerbNet, criando um gold standard para o português do Brasil; (b) da comparação do gold standard criado com os resultados da VerbNet.Br, obtendo resultados promissores, por volta de 60% de f-measure; e (c) da comparação dos resultados da VerbNet.Br com resultados de agrupamento de verbos, concluindo que ambos os métodos apresentam resultados similares. A avaliação quantitativa considerou a taxa de aceitação dos membros das classes da VerbNet.Br, apresentando resultados na faixa de 90% de aceitação dos membros em cada classe. Uma das contribuições deste mestrado é a primeira versão da VerbNet.Br, que precisa de validação linguística, mas que já contém informação para ser utilizada em tarefas de PLN, com precisão e abrangência de 44% e 92,89%, respectivamente / Building computational-linguistic base resources, like computational lexical resources (CLR), is one of the goals of Natural Language Processing (NLP). However, most computational lexicons are specific to English. One of the resources already developed for English is the VerbNet, a lexicon with domain-independent semantic and syntactic information of English verbs. It is based on Levin\'s verb classification, with mappings to Princeton\'s WordNet (WordNet). Since only a few computational studies for languages other than English have been made about Levin\'s classification, and given the lack of a Portuguese CLR similar to VerbNet, the goal of this research was to create a CLR for Brazilian Portuguese (called VerbNet.Br). The manual building of these resources is usually unfeasible because it is time consuming and it can include many human-made errors. Therefore, great efforts have been made to build such resources with the aid of computational techniques. One of these techniques is machine learning, a widely known and used method for extracting linguistic information from corpora. Another one is the use of pre-existing resources for other languages, most commonly English, to support the building of new aligned resources, taking advantage of some multilingual/cross-linguistic features (like the ones in Levin\'s verb classification). The method proposed here for the creation of VerbNet.Br is generic, therefore it may be used to build similar resources for languages other than Brazilian Portuguese. Moreover, the proposed method also allows for a future extension of the resource via subclasses of concepts. The VerbNet.Br has a four-step method: three automatic and one manual. However, experiments were also carried out without the manual step, which can be discarded without affecting precision and recall. The evaluation of the resource was intrinsic, both qualitative and quantitative. The qualitative evaluation consisted in: (a) manual analysis of some VerbNet classes, resulting in a Brazilian Portuguese gold standard; (b) comparison of this gold standard with the VerbNet.Br results, presenting promising results (almost 60% of f-measure); and (c), comparison of the VerbNet.Br results to verb clustering results, showing that both methods achieved similar results. The quantitative evaluation considered the acceptance rate of candidate members of VerbNet.Br, showing results around 90% of acceptance. One of the contributions of this research is to present the first version of VerbNet.Br. Although it still requires linguistic validation, it already provides information to be used in NLP tasks, with precision and recall of 44% and 92.89%, respectively Alternâncias sintáticas Classes de Levin Computational lexical resources Diathesis alternations Levin verb classes Papéis temáticos Recursos léxicos computacionais Thematic roles VerbNet VerbNet VerbNet.Br VerbNet.Br WordNet WordNet.Br WordNet.Br WorldNet
4	O agente e o paciente em língua portuguesa : caracterização em propriedades semânticas e estudo diacrônico. Oliveira, Mariana Fagundes de January 2009 (has links) Submitted by Edileide Reis (leyde-landy@hotmail.com) on 2013-05-13T19:08:18Z No. of bitstreams: 2 Mariana Fagundes de Oliveira P2.pdf: 929031 bytes, checksum: 52d1ca8a565e251f55ea6f25ee989211 (MD5) Mariana Fagundes de Oliveira P1.pdf: 1290183 bytes, checksum: 1e51a681bd31465bfc4f0c538c8f35cc (MD5) / Approved for entry into archive by Alda Lima da Silva(sivalda@ufba.br) on 2013-05-16T17:08:52Z (GMT) No. of bitstreams: 2 Mariana Fagundes de Oliveira P2.pdf: 929031 bytes, checksum: 52d1ca8a565e251f55ea6f25ee989211 (MD5) Mariana Fagundes de Oliveira P1.pdf: 1290183 bytes, checksum: 1e51a681bd31465bfc4f0c538c8f35cc (MD5) / Made available in DSpace on 2013-05-16T17:08:52Z (GMT). No. of bitstreams: 2 Mariana Fagundes de Oliveira P2.pdf: 929031 bytes, checksum: 52d1ca8a565e251f55ea6f25ee989211 (MD5) Mariana Fagundes de Oliveira P1.pdf: 1290183 bytes, checksum: 1e51a681bd31465bfc4f0c538c8f35cc (MD5) Previous issue date: 2009 / Os papéis temáticos Agente e Paciente constituem o objeto de estudo deste trabalho, cujos objetivos são caracterizá-los – com base em dados da língua portuguesa, no domínio do predicador verbal, considerando o predicado global e o contexto situacional – em propriedades semânticas prototípicas e não-prototípicas, na perspectiva da Semântica Lexical e numa abordagem representacional ou mentalista; num estudo descritivocomparativo em textos do português arcaico e do português europeu contemporâneo nas modalidades oral e escrita, listar os verbos com que ocorrem nos corpora de pesquisa os diferentes tipos de Agente e de Paciente propostos, procurando alguma situação de mudança ao nível da estrutura temática dos verbos, e descrever as configurações sintáticas do Agente e do Paciente, numa abordagem diacrônica que incide na relação entre a sintaxe e a semântica. Na bibliografia sobre o assunto, o Agente e o Paciente recebem definições variáveis, por vezes imprecisas. Neste estudo, tentando uma melhor compreensão dessas noções, é apresentada uma classificação para o Agente e para o Paciente, trabalhando com seis propriedades semânticas: desencadeador, controle, intenção, causa, afetado e experienciador. Desta forma, são propostos dois tipos de Agente: Agente prototípico e Agente afetado, e três tipos de Paciente: Paciente prototípico, Paciente experienciador e Paciente agentivo, num continuum que vai do Agente e do Paciente mais prototípicos ao Agente e ao Paciente menos prototípicos; no ponto em que se apresenta, no continuum, o Agente menos prototípico, é quando começa o Paciente prototípico, e, vice-versa, no ponto onde se apresenta o Paciente menos prototípico, que é o Paciente agentivo, é quando começa o Agente mais prototípico. Listando os verbos com que ocorrem os diferentes tipos de Agente e de Paciente nos corpora diacrônicos analisados, não foi verificada nenhuma situação de mudança da estrutura temática dos verbos; foi possível, porém, em relação ao Paciente agentivo, traçar um grupo específico de verbos que o selecionam. Quanto às configurações sintáticas do Agente e do Paciente, foi constatada alguma mudança na história do português, e, comparando as modalidades oral e escrita da língua, verificada alguma diferença. / Salvador Papéis temáticos Agente e paciente Semântica lexical Abordagem representacional Protótipos Sintaxe Diacronia Thematic role Agent and patient Lexical semantic Representational approach Prototypes Syntax Diachrony Linguística histórica
5	A representação de atores sociais em corpus de redações estilo ENEM : uma análise sob a ótica da semântica de papéis Sousa, Vitor Bernardes Rufino 28 July 2016 (has links) O presente trabalho possui como foco de estudo a análise da representação de papéis temáticos desempenhados por atores sociais, em redações escritas nos moldes da produção textual exigida pelo Exame Nacional do Ensino Médio (Enem). Nesse sentido, o participante deve produzir um texto em prosa, do tipo dissertativo-argumentativo, na modalidade escrita formal da Língua Portuguesa, sobre o tema indicado de modo que apresente uma ou mais propostas de intervenção social para o(s) problema(s) discutido(s) no texto elaborado e que respeite os direitos humanos. Nosso corpus foi composto por 1.405 redações com conteúdo equivalente a 367.565 tokens (total de palavras) e 22.707 types (total de palavras distintas), produzidas entre 2009 e 2014, com as características exigidas pelo Enem e que estão disponíveis no Banco de redações (http://educacao.uol.com.br/bancoderedacoes/) do site UOL Educação (http://educacao.uol.com.br/), o qual possui uma seção especializada em produção textual que disponibiliza propostas de redação para os internautas assim como realiza a correção de vários textos enviados pelos interessados. Diante disso, nosso principal objetivo foi compreender os usos das representações para atender aos requisitos da prova pelo viés de teorias, metodologias e trabalhos da Linguística Cognitiva, especificamente quanto à Gramática de Papéis (CANÇADO, 2000; 2008), da Análise Crítica do Discurso, especialmente sobre a representação de atores sociais (van LEEUWEN, 1996; 2008), da Linguística Sistêmico-Funcional (HALLIDAY e MATTHIESSEN, 2004) e da Linguística de Corpus (NOVODVORSKI, 2008; 2013 e BERBER SARDINHA, 2004; 2009), tanto em pesquisa baseada em corpus quanto guiada pelo corpus com o auxílio de ferramentas do programa WordSmith Tools®, versão 6.0 (SCOTT, 2012). Assim, conheceu-se as características da proposição para a produção textual do Enem, a principal prova do Brasil que possibilita o ingresso no ensino superior, e os aspectos relevantes de textos elaborados nesse contexto. Assim, realizamos uma análise que nos permitiu identificar e descrever quais os principais papéis temáticos desempenhados pelos atores sociais por nós selecionados de nosso corpus de estudo, essa análise perpassou pela identificação de campos semânticos e investigação das relações semânticas constituídas entre os verbos (processos) e seus sujeitos e complementos (argumentos, atores sociais ou participantes). / This work has as focus of study the analysis of thematic roles representation performed by social actors in texts written according to the patterns demanded by the Exame Nacional do Ensino Médio (Enem). Such examination demands the participant to produce an argumentative dissertation, in prose, using the formal register of Portuguese language, and considering a suggested theme. Also, it is necessary for the participant to present one or more intervention proposals to the problem(s) discussed in the text, having in mind the respect for human rights. Thus, in order to develop the present work, it was used a corpus of study composed by 1.405 texts. Their content was equivalent to 367.565 tokens (running words) and 22.707 types (distinct words), produced between 2009 and 2014, and followed the characteristics demanded by Enem, which are available in Banco de redações (http://educacao.uol.com.br/bancoderedacoes/) from UOL Educação website (http://educacao.uol.com.br/). This website has a section specialized in text production where thematic proposals are provided, and which correct many texts sent by web surfers. Accordingly, the goal of this work was to comprehend the use of representations in order to meet the Enem examination requirements. For this purpose, this research was guided by the bias of theory, methodology and works from Cognitive Linguistics, specifically in which concerns to Grammar of roles (CANÇADO, 2000; 2008). Also, it was based on works from Critical Discourse Analyses, specially about the representation of social agents (van LEEUWEN, 1996; 2008), from Functional-systemic Linguistics (HALLIDAY e MATTHIESSEN, 2004) and from the Corpus Linguistics (NOVODVORSKI, 2008; 2013 e BERBER SARDINHA, 2004; 2009). It was considered both researches based on and guided by corpus, with the aid of the tools provided by the software WordSmith Tools® 6,0 version (SCOTT, 2012). In light of this, it was possible to recognize the characteristics of the proposition to the text production of Enem – considered the most important examination in Brazil that enable the entry into higher education – as well as relevant aspects of texts approached in this context. Therefore, it was accomplished an analysis that allowed to identify and to describe the main thematic roles performed by the social actors selected from this work's corpus of study. This analysis went through the identification of semantic fields and the investigation of the semantic relation constituted between verbs (processes) and its subjects and complements (arguments, social actors, and participants). / Dissertação (Mestrado) Linguística Linguística de corpus Redação acadêmica Análise linguística (Linguística) Papéis temáticos Atores sociais Análise de redações Enem Thematic roles Social agents Corpus linguistics Texts analysis
6	VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil / VerbNet.BR: the semi-automatic construction of an on-line and domain-independent Verb Lexicon for Brazilian Portuguese Carolina Evaristo Scarton 28 January 2013 (has links) A criação de recursos linguístico-computacionais de base, como é o caso dos léxicos computacionais, é um dos focos da área de Processamento de Línguas Naturais (PLN). Porém, a maioria dos recursos léxicos computacionais existentes é específica da língua inglesa. Dentre os recursos já desenvolvidos para a língua inglesa, tem-se a VerbNet, que é um léxico com informações semânticas e sintáticas dos verbos do inglês, independente de domínio, construído com base nas classes verbais de Levin, além de possuir mapeamentos para a WordNet de Princeton (WordNet). Considerando que há poucos estudos computacionais sobre as classes de Levin, que é a base da VerbNet, para línguas diferentes do inglês, e dada a carência de um léxico para o português nos moldes da VerbNet do inglês, este trabalho teve como objetivo a criação de um recurso léxico para o português do Brasil (chamado VerbNet.Br), semelhante à VerbNet. A construção manual destes recursos geralmente é inviável devido ao tempo gasto e aos erros inseridos pelo autor humano. Portanto, há um grande esforço na área para a criação destes recursos apoiada por técnicas computacionais. Uma técnica reconhecida e bastante usada é o uso de aprendizado de máquina em córpus para extrair informação linguística. A outra é o uso de recursos já existentes para outras línguas, em geral o inglês, visando à construção de um novo recurso alinhado, aproveitando-se de atributos multilíngues/cross-linguísticos (cross-linguistic) (como é o caso da classificação verbal de Levin). O método proposto neste mestrado para a construção da VerbNet.Br é genérico, porque pode ser utilizado para a construção de recursos semelhantes para outras línguas, além do português do Brasil. Além disso, futuramente, será possível estender este recurso via criação de subclasses de conceitos. O método para criação da VerbNet.Br é fundamentado em quatro etapas: três automáticas e uma manual. Porém, também foram realizados experimentos sem o uso da etapa manual, constatando-se, com isso, que ela pode ser descartada sem afetar a precisão e abrangência dos resultados. A avaliação do recurso criado foi realizada de forma intrínseca qualitativa e quantitativa. A avaliação qualitativa consistiu: (a) da análise manual de algumas classes da VerbNet, criando um gold standard para o português do Brasil; (b) da comparação do gold standard criado com os resultados da VerbNet.Br, obtendo resultados promissores, por volta de 60% de f-measure; e (c) da comparação dos resultados da VerbNet.Br com resultados de agrupamento de verbos, concluindo que ambos os métodos apresentam resultados similares. A avaliação quantitativa considerou a taxa de aceitação dos membros das classes da VerbNet.Br, apresentando resultados na faixa de 90% de aceitação dos membros em cada classe. Uma das contribuições deste mestrado é a primeira versão da VerbNet.Br, que precisa de validação linguística, mas que já contém informação para ser utilizada em tarefas de PLN, com precisão e abrangência de 44% e 92,89%, respectivamente / Building computational-linguistic base resources, like computational lexical resources (CLR), is one of the goals of Natural Language Processing (NLP). However, most computational lexicons are specific to English. One of the resources already developed for English is the VerbNet, a lexicon with domain-independent semantic and syntactic information of English verbs. It is based on Levin\'s verb classification, with mappings to Princeton\'s WordNet (WordNet). Since only a few computational studies for languages other than English have been made about Levin\'s classification, and given the lack of a Portuguese CLR similar to VerbNet, the goal of this research was to create a CLR for Brazilian Portuguese (called VerbNet.Br). The manual building of these resources is usually unfeasible because it is time consuming and it can include many human-made errors. Therefore, great efforts have been made to build such resources with the aid of computational techniques. One of these techniques is machine learning, a widely known and used method for extracting linguistic information from corpora. Another one is the use of pre-existing resources for other languages, most commonly English, to support the building of new aligned resources, taking advantage of some multilingual/cross-linguistic features (like the ones in Levin\'s verb classification). The method proposed here for the creation of VerbNet.Br is generic, therefore it may be used to build similar resources for languages other than Brazilian Portuguese. Moreover, the proposed method also allows for a future extension of the resource via subclasses of concepts. The VerbNet.Br has a four-step method: three automatic and one manual. However, experiments were also carried out without the manual step, which can be discarded without affecting precision and recall. The evaluation of the resource was intrinsic, both qualitative and quantitative. The qualitative evaluation consisted in: (a) manual analysis of some VerbNet classes, resulting in a Brazilian Portuguese gold standard; (b) comparison of this gold standard with the VerbNet.Br results, presenting promising results (almost 60% of f-measure); and (c), comparison of the VerbNet.Br results to verb clustering results, showing that both methods achieved similar results. The quantitative evaluation considered the acceptance rate of candidate members of VerbNet.Br, showing results around 90% of acceptance. One of the contributions of this research is to present the first version of VerbNet.Br. Although it still requires linguistic validation, it already provides information to be used in NLP tasks, with precision and recall of 44% and 92.89%, respectively Alternâncias sintáticas Classes de Levin Papéis temáticos Recursos léxicos computacionais VerbNet VerbNet.Br WordNet.Br WorldNet Computational lexical resources Diathesis alternations Levin verb classes Thematic roles VerbNet VerbNet.Br WordNet WordNet.Br

1

Page generated in 0.0374 seconds