Global ETD Search

71	Learning non-verbal relations under open information extraction paradigm Xavier, Clarissa Castell? 12 March 2014 (has links) Made available in DSpace on 2015-04-14T14:50:19Z (GMT). No. of bitstreams: 1 466321.pdf: 1994049 bytes, checksum: fbbeef81814a876679c25f4e015925f5 (MD5) Previous issue date: 2014-03-12 / O paradigma Open Information Extraction - Open IE (Extra??o Aberta de Informa??es) de extra??o de rela??es trabalha com a identifica??o de rela??es n?o definidas previamente, buscando superar as limita??es impostas pelos m?todos tradicionais de Extra??o de Informa??es como a depend?ncia de dom?nio e a dif?cil escalabilidade. Visando estender o paradigma Open IE para que sejam extra?das rela??es n?o expressas por verbos a partir de textos em ingl?s, apresentamos CompIE, um componente que aprende rela??es expressas em compostos nominais (CNs), como (oil, extracted from, olive) - (?leo, extra?do da, oliva) - do composto nominal olive oil - ?leo de oliva, ou em pares do tipo adjetivo-substantivo (ASs), como (moon, that is, gorgeous) - (lua, que ?, linda) - do AS gorgeous moon (linda lua). A entrada do CompIE ? um arquivo texto, e sua sa?da ? um conjunto de triplas descrevendo rela??es bin?rias. Sua arquitetura ? composta por duas tarefas principais: Extrator de CNs e ASs (1) e Interpretador de CNs e ASs (2). A primeira tarefa gera uma lista de CNs e ASs a partir do corpus de entrada. A segunda tarefa realiza a interpreta??o dos CNs e ASs gerando as triplas que descrevem as rela??es extra?das do corpus. Para estudar a viabilidade da solu??o apresentada, realizamos uma avalia??o baseada em hip?teses. Um prot?tipo foi constru?do com o intuito de validar cada uma das hip?teses. Os resultados obtidos mostram que nossa solu??o alcan?a 89% de Precis?o e demonstram que o CompIE atinge sua meta de estender o paradigma Open IE extraindo rela??es expressas dentro dos CNs e ASs. / The Open Information Extraction (Open IE) is a relation extraction paradigm in which the target relationships cannot be specified in advance, and it aims to overcome the limitations imposed by traditional IE methods, such as domain-dependence and scalability. In order to extend Open IE to extract relationships that are not expressed by verbs from texts in English, we introduce CompIE, a component that learns relations expressed in noun compounds (NCs), such as (oil, extracted from, olive) from olive oil, or in adjectivenoun pairs (ANs), such as (moon, that is, gorgeous) from gorgeous moon. CompIE input is a text file, and the output is a set of triples describing binary relationships. The architecture comprises two main tasks: NCs and ANs Extraction (1) and NCs and ANs Interpretation (2). The first task generates a list of NCs and ANs from the input corpus. The second task performs the interpretation of NCs and ANs and generates the tuples that describe the relations extracted from the corpus. In order to study CompIE s feasibility, we perform an evaluation based on hypotheses. In order to implement the strategies to validate each hypothesis we have built a prototype. The results show that our solution achieves 89% Precision and demonstrate that CompIE reaches its goal of extending Open IE paradigm extracting relationships within NCs and ANs. INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL
72	SiSe : medida de similaridade sem?ntica entre ontologias em portugu?s Freitas, Juliano Baldez de 26 January 2007 (has links) Made available in DSpace on 2015-04-14T14:50:24Z (GMT). No. of bitstreams: 1 393159.pdf: 2682367 bytes, checksum: de7318c27ade99fcf0f367ee38778cfb (MD5) Previous issue date: 2007-01-26 / Este trabalho consiste na adapta??o de uma medida de similaridade sem?ntica para o mapeamento entre ontologias em portugu?s. A medida SiSe (Similaridade Sem?ntica) apresentada neste trabalho adapta a proposta Mapeamento Taxon?mico, de Maedche e Staab [Maedche e Staab 2002]. A medida SiSe faz uma compara??o da similaridade entre termos de ontologias distintas atrav?s da an?lise da hierarquia dos mesmos. Utilizamos o conceito de "Semantic Cotopy" e "Common Semantic Cotopy", os quais formam um conjunto para cada um dos termos comparados. Cada conjunto ? composto pelo termo, pelos subconceitos e superconceitos deste termo, todos representados por seus stems, atrav?s de um recurso de Processamento da Linguagem Natural, o stemmer PortugueseStemmer desenvolvido por Orengo e Huyck [Orengo e Huyck 2001]. Nossa medida adota uma estrat?gia para o mapeamento entre ontologias que envolve a an?lise das linguagens utilizadas na descri??o das ontologias (OWL, RFDS, etc), abstraindo as sintaxes e normalizando em uma linguagem XML com as rela??es hier?rquicas de hipon?mia e hiperon?mia das ontologias. A medida de similaridade SiSe compara as ontologias atrav?s das rela??es hier?rquicas que as mesmas possuem, desta forma o coeficiente resultante ? a similaridade sem?ntico-estrutural entre os termos das ontologias. A avalia??o da medida SiSe ? realizada atrav?s de um "Golden mapping", ou mapeamento dourado, que consiste na avalia??o da similaridade de algumas ontologias por humanos confrontando com os resultados da medida SiSe. Esta medida ? utilizada para auxiliar no mapeamento entre ontologias visando o reuso e a integra??o de informa??o INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL ONTOLOGIA SEM?NTICA
73	A proposal for an architecture to extract information from sms messages during emergency situations Monteiro, Douglas Machado 16 March 2015 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-05-15T11:49:34Z No. of bitstreams: 1 468523 - Texto Completo.pdf: 3578868 bytes, checksum: 4d26c3b12a22330579e4b83f7414ebc4 (MD5) / Made available in DSpace on 2015-05-15T11:49:34Z (GMT). No. of bitstreams: 1 468523 - Texto Completo.pdf: 3578868 bytes, checksum: 4d26c3b12a22330579e4b83f7414ebc4 (MD5) Previous issue date: 2015-03-16 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / In mass emergencies, a fair amount of information is exchanged via SMS messages. These messages tend to be informal and to contain abbreviations and misspellings, which makes them difficult to treat. This is a problem for current Information Extraction tools, especially for messages in Portuguese. This work proposes an architecture to extract information from SMS messages during emergencies. The architecture comprises four components: Linguistic Processing, Temporal Processing, Event Processing, and Information Fusion. We also defined an SMS corpus building process. From the proposal of this architecture, we conducted a case study, which included building BraCorpSMS, a corpus of SMS messages received by an electric utility company. We built a prototype in Python using NLTK to validate the architecture. The prototype had its Information Extraction components evaluated achieving Precision of 88%, Recall of 59% and balanced F-measure of 71%. The results indicate improvement opportunities, but as this is the first work for Portuguese facing processing SMS messages during emergency situations, it also serves as a roadmap for future work in the area. / Durante situa??es de emerg?ncia, uma grande quantidade de informa??o ? trocada via mensagens SMS. Estas mensagens costumam ter escrita informal e cont?m abrevia??es e erros de grafia, o que dificulta seu processamento. Este ? um problema para as ferramentas de Extra??o de Informa??o atuais, especialmente para o Portugu?s. Este trabalho prop?e uma arquitetura de extra??o de informa??o de mensagens SMS em situa??es de emerg?ncia. A arquitetura contempla quatro componentes: processamento lingu?stico, processamento temporal, processamento de eventos e fus?o da informa??o. Tamb?m se define um processo para cria??o de corpus de SMSs. A partir da arquitetura proposta, foi realizado um estudo de caso que incluiu a constru??o do BraCorpSMS, um corpus de mensagens SMS recebidos por uma companhia de energia el?trica e um prot?tipo em Python utilizando NLTK para validar a arquitetura. O prot?tipo teve seus componentes de Extra??o de Informa??o avaliados, obtendo 88% de Precis?o, 59% de Cobertura e 71% de Medida-F. Os resultados indicam oportunidades de avan?os, mas, sendo este o primeiro trabalho para o Portugu?s voltado para o processamento de mensagens SMS em situa??es de emerg?ncia, tamb?m serve de roteiro para trabalhos futuros nesta ?rea. INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL RECUPERA??O DA INFORMA??O
74	Feature-level sentiment analysis applied to brazilian portuguese reviews Freitas, Larissa Astrogildo de 23 March 2015 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-05-19T12:00:48Z No. of bitstreams: 1 468945 - Txto Completo.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) / Made available in DSpace on 2015-05-19T12:00:48Z (GMT). No. of bitstreams: 1 468945 - Txto Completo.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) Previous issue date: 2015-03-23 / Funda??o de Amparo ? Pesquisa do Estado do Rio Grande do Sul - FAPERGS / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / Sentiment Analysis is the field of study that analyzes people?s opinions in texts. In the last decade, humans have come to share their opinions in social media on the Web (e.g., forum discussions and posts in social network sites). Opinions are important because whenever we need to take a decision, we want to know others? points of view. The interest of industry and academia in this field of study is partly due to its potential applications, such as: marketing, public relations and political campaign. Research in this field often considers English data, while data from other languages are less explored. It is possible realize data analysis in different levels, in this work we choose a finer-grain analysis, at aspect-level. Ontologies can represent aspects, that are ?part-of? an object or property of ?part-of? an object, we proposed a method for feature-level sentiment analysis using ontologies applied to Brazilian Portuguese reviews. In order to obtain a complete analysis, we recognized features explicit and implicit using ontologies. Relatively less work has been done about implicit feature identification. Finally, determine whether the sentiment in relation to the aspects is positive or negative using sentiment lexicons and linguistic rules. Our method is comprised of four steps: preprocessing, feature identification, polarity identification and summarizing. For evaluate this work, we apply our proposal method to a dataset of accommodation sector. According to our experiments, in general the best results were obtained when using TreeTagger, synsets with polarities from Onto.PT and linguistic rule (adjective position) for negative polarity identification and (baseline) for positive polarity identificatio / An?lise de sentimento ? o campo de estudo que analisa a opini?o de pessoas em textos. Na ?ltima d?cada, humanos t?m compartilhado suas opini?es em m?dias sociais na Web (por exemplo, f?runs de discuss?o e posts em sites de redes sociais). Opini?es s?o importantes porque sempre que necessitamos tomar uma decis?o, queremos saber o ponto de vista de outras pessoas. O interesse da ind?stria e da academia neste campo de estudo se deve a aplica??es potenciais, tais como: compra/venda, rela??es p?blicas e campanhas pol?ticas. Pesquisas neste campo muitas vezes consideram dados em ingl?s, enquanto dados em outros idiomas s?o pouco explorados. ? poss?vel realizar a an?lise dos dados em diferentes n?veis, neste trabalho optamos pela an?lise no n?vel de aspecto, na qual a granularidade ? mais fina. Como ontologias podem ser utilizadas para representar aspectos, que s?o ?parte-de? um objeto ou propriedade de ?parte-de? um objeto, propomos um m?todo para an?lise de sentimento aplicado a coment?rios em portugu?s brasileiro, sob o n?vel de aspecto usando ontologias. A fim de obter uma an?lise completa, reconhecemos aspectos expl?citos e impl?citos usando ontologias. Relativamente poucos trabalhos t?m sido feitos sobre identifica??o de aspectos impl?citos. Finalmente determinamos se o sentimento em rela??o aos aspectos ? positivo ou negativo usando l?xicos de sentimento e regras lingu?sticas. Nosso m?todo ? composto de quatro etapas: pr?-processamento, identifica??o de aspecto, identifica??o de polaridade e sumariza??o. Para avaliar este trabalho, aplicamos o m?todo proposto nos coment?rios do setor hoteleiro. De acordo com nosso experimento, o melhor resultado obtido foi quando utilizamos o TreeTagger, o synset com polaridade do Onto.PT e a regra lingu?stica (posi??o do adjetivo) na identifica??o da polaridade negativa e (baseline) na identifica??o da polaridade positiva INFORM?TICA ONTOLOGIA LINGU?STICA COMPUTACIONAL PROCESSAMENTO DA LINGUAGEM NATURAL
75	Extra??o de rela??es hipon?micas em corpora de l?ngua portuguesa Machado, Pablo Neves 26 March 2015 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-06-08T11:20:00Z No. of bitstreams: 1 470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5) / Made available in DSpace on 2015-06-08T11:20:00Z (GMT). No. of bitstreams: 1 470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5) Previous issue date: 2015-03-26 / Natural Language Processing (NLP) is a Computer Science area featured by its relevance to the development of applications that process large amounts of text or speech. In this paper we focus on texts in Portuguese, extracting from them hyponymic relations between entities, using a rules-based approach adapted from Hearst to English, and Freitas and Quental and Taba and Caseli to Portuguese. The prototype was executed over a corpus of Portuguese texts and the output was analyzed according to the reference author and rule sets. The evaluation process followed the one proposed by Freitas and Quental with human judgment, and the results are compared to those reported in the main references. The dissertation also studies in detail the most common errors identified. / O Processamento da Linguagem Natural (PLN) ? uma ?rea da Ci?ncia da Computa??o destacada por sua relev?ncia para o desenvolvimento de aplica??es em processamento de grandes quantidades de documentos textuais ou orais. Neste trabalho focamos nos textos em l?ngua portuguesa, deles extraindo rela??es hipon?micas entre entidades, usando uma abordagem baseada em regras adaptadas dos trabalhos de Hearst para o ingl?s, Freitas e Quental e Taba e Caseli para o portugu?s, aqui complementadas. Para validar a proposta foi desenvolvido um prot?tipo que extrai rela??es hipon?micas de corpora em l?ngua portuguesa. O prot?tipo foi executado sobre corpus de textos e os resultados obtidos foram analisados tanto por fonte de refer?ncia como por grupos de regras. O processo avaliativo seguiu o proposto por Freitas e Quental com avalia??o humana, e as medidas obtidas s?o comparadas com as relatadas nas principais fontes de refer?ncia. A disserta??o ainda estuda em detalhe os erros mais frequentes identificados. INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL AN?LISE SEM?NTICA (PROGRAMA??O)
76	Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia Weber, Cristofer 16 March 2015 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-12-14T19:55:10Z No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) / Made available in DSpace on 2015-12-14T19:55:11Z (GMT). No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015-03-16 / Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. / Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obten??o destes exemplos pode ser um gargalo. Neste trabalho n?s investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem dispon?veis de forma gratuita, podem ser utilizados como corpus para a classifica??o de entidades nomeadas, uma tarefa fundamental de extra??o de informa??es e um passo necess?rio para outras tarefas como extra??o de rela??es e resolu??o de co-refer?ncias. INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGU?STICA COMPUTACIONAL
77	Identifying potential conflicts between norms in contracts Aires, Jo?o Paulo de Souza 07 August 2015 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-04-18T11:41:31Z No. of bitstreams: 1 DIS_JOAO_PAULO_DE_SOUZA_AIRES_COMPLETO.pdf: 962726 bytes, checksum: 42f46ef4c73e4f45496827e72b7fbf27 (MD5) / Made available in DSpace on 2016-04-18T11:41:31Z (GMT). No. of bitstreams: 1 DIS_JOAO_PAULO_DE_SOUZA_AIRES_COMPLETO.pdf: 962726 bytes, checksum: 42f46ef4c73e4f45496827e72b7fbf27 (MD5) Previous issue date: 2015-08-07 / Contracts formally represent agreements between parties and often involve the exchange of goods and services. In contracts, norms define the expected behaviors of the parties using deontic statements, such as obligations, permissions, and prohibitions. However, norms may conflict invalidating themselves and producing a contract inconsistency. A conflict arises when two or more norms are applied to the same context but have different deontic statements, such as permissions x obligations and prohibitions x obligations. The identification of such conflicts is often made by humans, which makes the task time consuming and error-prone. In order to automate such identification, in this work we propose an approach to identify potential conflicts between norms in contracts written in natural language. We build a two-phase approach that extracts norms and norm elements from contracts, creating a norm representation that we use to compare norms and identify potential conflicts. We evaluated the approach using a corpus of contracts with norm conflicts inserted, and we measured the accuracy for different cases of conflict, which resulted on values higher than 70%. / Contratos s?o utilizados para formalizar acordos envolvendo troca de bens e servi?os entre duas ou mais partes. Eles definem a??es esperadas durante o per?odo de vig?ncia do contrato atrav?s de normas. Tais normas seguem conceitos baseados em l?gica de?ntica, definindo permiss?es, proibi??es e obriga??es. No entanto, conflitos podem ser gerados quando duas normas s?o aplicadas a um mesmo contexto tendo sentidos de?nticos diferentes, como a proibi??o e a obriga??o da realiza??o de uma mesma a??o. Estes conflitos invalidam as normas e criam uma inconsist?ncia para o contrato. Para evit?-los ? necess?rio que um revisor leia as normas e encontre quais apresentam elementos conflitantes. Uma vez que contratos podem ser longos e complexos, esta tarefa consome tempo e ? pass?vel de erro humano. Para automatizar o processo de identifica??o de conflitos, neste trabalho criamos uma abordagem que busca identificar potenciais conflitos entre normas atrav?s da compara??o de suas estruturas. Nossa abordagem ? dividida em duas fases: na primeira, identificamos as normas e seus elementos dentro de um contrato; na segunda, utilizamos os elementos extra?dos para comparar diferentes normas e identificar quais apresentam caracter?sticas de um conflito normativo. N?s avaliamos a abordagem aplicando-a em contratos contendo conflitos e obtivemos resultados com acur?cia superior a 70%. L?GICA CONTRATOS - CLASSIFICA??O PROCESSAMENTO DA LINGUAGEM NATURAL INFORM?TICA
78	Heart: processos criativos (comunicativos) envolvendo mídias orgânicas e não-orgânicas Oliveira, Adriana Gomes de 14 December 2009 (has links) Made available in DSpace on 2016-04-26T18:18:21Z (GMT). No. of bitstreams: 1 Adriana Gomes de Oliveira.pdf: 28670380 bytes, checksum: beb3039565f99d6352fd5740c2749cbd (MD5) Previous issue date: 2009-12-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / From the cross-combination of biological and technological systems language emerges. Human language is manifested by operator mechanism in which minimal units of meaning can be found. These units are widely exploited in poetry and can be trained, since they are important hypermedia tools; in themselves they are communication tools. The informational contact with any and every system changes that system through what constitutes its form of organization through language that, in humans, have emotions and feelings as an ontology. Evolving technologies help us to infer about our own ontology or ontologies that make up reality due to organizational similarities. The field of art is a suitable field for tests with such technologies, where a specific fruition time-space is established. In this research we present this finding about the time-space specifically to the enjoyment of art when the proposition appears implemented with evolutionary tools exploring verbal language, since a differential coupling can manifests itself in the scope of verbal language, in these biological-technological interactions involving computers. This observation about language expands to human-computer interactions when hardware and software interfaces are not working properly / Do cruzamento de sistemas biológicos e tecnológicos emerge linguagem. Linguagem humana se manifesta por um mecanismo operador no qual unidades mínimas de significação podem ser encontradas. Essas unidades são largamente exploradas pela poesia e podem ser treinadas, visto que constituem-se como importantes ferramentas hipermidiáticas; em si mesmas, ferramentas de comunicação. O contato informacional com todo e qualquer sistema modifica-o pelo que constitui sua forma de organização via linguagem que, nos seres humanos, têm emoções e sentimentos como uma ontologia. Tecnologias evolutivas ajudam-nos a depreender sobre nossas próprias ontologias ou ontologias que compõem a realidade devido a isomorfismos organizacionais. O terreno da arte é o campo propício para experimentações com tais tecnologias, onde um tempo-espaço de fruição específico se instaura. Apresenta-se, nesta pesquisa esta constatação acerca do tempo-espaço específico para fruição de arte quando a proposição se apresenta implementada com ferramentas evolutivas explorando linguagem verbal, visto que um acoplamento diferenciado pode se manifestar no âmbito da linguagem verbal, nestas interações biológico-tecnológico envolvendo computadores. Esta constatação acerca da linguagem expande-se para interações Homemcomputadores quando interfaces de hardware e software não estejam funcionando corretamente Espaco e tempo na literatura Interacao homem-maquina
79	O efeito de priming sint?tico no processamento de senten?as ativas e passivas do portugu?s brasileiro / The syntatic priming effect in the processing of actives and passives sentences in brazilian portuguese Teixeira, Mariana Terra 29 March 2016 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-07-08T16:48:09Z No. of bitstreams: 1 DIS_MARIANA_TERRA_TEIXEIRA_COMPLETO.pdf: 1514041 bytes, checksum: 8ec22d9e8b8120788ca51b607cfac661 (MD5) / Made available in DSpace on 2016-07-08T16:48:09Z (GMT). No. of bitstreams: 1 DIS_MARIANA_TERRA_TEIXEIRA_COMPLETO.pdf: 1514041 bytes, checksum: 8ec22d9e8b8120788ca51b607cfac661 (MD5) Previous issue date: 2016-03-29 / Syntactic priming is the effect of repeating a sentence structure previously processed. In general, in natural languages, active sentences are more frequent than passive structures in spoken language (88% in English, 92% in Dutch, 89.5% in Brazilian Portuguese). Nonetheless, passive structures such as ?the woman was helped by the man? are also produced. It is possible to stimulate the production of passive (or infrequent) structures using a passive sentence as a prime (hence, syntactic priming). The effect of priming occurs when a passive sentence is offered and, subsequently, the speaker generates a passive sentence, indicating these two structures have a structural relation between them. In this research, we investigated the effect of syntactic priming during production of active and passive sentences by children and adults who are speakers of Brazilian Portuguese (BP). Our experiment is based on Segaert et al.?s (2011) syntactic priming paradigm of sentence production, used with Dutch adults. Our participants were 8 and 9-year-old-children, regularly enrolled in the public schools of the Project ACERTA (Avalia??o de Crian?as Em Risco de Transtorno de Aprendizagem from Instituto do C?rebro do Rio Grande do Sul (InsCer), and undergraduate students of the Pontif?cia Universidade Cat?lica do Rio Grande do Sul (PUCRS) and Universidade Federal do Rio Grande do Sul (UFRGS). The objectives of this research were: (i) to investigate syntactic processing in children and adults using the syntactic priming paradigm; (ii) to investigate the syntactic priming effect in BP; (iii) to analyze the baseline (unprovoked, not-primed) frequency of passive and active sentences in oral language of BP speakers; (iv) to compare the production of passive and active structures in children and adults; (v) to address a possible effect of syntactic priming in the light of the cognitive theory of Implicit Learning (CHANG, DELL, GRIFFIN & BOCK, 2000; CHANG, DEEL & BOCK, 2006). The results indicate the baseline proportion of 89,5% of active sentences and 10,5% of passive in oral production in BP; the generation of passives by adults was higher than by children; the children produced, in addition to passive structures, other structures to topicalize non-agent. The production of short and long passives with agentive verbs seems to be productive in BP children in the study; the greater production of passives by adults may be related to a more frequent contact with reading and writing. The effect of syntactic priming occurred in children but not in adult speakers of BP. / Priming sint?tico ? a facilita??o no processamento de uma senten?a posterior, quando uma senten?a com a mesma estrutura foi processada anteriormente. Nas l?nguas naturais em geral, na oralidade, produzimos mais frases na voz ativa (88% em ingl?s, 92% em holand?s e 89,5% em portugu?s brasileiro, por exemplo ? SEGAERT et al. 2011; PINCKERING & BRANIGAN, 1998) do que na voz passiva. Entretanto, senten?as passivas e outras estruturas transitivas tamb?m s?o produzidas. ? poss?vel estimular a produ??o de estruturas passivas (ou de estruturas infrequentes), como ?A mulher foi ajudada pelo homem?, se for dado ao falante, em um momento anterior, um prime passivo, como a senten?a ?O menino foi fotografado pela menina?. O efeito de priming sint?tico ocorre quando, ao ser induzido, em um primeiro momento, a produzir uma frase na voz passiva, o falante gera, em um segundo momento, uma senten?a tamb?m na voz passiva, indicando que essas duas senten?as t?m uma rela??o estrutural entre si. Neste trabalho, investigamos o efeito de priming sint?tico na produ??o de senten?as ativas e passivas de crian?as e adultos falantes de portugu?s brasileiro (PB). Nosso experimento ? baseado no paradigma de priming sint?tico na produ??o de senten?as de Segaert et al. (2011), feito com adultos holandeses. Os participantes do presente estudo s?o crian?as de 8 e 9 anos regularmente matriculadas em escolas p?blicas vinculadas ao Projeto ACERTA (Avalia??o de Crian?as Em Risco de Transtorno de Aprendizagem), do Instituto do C?rebro do Rio Grande do Sul, e adultos estudantes de gradua??o da Pontif?cia Universidade Cat?lica do Rio Grande do Sul e da Universidade Federal do Rio Grande do sul. Os objetivos desta pesquisa s?o (i) investigar o processamento sint?tico de senten?as ativas e passivas de crian?as e adultos atrav?s do efeito de priming sint?tico; (ii) verificar, pela primeira vez em portugu?s brasileiro, a exist?ncia do efeito de priming sint?tico em estruturas ativas e passivas do PB; (iii) analisar a frequ?ncia de senten?as passivas e ativas na linguagem oral em portugu?s brasileiro; (iv) comparar a produ??o de senten?as passivas de crian?as e adultos; e (v) verificar se o efeito de priming sint?tico pode ser explicado pela teoria cognitiva de Implicit Learning (CHANG; DELL; GRIFFIN; BOCK, 2000; CHANG; DELL; BOCK, 2006). Os resultados indicam a propor??o de 89,5% de senten?as ativas e 10,5% de senten?as passivas na produ??o oral em PB; a produ??o de passivas de adultos ? maior do que a das crian?as que utilizam, al?m da passiva, outras estruturas para topicalizar o participante afetado pelo evento. A produ??o de passivas curtas e longas com verbos agentivos parece ser produtiva nas crian?as falantes de PB deste estudo; a maior produ??o de passivas por adultos parece estar relacionada ? leitura e ? escrita. O efeito de priming sint?tico se manifestou significativamente em crian?as e n?o foi encontrado em adultos falantes do PB, o que parece ser mais uma evid?ncia de que priming sint?tico ? implicit learning. AQUISI??O DA LINGUAGEM PSICOLINGU?STICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGU?STICA PORTUGUESA LINGUISTICA, LETRAS E ARTES::LETRAS
80	Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil / Research of word sense disambiguation methods for verbs in brazilian portuguese Marco Antonio Sobrevilla Cabezudo 28 August 2015 (has links) A Desambiguação Lexical de Sentido (DLS) consiste em determinar o sentido mais apropriado da palavra em um contexto determinado, utilizando-se um repositório de sentidos pré-especificado. Esta tarefa é importante para outras aplicações, por exemplo, a tradução automática. Para o inglês, a DLS tem sido amplamente explorada, utilizando diferentes abordagens e técnicas, contudo, esta tarefa ainda é um desafio para os pesquisadores em semântica. Analisando os resultados dos métodos por classes gramaticais, nota-se que todas as classes não apresentam os mesmos resultados, sendo que os verbos são os que apresentam os piores resultados. Estudos ressaltam que os métodos de DLS usam informações superficiais e os verbos precisam de informação mais profunda para sua desambiguação, como frames sintáticos ou restrições seletivas. Para o português, existem poucos trabalhos nesta área e só recentemente tem-se investigado métodos de uso geral. Além disso, salienta-se que, nos últimos anos, têm sido desenvolvidos recursos lexicais focados nos verbos. Nesse contexto, neste trabalho de mestrado, visou-se investigar métodos de DLS de verbos em textos escritos em português do Brasil. Em particular, foram explorados alguns métodos tradicionais da área e, posteriormente, foi incorporado conhecimento linguístico proveniente da Verbnet.Br. Para subsidiar esta investigação, o córpus CSTNews foi anotado com sentidos de verbos usando a WordNet-Pr como repositório de sentidos. Os resultados obtidos mostraram que os métodos de DLS investigados não conseguiram superar o baseline mais forte e que a incorporação de conhecimento da VerbNet.Br produziu melhorias nos métodos, porém, estas melhorias não foram estatisticamente significantes. Algumas contribuições deste trabalho de mestrado foram um córpus anotado com sentidos de verbos, a criação de uma ferramenta que auxilie a anotação de sentidos, a investigação de métodos de DLS e o uso de informações especificas de verbos (provenientes da VerbNet.Br) na DLS de verbos. / Word Sense Disambiguation (WSD) aims at identifying the appropriate sense of a word in a given context, using a pre-specified sense-repository. This task is important to other applications as Machine Translation. For English, WSD has been widely studied, using different approaches and techniques, however, this task is still a challenge for researchers in Semantics. Analyzing the performance of different methods by the morphosyntactic class, note that not all classes have the same results, and the worst results are obtained for Verbs. Studies highlight that WSD methods use shallow information and Verbs need deeper information for its disambiguation, like syntactic frames or selectional restrictions. For Portuguese, there are few works in WSD and, recently, some works for general purpose. In addition, it is noted that, recently, have been developed lexical resources focused on Verbs. In this context, this master work aimed at researching WSD methods for verbs in texts written in Brazilian Portuguese. In particular, traditional WSD methods were explored and, subsequently, linguistic knowledge of VerbNet.Br was incorporated in these methods. To support this research, CSTNews corpus was annotated with verb senses using the WordNet-Pr as a sense-repository. The results showed that explored WSD methods did not outperform the hard baseline and the incorporation of VerbNet.Br knowledge yielded improvements in the methods, however, these improvements were not statistically significant. Some contributions of this work were the sense-annotated corpus, the creation of a tool for support the sense-annotation, the research of WSD methods for verbs and the use of specific information of verbs (from VerbNet.Br) in the WSD of verbs. Desambiguação lexical de sentindo Linguística computacional Processamento da linguagem natural Computational linguistics Natural language processing Word sense disambiguation

Search results