• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 10
  • Tagged with
  • 10
  • 7
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

O uso de informações semânticas do PALAVRAS : em busca do aprimoramento da seleção de unidades textuais correferentes na Sumarização Automática

Tomazela, Élen Cátia 21 June 2010 (has links)
Made available in DSpace on 2016-06-02T20:25:07Z (GMT). No. of bitstreams: 1 3413.pdf: 1158214 bytes, checksum: 96b742071a87c5d34f6d705e6fa72237 (MD5) Previous issue date: 2010-06-21 / Universidade Federal de Minas Gerais / This dissertation aims at presenting a theoretical heuristic model which not only takes into consideration the Veins Theory, but also semantic information obtained from the Parser PALAVRAS to improve the selection of correferential textual units to be included in automatic summaries. Based on the analysis of the problems presented by VeinSum, an automatic summarizer, two main issues have been raised: the necessity of improving its summaries salience and reducing their size so that they suit the compression rate more adequately. Better results can be achieved through the elimination of irrelevant textual units although the summaries referential clarity may not be damaged. Heuristics based on the semantic information have then been proposed. Despite the semantic annotation inconsistencies, all the noun phrases that compose the Summ-it Corpus have been post-edited manually, which increases the credibility of the heuristics. Eleven texts from the corpus have been analysed and the results obtained are satisfactory, although a wider study would be required to better evaluate the results of this proposal. / Esta dissertação tem como foco a proposta de um modelo heurístico teórico que utiliza, além da Teoria das Veias, informações semânticas provenientes do Parser PALAVRAS para melhorar a seleção de unidades correferentes para a inclusão em sumários automáticos. A partir da análise dos problemas apresentados pelo sumarizador automático VeinSum, identificou-se a necessidade de melhorar a saliência dos sumários produzidos, além de reduzir o tamanho dos mesmos para que se aproximassem mais da taxa de compressão ideal. Propõese, então, a eliminação de unidades textuais de importância secundária no que tange à clareza referencial, sem danificá-la, no entanto. Para isso, heurísticas baseadas nas informações semânticas do PALAVRAS foram propostas. Apesar de o parser apresentar inconsistências de etiquetação semântica, a anotação de todos os sintagmas nominais dos 50 textos-fonte que compõem o corpus Summ-it foi pós-editada manualmente para melhorar a confiabilidade das heurísticas geradas. Foram analisados 11 textos pertencentes ao corpus e os resultados são satisfatórios, porém reconhece-se que, para melhor avaliar os resultados desta proposta, faz-se necessário um estudo mais amplo.
2

Paralelismo e foco estrutural no processamento da correferência de pronomes e de nomes repetidos

Lima, Juciane Nóbrega 25 March 2014 (has links)
Submitted by Maike Costa (maiksebas@gmail.com) on 2016-07-21T13:47:59Z No. of bitstreams: 1 arquivo total.pdf: 1030830 bytes, checksum: affa607bacbace5e6fc95c51c5a74efe (MD5) / Made available in DSpace on 2016-07-21T13:48:00Z (GMT). No. of bitstreams: 1 arquivo total.pdf: 1030830 bytes, checksum: affa607bacbace5e6fc95c51c5a74efe (MD5) Previous issue date: 2014-03-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The present study has aims to investigate the intrasentencial coreference processing, observing how the processing of coreference of pronouns and repeated names occurs in relation to the focus of their antecedents. We take as initial hypothesis that repeated names take an extra cost to be processed than pronouns, despite the antecedent is more salient or not. This is nominated by the Repeated Name Penalty, postulated by the Informational Load Hypothesis. Almor (1999, 2000). We performed two online self-paced reading, through Psyscope program. The dependent variable of the two experiments was the reading time of the critical segment (repeated name or pronoun) and the independent variables were the type of resumption (pronoun or repeated name) and the position of the antecedent (focused or unfocused) . The difference between the two experiments was that at the first we controlled all experimental sentences to contain pronouns and repeated names in the same position and syntactic function of its background, so in parallel . The second was controlled in order not to contain the conditions in parallel. 28 students from UFPB participated in each experiment. The results of the first experiment show a lower reading time for the pronouns in relation to repeated names regardless if its antecedent was focused or not .The structural focus showed no significant effect on any of the experimental conditions. A possible explanation would be that the effect of structural parallelism overlapped the effect of focus. That's what the results of the second experiment showed. The resumption and antecedent not in parallel time resulted in an significant effect of structural focus. The reading time was faster when the antecedent was focused than when it was not. It was also confirmed Repeated Name Penalty also in this second experiment. / O presente estudo tem como objeto de investigação o processamento correferencial intersentencial, procurando observar como se dá o processamento da correferência de pronomes e de nomes repetidos em relação ao foco dos seus respectivos antecedentes. Tomamos como hipótese inicial que nomes repetidos teriam o processamento mais custoso do que os pronomes, independente da saliência do antecedente. Ou seja, haveria Penalidade do Nome Repetido, postulada pela Hipótese da Carga Informacional de Almor (1999; 2000). Para isso, realizamos dois experimentos com uma tarefa on-line de leitura automonitorada (self-paced reading), por meio do programa Psyscope. A variável dependente dos dois experimentos foi o tempo de leitura do segmento crítico (nome repetido ou pronome). E as variáveis independentes foram: o tipo de retomada (pronome ou nome repetido) e a posição do antecedente (focalizado ou não focalizado). A diferença entre os dois experimentos foi que no primeiro controlamos para que em todas as frases experimentais contivessem pronomes e nomes repetidos na mesma posição e função sintática de seus antecedentes, ou seja, em paralelo. Já no segundo controlamos para que em nenhuma das condições tivessem antecedente e retomada em paralelo. O total de participantes voluntários foi de 28 estudantes da UFPB em cada experimento. Os resultados do primeiro experimento mostram menor tempo de leitura para os pronomes em relação aos nomes repetidos independentemente se o seu antecedente estivesse focalizado ou não. Já o foco estrutural não mostrou efeito significativo em nenhuma das condições experimentais. Uma possível explicação seria a de que o efeito do paralelismo estrutural se sobrepôs ao efeito do foco. Foi o que os resultados do segundo experimento demonstraram. Dessa vez, com retomada e antecedente não paralelo, o efeito de foco estrutural se mostrou significativo, ou seja, a leitura foi mais rápida quando o antecedente estava focalizado do que quando não estava. E foi confirmada Penalidade do Nome Repetido também nesse segundo experimento.
3

O processamento de argumentos e adjuntos em estruturas sintáticas sem ambiguidade e em estruturas com correferência

Bezerra, Gitanna Brito 24 March 2017 (has links)
Submitted by Viviane Lima da Cunha (viviane@biblioteca.ufpb.br) on 2017-08-01T12:38:07Z No. of bitstreams: 1 arquivototal.pdf: 1845224 bytes, checksum: c32d15dcf5e111f85fd5f2e083ce205a (MD5) / Made available in DSpace on 2017-08-01T12:38:07Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 1845224 bytes, checksum: c32d15dcf5e111f85fd5f2e083ce205a (MD5) Previous issue date: 2017-03-24 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Esta investigación parte del supuesto de que los argumentos se procesan más rápido que adjuntos, estudiando esta distinción a través de estructuras sin ambigüedad estructural y de estructuras con correferencia. Argumentos y adjuntos han sido ampliamente estudiados en el contexto de la investigación en el procesamiento de oraciones, pero en estructuras ambiguas, por las que ha sido posible capturar, generalmente, una ventaja en el análisis de argumentos, con los adjuntos mostrando un procesamiento más costoso, sea porque no están léxicamente especificados, tal como proponen los modelos lexicalistas, ya sea porque tienen una estructura más compleja, tal como proponen modelos estructurales, según los cuáles la adjunción es más costosa para el analizador. Trabajando con estructuras no ambiguas, el objetivoes investigar si la información lexical direcciona el análisis sintáctico, facilitando el procesamiento de argumentos, que son léxicamente especificados, en comparación al de los adjuntos, que no se encuentran en la estructura argumental de los predicadores, y no el objetivo de ver las preferencias de análisis, si como argumento o adjunto de sintagmas ambiguos, en lo que entrarían factores como la frecuencia y la acción de los principios estructurales. Se realizaron dos experimentos de lectura autocontrolada para analizar la comprensión de argumentos y adjuntos: el primero con estructuras sin ambigüedad y con correferencia y el segundo con estructuras sin ambigüedad y sin correferencia. Los resultados de ambos experimentos permitieron visualizar diferencias en los tiempos de lectura de los argumentos y adjuntos en las condiciones con núcleos nominales, pero no en las condiciones con núcleo verbal. Se concluyó que el parser tuvo acceso a la información lexical y analizó de manera diferente argumentos y adjuntos, revelando la ausencia de diferencias en las condiciones con núcleos verbales que la adjunción no necesariamente tiene que ser costosa.Por último, se propone que estructuras sin ambigüedad y estructuras con correferencia pueden revelar efecto de status argumental. / Esta pesquisa parte da hipótese geral de que argumentos são processados mais rapidamente do que adjuntos, testando-a através de estruturas sem ambiguidade estrutural e de estruturas com correferência. Argumentos e adjuntos têm sido bastante focalizados no âmbito das pesquisas em processamento sentencial, porém em estruturas ambíguas, por meio das quais tem sido possível capturar, de modo geral, uma vantagem no parsing de argumentos, com os adjuntos exibindo um processamento mais custoso, seja porque não estão especificados lexicalmente, como propõem modelos lexicalistas, seja porque são estruturalmente mais complexos, como propõem modelos estruturais, segundo os quais a adjunção é mais custosa para o parser. Ao lidar com estruturas não ambíguas, tem-se como objetivo investigar se a informação lexical é acessada durante o parsing, facilitando o processamento de argumentos, que são lexicalmente especificados, em relação ao de adjuntos, que não estão previstos na estrutura argumental dos predicadores, e não o objetivo de ver a preferência de análise, se como argumento ou adjunto, de sintagmas ambíguos, no que entrariam fatores como a frequência e a atuação de princípios estruturais. Dois experimentos de leitura automonitorada foram realizados para analisar o processamento de argumentos e adjuntos: o primeiro envolveu estruturas não ambíguas e com correferência; o segundo envolveu estruturas não ambíguas e sem correferência. Os resultados de ambos os experimentos permitiram visualizar distinções nos tempos de leitura de argumentos e adjuntos nas condições com núcleo nominal, mas não nas condições com núcleo verbal. Concluiu-se que o parser teve acesso à informação lexical e analisou diferentemente argumentos e adjuntos, revelando a ausência de diferenças nas condições com núcleo verbal que a adjunção não necessariamente precisa ser custosa. Enfim, propõe-se que estruturas sem ambiguidade e estruturas com correferência podem revelar efeito de status argumental.
4

Resolução de correferência em múltiplos documentos utilizando aprendizado não supervisionado / Co-reference resolution in multiples documents through unsupervised learning

Silva, Jefferson Fontinele da 05 May 2011 (has links)
Um dos problemas encontrados em sistemas de Processamento de Línguas Naturais (PLN) é a dificuldade de se identificar que elementos textuais referem-se à mesma entidade. Esse fenômeno, no qual o conjunto de elementos textuais remete a uma mesma entidade, é denominado de correferência. Sistemas de resolução de correferência podem melhorar o desempenho de diversas aplicações do PLN, como: sumarização, extração de informação, sistemas de perguntas e respostas. Recentemente, pesquisas em PLN têm explorado a possibilidade de identificar os elementos correferentes em múltiplos documentos. Neste contexto, este trabalho tem como foco o desenvolvimento de um método aprendizado não supervisionado para resolução de correferência em múltiplos documentos, utilizando como língua-alvo o português. Não se conhece, até o momento, nenhum sistema com essa finalidade para o português. Os resultados dos experimentos feitos com o sistema sugerem que o método desenvolvido é superior a métodos baseados em concordância de cadeias de caracteres / One of the problems found in Natural Language Processing (NLP) systems is the difficulty of identifying textual elements that refer to the same entity. This phenomenon, in which the set of textual elements refers to a single entity, is called coreference. Coreference resolution systems can improve the performance of various NLP applications, such as automatic summarization, information extraction systems, question answering systems. Recently, research in NLP has explored the possibility of identifying the coreferent elements in multiple documents. In this context, this work focuses on the development of an unsupervised method for coreference resolution in multiple documents, using Portuguese as the target language. Until now, it is not known any system for this purpose for the Portuguese. The results of the experiments with the system suggest that the developed method is superior to methods based on string matching
5

Análise de expressões referenciais em corpus anotado da língua portuguesa

Abreu, Sandra Collovini de 23 February 2005 (has links)
Made available in DSpace on 2015-03-05T13:53:44Z (GMT). No. of bitstreams: 0 Previous issue date: 23 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A análise de expressões referenciais é fundamental na interpretação do discurso. A identificação de expressões correferentes é importante em diversas aplicações de Processamento da Linguagem Natural. Expressões referenciais podem ser usadas para introduzir entidades em um discurso ou podem fazer referência a entidades já mencionadas, podendo fazer uso de redução lexical, como em: “O Eurocenter oferece cursos de Japonês na bela cidade de Kanazawa. Os cursos têm quatro semanas de duração”. Onde “cursos de Japonês” introduz uma nova entidade e “os cursos” retomam essa entidade. A resolução de correferência é o processo de identificar as expressões que se referem à mesma entidade no discurso. As expressões referenciais são analisadas e a existência de um antecedente textual é verificada. Aquelas que introduzem novos elementos, chamamos novas no discurso. Esta dissertação apresenta um estudo das características de um tipo específico de expressões referenciais (descrições definidas) com o objetivo de identi
6

A influência da coesão e da coerência no processamento Correferencial de pronomes e nomes repetidos em português brasileiro

Simões, Antonia Barros Gibson 25 March 2014 (has links)
Submitted by Maike Costa (maiksebas@gmail.com) on 2017-03-29T13:09:38Z No. of bitstreams: 1 arquivototal.pdf: 1881713 bytes, checksum: a9b89058147d2b2baedc5e63b41e978a (MD5) / Made available in DSpace on 2017-03-29T13:09:38Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 1881713 bytes, checksum: a9b89058147d2b2baedc5e63b41e978a (MD5) Previous issue date: 2014-03-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This dissertation, in the context of Experimental Psycholinguistics, aims to investigate the influence of cohesion and coherence in the co-referential processing of repeated nouns and pronouns in brazilian portuguese, increasing the comprehension about the co-referential processing. Through the application of two experiments, using the online technique of automonitored reading, we manipulated a cohesion element (more precisely the presence or absence of connectives) as well as the coherence of the experimental sentences to investigate the anaphoric solution behavior in the face of different experimental conditions raised by such manipulations. The pronominal processing, observed in experiment 1, was not affected by incongruity issues or by the presence of connectives. Sentences of experiment 2 had significant differences in the time of reading, from the reading of anaphoric resumption with repeated noun. We observed that the processing of incongruent linguistic elements and anaphoric resumption with repeated nouns is more costly to the work memory when compared with the processing of incongruities and pronominal anaphora. Furthermore, through the acquisition and analysis of the reading times of the subjects who participate in the experiments, we could observe the psychological reality of certain postulates of Textual Linguistics, contributing to the approximation between two important areas of study about the human language. / Esta dissertação, no âmbito da Psicolinguística Experimental, tem como objetivo investigar a influência da coesão e da coerência no processamento correferencial de pronomes e nomes repetidos em português brasileiro, ampliando a compreensão sobre o processamento correferencial. Através da aplicação de dois experimentos, utilizando a técnica online de leitura automonitorada, manipulamos um elemento de coesão (mais precisamente a presença ou ausência de conectivos) assim como a coerência das sentenças experimentais para investigar o comportamento da solução anafórica diante das diferentes condições experimentais suscitadas por tais manipulações. O processamento pronominal, observado no experimento 1, não foi afetado por questões de incongruência ou pela presença de conectivos. Sentenças do experimento 2 tiveram diferenças significativas no tempo de leitura, a partir da leitura da retomada anafórica com nome repetido. Observamos que o processamento de elementos linguísticos incongruentes e retomada anafórica com nomes repetidos é mais custoso para a memória de trabalho quando comparados ao processamento de incongruências e anáfora pronominal. Além disso, através da obtenção e análise dos tempos de leitura dos sujeitos participantes dos experimentos, pudemos observar a realidade psicológica de certos postulados da Linguística Textual, contribuindo para a aproximação entre duas áreas importantes de estudo a respeito da linguagem humana.
7

Resolução de correferência em múltiplos documentos utilizando aprendizado não supervisionado / Co-reference resolution in multiples documents through unsupervised learning

Jefferson Fontinele da Silva 05 May 2011 (has links)
Um dos problemas encontrados em sistemas de Processamento de Línguas Naturais (PLN) é a dificuldade de se identificar que elementos textuais referem-se à mesma entidade. Esse fenômeno, no qual o conjunto de elementos textuais remete a uma mesma entidade, é denominado de correferência. Sistemas de resolução de correferência podem melhorar o desempenho de diversas aplicações do PLN, como: sumarização, extração de informação, sistemas de perguntas e respostas. Recentemente, pesquisas em PLN têm explorado a possibilidade de identificar os elementos correferentes em múltiplos documentos. Neste contexto, este trabalho tem como foco o desenvolvimento de um método aprendizado não supervisionado para resolução de correferência em múltiplos documentos, utilizando como língua-alvo o português. Não se conhece, até o momento, nenhum sistema com essa finalidade para o português. Os resultados dos experimentos feitos com o sistema sugerem que o método desenvolvido é superior a métodos baseados em concordância de cadeias de caracteres / One of the problems found in Natural Language Processing (NLP) systems is the difficulty of identifying textual elements that refer to the same entity. This phenomenon, in which the set of textual elements refers to a single entity, is called coreference. Coreference resolution systems can improve the performance of various NLP applications, such as automatic summarization, information extraction systems, question answering systems. Recently, research in NLP has explored the possibility of identifying the coreferent elements in multiple documents. In this context, this work focuses on the development of an unsupervised method for coreference resolution in multiple documents, using Portuguese as the target language. Until now, it is not known any system for this purpose for the Portuguese. The results of the experiments with the system suggest that the developed method is superior to methods based on string matching
8

CorrefSum: revisão da coesão referencial em sumários extrativos

Gonçalves, Patrícia Nunes 28 February 2008 (has links)
Made available in DSpace on 2015-03-05T13:59:43Z (GMT). No. of bitstreams: 0 Previous issue date: 28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Com o avanço da Internet, cada vez mais convivemos com a sobrecarga de informação. É nesse contexto que a área de sumarização automática de textos tem se tornado uma área proeminente de pesquisa. A sumarização é o processo de discernir as informações mais importantes dos textos para produzir uma versão resumida. Sumarizadores extrativos escolhem as sentenças mais relevantes do texto e as reagrupam para formar o sumário. Muitas vezes, as frases selecionadas do texto não preservam a coesão referencial necessária para o entendimento do texto. O foco deste trabalho é, portanto, na análise e recuperação da coesão referencial desses sumários. O objetivo é desenvolver um sistema que realiza a manutenção da coesão referencial dos sumários extrativos usando como fonte de informação as cadeias de correferência presentes no texto-fonte. Para experimentos e avaliação dos resultados foram utilizados dois sumarizadores: Gist-Summ e SuPor-2. Foram utilizadas duas formas de avaliação: automática e subjetiva. Os resultados / With the advance of Internet technology we see the problem of information overload. In this context, automatic summarization is an important research area. Summarization is the process of identifying the most relevant information brought about in a text and on that basis to rewrite a short version of it. Extractive summarizers choose the most relevant sentences in a text and regroup them to form the summary. Usually the juxtaposition of the selected sentences violate the referential cohesion that is needed for the interpretation of the text. This work focuses on the analysis and recovery of referential cohesion of extractive summaries on the basis of knowledge about correference chains as presented in the source text. Some experiments were undertaken considering the summarizers GistSumm and SuPor-2. Evaluation was done in two ways, automatically and subjectively. The results indicate that this is a promising area of work and ways of advancing in this research are discussed
9

Relações entre memória procedimental e linguagem em pessoas que gaguejam: um estudo com base no processamento da correferência anafórica em português brasileiro

Correia, Débora Vasconcelos 26 March 2014 (has links)
Made available in DSpace on 2015-05-14T12:43:03Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 1310227 bytes, checksum: 04da33952d4cd23496fa53ef618ff840 (MD5) Previous issue date: 2014-03-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This dissertation aims to explain how is the processing of coreference in people who stutter (PWS), reflecting on the possibility of an association between stuttering and the presence of difficulties in procedural memory, from the relationship between Alm's Dual Premotor Model (2005) and Ullman´s Declarative/Procedural Model (2001). It is proposed, then, a hypothesis about the connection between the presence of dysfunctions in procedural memory and the linguistic processing of PQG, which was investigated through the ASRT test (Alternating Serial Reaction Time) of procedural memory and two experiments of self-paced reading to the investigation of the phenomenon of inter and intrasentential coreference. In the ASRT test (experiment 1) performed to measure the degree of implicit learning of the participants, the findings suggested a tendency of the groups (PQC and FF) to behave distinctively. PQG showed a pattern of ascending curve, with a positive Spearman's coefficient for the variable cycle, expressing an increase in time of reaction as it increased the number of cycles (stimuli). Which we interpreted as a possible difficulty in the PQG in implicit learning of motor sequences. And the FF showed a descending curve, confirmed by a negative Spearman's coefficient for the variable cycle. Demonstrating that the procedural learning for this group occurred quickly, i.e., the reaction time of the FF reduced as there was an increase in the number of cycles. With these indications that PQG present difficulties in procedural memory, which could interfere in the processing of grammatical aspects according to our hypothesis, we set out to the investigation of the linguistic processing. In experiment 2, the intersentential coreference, performed with the aim at investigating the processing of lexical pronoun (PR) and the repeated name (NR) in the object position between FF and PQC, the results showed that there is no difference in this type of processing between FF and PQC, since both groups showed similar patterns in the average reading time of the critical segment. However, there were a significant effect for the variable tipo de retomada, showing that PR are processed faster than the NR, as previously found by Leitão (2005). Thus, in order to investigate how was grammar functioning in PQG and to attest the hypothesis defended in this dissertation, we set out to the analysis of the phenomenon of coreference in the intrassentential level, in order to isolate the grammatical aspect and eliminate possible interference from the pragmatic and contextual factors. The results pointed to the absence of main effect for the variable group, however, we found a marginally significant interaction effect between the variables group and type of sentence. This interaction can be explained by the fact that the groups react differently to the conditions, departing from the observation that there is an inverse behavior between them, i.e., to the extent that FF are faster in the grammatical condition and slower in agramatical condition, PQG show the opposite pattern. Which corroborates our hypothesis that PQG would have difficulties in perception of breach of grammatical principle. This possibility, confirmed by the statistical evidence foreseen for our findings with the increase of sample, that it directs our search for rejecting the null hypothesis. / Esta dissertação tem por objetivo explanar como se dá o processamento da correferência em pessoas que gaguejam (PQG), refletindo sobre a possibilidade de associação entre a gagueira e a presença de dificuldades na memória procedimental, a partir da relação entre o Modelo Pré-Motor Duplo de Alm (2005) e o Modelo Declarativo/Procedimental de Ullman (2001). Lança-se, então, uma hipótese acerca da conexão entre a presença de disfunções na memória procedimental e o processamento linguístico das PQG, investigada por meio do teste ASRT (Alternating Serial Reaction Time) de memória procedimental e dois experimentos de leitura automonitorada para a investigação do fenômeno da correferência inter e intrassentencial. No teste ASRT (experimento 1) realizado para medir o grau de aprendizagem implícita dos participantes, os resultados encontrados apontaram para uma tendência dos grupos (PQG e FF) a comportarem-se de maneira distinta. As PQG evidenciaram um padrão de curva ascendente, com coeficiente de Spearman positivo para a variável ciclo, expressando um aumento do tempo de reação à medida que se aumentava o número de ciclos (estímulos). O que interpretamos como uma possível dificuldade das PQG na aprendizagem implícita das sequências motoras. E os FF evidenciaram uma curva descendente, confirmada pelo coeficiente de Spearman negativo para a variável ciclo. Demonstrando que a aprendizagem procedimental para este grupo ocorreu de maneira mais rápida, ou seja, o tempo de reação dos FF reduzia à medida que se aumentava o número de ciclos. De posse desses indícios de que as PQG apresentam dificuldades na memória procedimental, o que poderia interferir no processamento dos aspectos gramaticais de acordo com a nossa hipótese, partimos para a investigação do processamento linguístico. No experimento 2, de correferência intersentencial, realizado com o intuito de investigar o processamento do pronome lexical (PR) e do nome repetido (NR) em posição de objeto entre FF e PQG, os resultados obtidos evidenciaram que não há diferença nesse tipo de processamento entre FF e PQG, uma vez que ambos os grupos apresentaram padrões semelhantes no tempo médio de leitura do segmento crítico. No entanto, houve efeito significativo para a variável tipo de retomada, constatando que os PR são mais rapidamente processados do que o NR, conforme já encontrado em Leitão (2005). Dessa forma, a fim de investigar como se dava o funcionamento da gramática nas PQG e atestar de modo mais categórico a hipótese defendida nesta dissertação, partimos para a análise do fenômeno da correferência em nível intrassentencial, objetivando isolar o aspecto gramatical e eliminar as possíveis interferências dos fatores pragmáticos e contextuais. Os resultados obtidos apontaram a ausência de efeito principal para a variável grupo, no entanto, constatou-se um efeito de interação marginalmente significativo entre as variáveis grupo e tipo de sentença. Essa interação pode ser explicada pelo fato de os grupos reagirem diferentemente às condições, partindo da observação que há um comportamento invertido entre eles, ou seja, na medida em que os FF s são mais rápidos na condição gramatical e mais lentos na condição agramatical, as PQG apresentam o padrão oposto. O que corrobora com a nossa hipótese de que as PQG teriam dificuldades na percepção da violação do princípio gramatical. Possibilidade essa, confirmada por meio das evidências estatísticas previstas para os nossos resultados com o aumento da amostra, que direciona a nossa pesquisa para a rejeição da hipótese nula.
10

Leitura da web em português em ambiente de aprendizado sem-fim

Duarte, Maísa Cristina 04 January 2016 (has links)
Submitted by Alison Vanceto (alison-vanceto@hotmail.com) on 2017-01-03T12:49:19Z No. of bitstreams: 1 TeseMCD.pdf: 1564245 bytes, checksum: fbb9eb1099a1b38351371c97e8e49bb4 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2017-01-16T16:47:27Z (GMT) No. of bitstreams: 1 TeseMCD.pdf: 1564245 bytes, checksum: fbb9eb1099a1b38351371c97e8e49bb4 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2017-01-16T16:47:38Z (GMT) No. of bitstreams: 1 TeseMCD.pdf: 1564245 bytes, checksum: fbb9eb1099a1b38351371c97e8e49bb4 (MD5) / Made available in DSpace on 2017-01-16T16:47:46Z (GMT). No. of bitstreams: 1 TeseMCD.pdf: 1564245 bytes, checksum: fbb9eb1099a1b38351371c97e8e49bb4 (MD5) Previous issue date: 2016-01-04 / Não recebi financiamento / NELL is a computer system that has the goal of learn to learn 24 hours per day, continuously and learn more an better than the last day, to perform the knowledge base (KB). NELL is running since January 12 of 2010. Furthermore, NELL goals is have hight precision to be able to continue the learning. NELL is developed in macro-reading context, because this NELL needs very much redundancy to run. The first step to run NELL is to have an big (all-pairs-data). An all-pairs-data is a preprocessed base using Natural Language Processing (NLP), that base has all sufficient statistics about a corpus of web pages. The proposal of this project was to create a instance of NELL (currently in English) in Portuguese. For this, the first goal was the developing an all-pairs-data in Portuguese. The second step was to create a new version of Portuguese NELL. And finally, the third goal was to develop a coreference resolution hybrid method focused in features semantics and morphologics. This method is not dependent of a specific language, it is can be applied for another languages with the same alphabet of Portuguese language. The NELL in Portuguese was developed, but the all-pairs-data is not big enough. Because it Portuguese NELL is not running for ever, like the English version. Even so, this project present the steps about how to develop a NELL in other language and some ideas about how to improve the all-pairs-data. By the way, this project present a coreference resolution hybrid method with good results to NELL. / A NELL é um sistema de computador que possui o objetivo de executar 24 horas por dia, 7 dias por semana, sem parar. A versão atual da NELL foi iniciada em 12 de Janeiro de 2010 e continua ativa. Seu objetivo é aprender cada vez mais fatos da web para popular sua base de conhecimento (Knowlegde Base - KB). Além de aprender cada vez mais, a NELL também objetiva alcançar alta confiança no aprendizado para garantir a continuidade do aprendizado. A NELL foi desenvolvida e atua no contexto da macroleitura, no qual é necessária uma grande quantidade e redundância de dados. Para que o sistema possa aprender, o primeiro passo é criar uma base preprocessada (all-pairs-data) a partir do uso de técnicas linguísticas. O all-pairs-data deve possuir todas as estatísticas suficientes para a execução da NELL e também deve ser de um tamanho suficientemente grande para que o aprendizado possa ocorrer. Neste projeto, foi proposta a criação de uma nova instância da NELL em português. Inicialmente foi proposta a criação de um all-pairs-data e, em seguida, a criação de uma abordagem híbrida para a resolução de correferências independente de língua por base em características semânticas e morfológicas. A proposta híbrida objetivou aperfeiçoar o processo atual de tratamento de correferências na NELL, melhorando assim a confiabilidade no aprendizado. Todas as propostas foram desenvolvidas e a NELL em português obteve bons resultados. Tais resultados evidenciam que a leitura da web em português poderá se tornar um sistema de aprendizado sem-fim. Para que isso ocorra são também apresentadas as futuras abordagens e propostas. Além disso, este projeto apresenta a metodologia de criação da instância da NELL em português, uma proposta de resolução de correferência que explora atributos linguisticos,bem como a ontologia da NELL, além de apontar trabalhos futuros, nos quais inclui-se processos de adição de outras línguas na NELL, principalmente para aquelas que possuem poucas páginas web disponíveis para o aprendizado.

Page generated in 0.0841 seconds