Spelling suggestions: "subject:"linguagem batural"" "subject:"linguagem datural""
31 |
Extração de relações do domínio de organizações para o portuguêsAbreu, Sandra Collovini de January 2014 (has links)
Made available in DSpace on 2014-05-03T02:01:35Z (GMT). No. of bitstreams: 1
000457562-Texto+Completo-0.pdf: 2425407 bytes, checksum: fefac4edf439614aa48e880ee5b36971 (MD5)
Previous issue date: 2014 / The task of Relation Extraction from texts is one of the main challenges in the area of Information Extraction, considering the required linguistic knowledge and the sophistication of the language processing techniques employed. This task aims at identifying and classifying semantic relations that occur between entities recognized in a given text. For example, the sentence “Next Saturday, Ronaldo Lemos, director of Creative Commons, will participate in a debate [. ]" expresses a “institutionalbond" relation that occurs between the named entities “Ronaldo Lemos" and “Creative Commons". This thesis proposes a process for extraction of relation descriptors, which describes the explicit relations between named entities in the Organization domain (Person, Organization and Location) by applying, to texts in Portuguese, Conditional Random Fields (CRF), a probabilistic model that has been used in various tasks e⇥ciently in processing sequential text, including the task of Relation Extraction. In order to implement the proposed process, a reference corpus for extracting relations, necessary for learning, was manually annotated based on a reference corpus for named entities (HAREM). Based on an extensive literature review on the automatic extraction of relations task, features of different types were defined. An experimental evaluation was performed to evaluate the learned model utilizing the defined features. Different input feature configurations for CRF were evaluated. Among them, the highlight was the inclusion of the semantic feature based on the named entity category, since this feature could express, in a better way, the kind of relationship between the pair of named entities we want to identify. Finally, the best results correspond to the extraction of relations between the named entities of Organization and Person categories, in which the F -measure rates were 57% and 63%, considering the correct and partially correct extractions, respectively. / A tarefa de Extração de Relações a partir de textos é um dos principais desafios da área de Extração de Informação, tendo em vista o conhecimento linguístico exigido e a sofisticação das técnicas de processamento da língua empregados. Essa tarefa visa identificar e classificar relações semânticas que ocorrem entre entidades reconhecidas em um determinado texto. Por exemplo, o trecho “No próximo Sábado, Ronaldo Lemos, diretor da Creative Commons, irá participar de um debate (.. )" expressa uma relação de “vínculo-institucional" que ocorre entre as entidades nomeadas “Ronaldo Lemos" e “Creative Commons". Esta tese propõe um processo para extração de descritores de relação, os quais descrevem relações explícitas entre entidades nomeadas do domínio de Organizações (Pessoa, Organização e Local) utilizando o modelo probabilístico Conditional Random Fields (CRF), e sua aplicação em textos da Língua Portuguesa. O modelo probabilístico CRF tem sido aplicado eficientemente em diversas tarefas de processamento de texto sequencial, incluindo recentemente a tarefa de Extração de Relações. A fim de aplicar o processo proposto, um corpus de referência para extração de relações, necessário para o aprendizado, foi anotado manualmente, tomando como base um corpus de referência para entidades nomeadas (HAREM). Com base em uma extensa revisão da literatura sobre a tarefa de extração automática de relações, features de diferentes naturezas foram definidas. Uma avaliação experimental foi realizada com o objetivo de avaliar o modelo aprendido utilizando as features definidas. Diferentes configurações de features de entrada para o CRF foram avaliadas. Dentre elas, destacou-se a inclusão da feature semântica baseada na categoria da entidade nomeada, já que essa feature conseguiu expressar melhor o tipo de relação que se deseja identificar entre o par de entidades nomeadas. Por fim, os melhores resultados obtidos correspondem à extração de relações entre as entidades nomeadas das categorias Organização e Pessoa, na qual as taxas de F-measure foram de 57% e 63%, considerando as extrações corretas e parcialmente corretas, respectivamente.
|
32 |
Experiência de utilização do formalismo "gramáticas síncronas de adjunção de árvores" para construção de um módulo de transferência estruturalAgustini, Alexandre January 1997 (has links)
Made available in DSpace on 2013-08-07T18:43:32Z (GMT). No. of bitstreams: 1
000269167-Texto+Completo-0.pdf: 277056 bytes, checksum: 9e3251ef7a13982b4682b8987a5f0d07 (MD5)
Previous issue date: 1997 / Machine translation has been a challenge for linguists and computer scientists over the last decades. During this period, plenty of progress was accomplished, though the results are not the expected ones. In this investigation, we present a study on automatic translation, starting with a review of the main methods used for the construction of automated translation systems: direct methods and methods based on interlingua and transfer concepts. The work describes the use of the Synchronous Tree Adjoining Grammars (STAGs) formalism for the design of a structural transfer module, which is the main component of transfer-based systems. The transfer module establishes the correspondences between the structural representation of a sentence in the source-language and the one in the target-language. A study on a corpus on economics was developed in order to define structural divergences for the translation between the Portuguese and English languages. A prototype that performs the structural transformations found in the corpus, based on the STAGs concepts, was developed to validate the proposed model. / A automatização da tradução tem sido um desafio constante para lingüistas e cientistas da computação nas últimas décadas. Neste período, muitos avanços foram alcançados, porém os resultados ainda não são os esperados. É apresentado, neste trabalho, um estudo sobre a área de tradução automática, focalizando inicialmente os principais métodos utilizados na construção de sistemas automatizados de tradução: métodos diretos e métodos baseados nos conceitos de interlíngua e transfer. O trabalho descreve as Gramáticas Síncronas de Adjunção de Árvores como formalismo para projeto de um módulo de transferência estrutural, que é o componente principal de sistemas de tradução automática baseados no método transfer. O módulo de transferência realiza o mapeamento das discrepâncias existentes entre a representação estrutural do texto na língua-fonte e a representação correspondente na línguaalvo. Um estudo, a partir de um corpus da área econômica, é apresentado visando a definição de um conjunto de divergências estruturais existentes na tradução entre as línguas portuguesa e inglesa. Para validação do modelo proposto, é apresentado o protótipo de uma ferramenta que realiza as transformações estruturais observadas no corpus empregado, utilizando os conceitos de Gramáticas Síncronas de Adjunção de Árvores.
|
33 |
Sistema Jargão : um sistema para analise de base de dados em linguagem naturalGuilherme, Ivan Rizzo 26 April 1996 (has links)
Orientador: Armando Freitas da Rocha / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-21T10:09:31Z (GMT). No. of bitstreams: 1
Guilherme_IvanRizzo_D.pdf: 5606163 bytes, checksum: 47d26d431a2346e5eebd61c58b6058a4 (MD5)
Previous issue date: 1996 / Resumo: Neste trabalho são apresentados os aspectos teóricos e a implementação de um sistema computacional,denominado de Jargão, para a tarefa da análise de Base de Dados em Linguagem Natural. O sistema utiliza os conceitos de um novo modelo de neurônio, formalizado através dos conceitos de linguagem nebulosa, que suporta o processamento da linguagem natural. Este modelo de neurônio é utilizado na construção de redes neurais estruturadas hierarquicamente que permitem representar os complexos processos da linguagem.A geração das estruturas das redes neurais hierárquicas é feita de acordo com algum modelo lingüístico ou conceitual, que é especificado pelo usuário através de uma sintaxe. Neste trabalho é apresentada a geração dessas estrutura de acordo com uma estruturação conceitual do conhecimento.Neste sistema, o usuário é responsável pela especificação de uma sintaxe nebulosa que codifica o seu conhecimento em cada nível hierárquico, e pela a análise das informações obtidas em cada nível das redes neurais. Finalmente, são apresentadas as aplicações utilizando o sistema Jargão nas áreas de Aquisição do Conhecimento, Recuperação de Informação e Filtragem de Informação / Abstract: Theoretical aspects and the implementationof a computational system, called Jargão, for task of analisysof data base in natural language is presented. The Jargão systemuses concepts of a new model of neuron,formalizedby fuzzy languageconcepts, to supports natural language processing. This modei of neuron is used to build a hierarchically estrutured neural net wich is able to do complex language processing.The generationof the structure of this hierarchicalneural net is made accordingto linguistic or conceptual model, specifiedby the user. The user is responsible for specificationof the fuzzy sintax which codifies their knowledge at each hierarchical leveI, and by interpretationof result. Finally, aplications in the areas of: Knowledge Aquisition, Conceptual InformationRetrieveland Information Filtering, are presented. / Doutorado / Engenharia de Computação / Doutor em Engenharia Elétrica
|
34 |
Um sistema multi-agentes para processamento distribuido de linguagem naturalPaiva, Daniel da Silva de 20 December 1996 (has links)
Orientador: Ariadne Maria Brito Rizzoni Carvalho / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-07-22T06:52:18Z (GMT). No. of bitstreams: 1
Paiva_DanieldaSilvade_M.pdf: 3158349 bytes, checksum: 03b0f6ee907efa8bcef151a93d122b6d (MD5)
Previous issue date: 1996 / Resumo: Nesta dissertação será apresentado um Sistema Multi-Agentes para Processamento Distribuído de Linguagem Natural que utiliza a idéia de que a interpretação de sentenças deve vir do inter-relacionamento entre os diferentes agentes lingüísticas que compõem o sistema. Os agentes são associados às palavras de uma sentença, sendo um agente por palavra. Cada agente terá seu comportamento ditado pela classe morfossintática a que a palavra associada a ele pertence (assume-se que cada palavra pode pertencer a apenas uma classe). De acordo com seu comportamento, cada agente tenta encontrar outros agentes com o objetivo de formar estruturas mais complexas e de atingir uma representação que englobe todos os agentes da sentença. Todo esse processo de busca por outro agente é realizado utilizando troca de mensagens entre os agentes. Quando um agente encontra um outro que ele considera ideal para formar uma estrutura mais complexa, então esses agentes estabelecem ligações. A representação atinge o nível de sentença quando todos os agentes estão conectados . / Abstract: This thesis will present a Multi-Agent System for Distributed Natural Language Processing that uses the idea that the sentence intepretation will come from the interaction among the linguistic agents that comprise the system. Agents are associated with the words of the sentence, one agent by word. Each agent behaves in accordance with its word category (it's assumed that each word can belong only to one category). The agents will try to find the other agents to establish associations aiming at forming structures that can represent the sentence as a whole. When all the agents are connected the sentence level was reached and a solution is said to be found. / Mestrado / Mestre em Ciência da Computação
|
35 |
PLIM : processamento de lingua natural utilizando o paradigma multi-agentesMaria Filho, Ivan Santa 11 August 2018 (has links)
Orientador: Ariadne Maria Britto Rizzoni Carvalho / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-11T23:46:11Z (GMT). No. of bitstreams: 1
MariaFilho_IvanSanta_M.pdf: 23613009 bytes, checksum: b79d079696029abf57dd9920612528ef (MD5)
Previous issue date: 2000 / Resumo: O processamento automático da língua natural é um problema multidisciplinar que envolve aspectos computacionais e lingüísticos, dentre outros. Neste trabalho analisamos algumas das teorias lingüísticas centradas na sintaxe que já foram utilizadas com sucesso em sistemas computacionais. A análise destas teorias e dos sistemas que as implementam considera a adequação lingüística e a complexidade computacional associada. Também são analisados os paradigmas de programação utilizados na implementação destes sistemas, identificando suas limitações. Apresentamos também um sistema distribuído baseado em multi-agentes que é capaz de se utilizar dos mecanismos lingüísticos tradicionais ao mesmo tempo em que supera parte das limitações dos sistemas que os implementam. / Abstract: Natural language processing is a multidisciplinar problem that covers, but is not limited to, Computer Science and Linguistics. This master thesis presents a survey on some of the syntactic-centered linguistic theories that have been successfuly used in computer systems. An analysis of the linguistic adequacy and the computational complexity of each formalism is also presented. An analysis of the programming paradigms which were used to implement these systems and their limitations is also shown. Finally a distributed system based on the multi-agent paradigm is presented. This system is able to mimic many of the traditional system features while overcoming some of their limitations. / Mestrado / Mestre em Ciência da Computação
|
36 |
Utilização de um sistema multiagentes para resolução de referencias em lingua naturalDinnouti, Leonardo Shiguemi 04 May 1999 (has links)
Orientador: Ariadne Maria B. Rizzoni / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-07-25T06:59:05Z (GMT). No. of bitstreams: 1
Dinnouti_LeonardoShiguemi_M.pdf: 2359029 bytes, checksum: b8df24f6e64959ac55a38861c670d8f9 (MD5)
Previous issue date: 1999 / Resumo: Esta tese contribui para a Área de Inteligência Artificial trazendo uma abordagem alternativa para o processamento de Língua Natural utilizando Sistemas Multiagentes. O fenômeno lingüístico a ser analisado é a referência, e em particular a referência definida. O fenômeno é amplamente conhecido como anáfora definida e vem sendo trabalhado por diversos pesquisadores na área de lingüística computacional. Nesta tese o problema é divido e tratado de forma distribuída, através de um sistema multiagentes projetado especificamente para este caso. Um protocolo de comunicação é proposto e alguns testes são feitos com agentes em funcionamento. A implementação do sistema utiliza bibliotecas de livre distribuição, como o SWI-Prolog e o PVM (Parallel Virtual Machine), tornando o sistema passível de ser distribuído livremente. Este trabalho contribui com mais um tipo de abordagem para o Processamento de Língua Natural e abre perspectivas para novos tipos de tratamentos utilizando Sistemas Multiagentes. / Abstract: This thesis contributes to the field of Artificial Intelligence by providing an alternative approach to Natural Language Processing using a Multi-Agent System. The linguistic phenomenon which is analyzed is reference, in particular, definite reference. This phenomena, which is also known as definite anaphor, has been studied by several researchers in the Computational Linguistics field. In this thesis, the problem is divided and treated in a distributed form by a Multi-Agent system that was designed specifically to solve this problem. A communication protocol is developed and some tests are made while the agents are working. The implementation of the system uses free distribution libraries such as SWI-Prolog and PVM (Parallel Virtual Machine) and, therefore, it can be freely distributed. This thesis contributes with a different approach to Natural Language Processing that opens up new perspectives through the use of Multi-Agent systems. / Mestrado / Mestre em Ciência da Computação
|
37 |
Estudo de dialogos orientados a tarefa usando a teoria de multiagentesRoman, Norton Trevisan 19 September 2001 (has links)
Orientador : Ariadne Maria Brito Rizzoni Carvalho / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-07-31T15:20:49Z (GMT). No. of bitstreams: 1
Roman_NortonTrevisan_M.pdf: 3771928 bytes, checksum: ad1c0112d22fd005b839ae2b6afdc94f (MD5)
Previous issue date: 2001 / Resumo: o processamento de diálogos em uma língua natural é um campo bastante vasto e não suficientemente explorado da Inteligência Artificial. Os inúmeros detalhes e particularidades existentes não só na própria língua, como também na estrutura de um diálogo em si impõem barreiras ao modelamento deste processamento. Dessa forma, para se modelar efetivamente um diálogo faz-se necessário o modelamento não só das regras gramaticais particulares da língua, mas também de fenômenos próprios de diálogos, como elipses, o uso de pronomes e a coerência entre as idéias expressas por cada fala presente.
Nessa dissertação é desenvolvido um sistema multiagentes que implementa o modelo para tratamento de diálogos originalmente desenvolvido por Grosz e Sidner. O objetivo deste sistema é testar a interação entre as estruturas que, de acordo com estas pesquisadoras, compõem a estrutura de um discurso, fazendo-o sob a luz do paradigma de multiagentes / Abstract: Natural language dialogue processing is a very extensive and yet not enough explored field in Artifitial Intelligence. The inumerous details and particularities, not only within the language itself, but also within the dialogue structure, present several obstacles to modeling the processo. Therefore, in order to effectivally mo deI a dialogue, it is necessary to model not only particular grammatical rules, but also the dialogue phenomena, wich involves ellipsis, the use of pronouns and the coherence between the ideas expressed by each utterance in the dialogue. In this work a multiagent system that implements the dialogue modeling originally proposed by Grosz and Sidner is developed. The system's goal is to test the interaction between the structures that, according to these researchers, compose the discourse structure, using the multiagents paradigm / Mestrado / Mestre em Ciencia da Informação
|
38 |
Um estudo sobre interfaces em linguagem natural, com vistas a interação entre usuarios e bases de conhecimentoTedesco, Gilberto Onofre 14 December 1990 (has links)
Orientador: Furio Damiani / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-13T23:18:04Z (GMT). No. of bitstreams: 1
Tedesco_GilbertoOnofre_M.pdf: 6526059 bytes, checksum: 56913e22c1a26d30f9820d5b5c9ae252 (MD5)
Previous issue date: 1990 / Resumo: A finalidade deste trabalho é o estudo e a aplicação de métodos de processamento de linguagem natural para que se possam construir interfaces entre a linguagem do usuário e a linguagem usada em sistemas de computação. Entende-se como linguagem natural a linguagem verbal, mais especificamente, sua representação escrita,com vistas unicamente ao seu processamento computacional. Uma interface em linguagem natural, em grande parte, depende do domínio de conhecimento. Procuramos dar ênfase à sua portabilidade para diferentes domínios de aplicação. Como exemplo, implementamos uma interface para que se possa acessar uma base de conhecimentos constituída de informações sobre os arquivos em discos de um microcomputador PC. A estrutura deste interpretador compõe-se de um conjunto de módulos interativos, tendo como entrada a solicitação do usuário e como saída a resposta a sua consulta ou a execução de algum comando. Um outro aspecto que procuramos salientar é a possibilidade de expansão do dicionário e da base de dados pelo próprio usuário, durante sua interação com o sistema, dispensando a intermediação do profissional da computação para implementar tais modificações / Mestrado / Mestre em Engenharia Elétrica
|
39 |
Processamento automático aplicado à análise de requisitos escritos em linguagem naturalSamir Prado Daud 30 October 2009 (has links)
O objetivo deste trabalho é estudar a viabilidade do uso de técnicas de Processamento da Linguagem Natural para o auxilio da análise de requisitos escritos em linguagem natural. Requisitos em Linguagem Natural são amplamente utilizadas na indústria aeronáutica, pelo menos como o primeiro nível de descrição de um sistema. Utilizar linguagens formais para especificar requisitos, apesar de apresentar ganhos relacionados à ausência de ambiguidades inerentes à linguagem natural, gera outros problemas. O processo que conduz a requisitos de qualidade começa com a análise de requisitos escritos em Linguagem Natural e continua por sua formalização e verificação. No intuito de diminuir tais ambigüidades são utilizados padrões de escrita de requisitos. São comparadas diversas abordagens para o processamento da linguagem natural aplicado ao problema estudado. A análise léxica apresenta algumas abordagens inovadoras, e produz resultados bons comparados com a literatura. Na análise sintática é utilizada uma gramática semântica, o que permite a aplicação imediata dos resultados. Durante a análise semântica mostrou-se inviável a detecção de inconsistências em requisitos. Porém os ganhos na qualidade dos requisitos com o uso de uma gramática mais restrita e possibilidades do uso de resultados do processamento da linguagem natural para outras aplicações indicam a viabilidade do uso do processamento da linguagem natural no auxilio a especificação de requisitos.
|
40 |
Desambigua??o de anota??es morfossint?ticas feitas por MTMDDThiele, Pablo Frederico Oliveira 24 March 2015 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-10-05T19:09:02Z
No. of bitstreams: 1
475518 - Texto Completo.pdf: 1065929 bytes, checksum: cf8f71f90f9d278fccf4595fde672a11 (MD5) / Made available in DSpace on 2015-10-05T19:09:02Z (GMT). No. of bitstreams: 1
475518 - Texto Completo.pdf: 1065929 bytes, checksum: cf8f71f90f9d278fccf4595fde672a11 (MD5)
Previous issue date: 2015-03-24 / The Natural Language Processing technologies (PLN) are being used for analysis of huge amounts of data. With the advent of new media and mass adoption of social networking, the flow of information generated every second is the largest in history. The majority of that is multimedia files. Meanwhile, a large portion of the information produced, especially in social network, is textual. Thus, PLN solutions need to be more robust than they ever were, finding processing solutions that might accompany this constant information production or at least provide better results compared to procedures previously used.
The labelers or taggers are a major component of PLN. Its function, explored in this work is the ability to observe and catalog the words in a text according to their morphosyntactic functions. The name commonly given to this process is the POST (Part-Of-Speech Tagging). Within the context Part-Of-Speech (POS) is the function to process and identify a group of words by grouping them into pre-defined types. This grouping can occur due to syntactic, morphological or morphosyntactic. Although the processing speed is a worthy feature, when we deal with labelers, the accuracy obtained for its process should be the premise.
The concept of obtaining semantic labels from texts evaluations seems simple at first sight, although presents several challenges. One of the major challenges encountered in PLN is the problem of ambiguity. This situation, which occurs in several stages of natural language processing, is complex due to requires comprehensive knowledge from the processing application using that as tools to collaborate in order to implement the most correct choices. It is a classic problem, inherent to natural and existing language since the beginning of the researches of this area. Several possibilities to minimize its consequences have been proposed since then. This paper lists some of the proposals found on the literature by adding the possibility to use MTMDD structures during the process, looking for a substantial performance gain. / Atualmente as tecnologias de Processamento de Linguagem Natural (PLN) est?o sendo utilizadas em an?lises de enormes quantidades de dados. Com o advento das novas m?dias e a ado??o em massa das redes sociais, o fluxo de informa??es geradas a cada segundo ? o maior da hist?ria. Embora isso se concentre, em maior parte, por informa??es e arquivos de multim?dia, uma grande parcela da informa??o produzida, principalmente nas redes sociais, ? textual. Desta forma, as solu??es de PLN necessitam ser mais robustas do que jamais foram, encontrando solu??es de processamento que possam acompanhar esta gera??o constante de informa??es ou pelo menos apresentar resultados melhores se comparados aos procedimentos utilizados anteriormente.
Os etiquetadores ou taggers s?o um dos principais componentes da PLN. Sua fun??o, explorada neste trabalho ? a capacidade de observar e catalogar as palavras em um texto de acordo com suas fun??es morfossint?ticas. O nome comumente dado a este processo ? o de POST (Part-Of-Speech Tagging). Dentro do contexto Part-Of-Speech (POS) encontra-se a fun??o de processar e identificar um grupo de palavras agrupando-as em tipos pr?-definidos. Este agrupamento pode ocorrer em raz?o sint?tica, morfol?gica ou morfossint?tica. Embora a velocidade de processamento seja uma carater?stica digna de nota, quando tratamos de etiquetadores, a acuidade obtida por seu processo deve ser a premissa.
O conceito da obten??o de etiquetas sem?nticas a partir de avalia??es dos textos embora pare?a simples em um primeiro momento, apresenta v?rios desafios. Um dos maiores desafios encontrado em PLN ? o problema da ambiguidade. Esta situa??o que ocorre nas mais diversas etapas do processamento de linguagem natural ? complexa, devido ? necessidade de que a aplica??o processadora tenha conhecimentos abrangentes que possam ser utilizados como ferramentas que colaborem no intuito de realizar as escolhas mais corretas. Devido ao fato de se tratar de um problema antigo, inerente ? linguagem natural e existente desde o come?o das pesquisas da ?rea, diversas possibilidades de minimizar suas consequ?ncias foram propostas. O presente trabalho enumera algumas das propostas encontradas, adicionando a possibilidade de uso de estruturas do tipo MTMDD no processo, buscando um ganho substancial de desempenho.
|
Page generated in 0.0878 seconds