Global ETD Search

1	RePort : um sistema de extração aberta de informações para língua portuguesa / RePort ¿ An Open Information Extraction System for Portuguese Language (Inglês) Pereira, Victor dos Santos 28 November 2016 (has links) Made available in DSpace on 2019-03-30T00:01:38Z (GMT). No. of bitstreams: 0 Previous issue date: 2016-11-28 / An emerging Natural Language Processing (NLP) research field proposes Open Information Extraction Systems (Open IE systems) which the main feature is do not need predefined semantic relations for text extraction and instead of this aims at generic standards to extract any domain-independent information. Following this paradigm, this work introduces RePort - an Open Information Extraction System for Portuguese Language, which is designed to scale massive data bases and extract any kind of verb-mediated relationships from Portuguese plain text files. The work¿s other contributions are as follows: a Golden Standard relation-labeled sentences in Portuguese; a lexical database of verbal relations generated from CETENFolha corpus; and generic methods for the creation and evolution of this lexical database of verbal relations via corpora or web queries. Experimental evaluations in English-Portuguese bilingual corpus show the need for linguistic knowledge to adapt the correlated system ¿ ReVerb from English to Portuguese. Based on a second analysis, an automatic evaluation of RePort achieves best results using the extended lexical database of verbal relations and is near to the state-of-the art, when considered only the extraction¿s verbal relations. Finally, it is important to point out the importance of the RePort system, and of the other contributions and analyzes show here aim at evolution of the Open IE system area for Portuguese Language. Keywords: Computational Linguistics, Artificial Intelligence, Natural Language Processing, Information Extraction, Open Information Extraction System, Portuguese Language. / Um campo emergente de pesquisa em Processamento e Linguagem Natural (PLN) propõe Sistemas de Extração de Informações Aberta (em inglês - Open Information Extraction Systems - Open IE systems, em inglês) que têm como a principal característica não necessitar de definição a priori dos tipos de relações semânticas a serem extraídas de textos, visando padrões genéricos para a extração de quaisquer informações independente de domínio. Seguindo este paradigma, este trabalho apresenta o RePort ¿ um Sistema de Extração de Informações Aberta para Língua Portuguesa, projetado para escalar bases massivas de dados e extrair de quaisquer tipos de relações mediadas por verbo a partir de documentos textuais em português. Como contribuições secundárias deste trabalho têm-se um Golden Standard composto dos textos e suas respectivas relações semânticas anotadas; um léxico de relações verbais gerado a partir do corpus CETENFolha; e métodos genéricos para criação e evolução do léxico de relações verbais a partir de corpora ou consultas na Web. Avaliações experimentais em corpus bilíngue inglês-português evidenciou a necessidade de conhecimento linguístico para adaptar o sistema correlato em língua inglesa ¿ ReVerb. Em uma segunda análise, avaliações automáticas do RePort apontou que este obteve seus melhores resultados utilizando o léxico de relações verbais ampliado, próximo ao estado da arte, quando considerada apenas a extração de relações verbais. Por fim, cumpre salientar a importância do sistema RePort, e das demais contribuições e análises aqui apresentadas para evolução da área de Open IE system para o português. Palavras-chave: Linguística Computacional, Inteligência Artificial, Processamento de Linguagem Natural, Extração de Informações, Sistemas de Extração de Informações Aberta, Língua Portuguesa. Linguagem natural Inteligência artificial
2	Desambiguação de anotações morfossintáticas feitas por MTMDD Thiele, Pablo Frederico Oliveira January 2015 (has links) Made available in DSpace on 2015-10-06T02:08:12Z (GMT). No. of bitstreams: 1 000475518-Texto+Completo-0.pdf: 1065929 bytes, checksum: cf8f71f90f9d278fccf4595fde672a11 (MD5) Previous issue date: 2015 / The Natural Language Processing technologies (PLN) are being used for analysis of huge amounts of data. With the advent of new media and mass adoption of social networking, the flow of information generated every second is the largest in history. The majority of that is multimedia files. Meanwhile, a large portion of the information produced, especially in social network, is textual. Thus, PLN solutions need to be more robust than they ever were, finding processing solutions that might accompany this constant information production or at least provide better results compared to procedures previously used. The labelers or taggers are a major component of PLN. Its function, explored in this work is the ability to observe and catalog the words in a text according to their morphosyntactic functions. The name commonly given to this process is the POST (Part-Of-Speech Tagging). Within the context Part-Of-Speech (POS) is the function to process and identify a group of words by grouping them into pre-defined types. This grouping can occur due to syntactic, morphological or morphosyntactic. Although the processing speed is a worthy feature, when we deal with labelers, the accuracy obtained for its process should be the premise. The concept of obtaining semantic labels from texts evaluations seems simple at first sight, although presents several challenges. One of the major challenges encountered in PLN is the problem of ambiguity. This situation, which occurs in several stages of natural language processing, is complex due to requires comprehensive knowledge from the processing application using that as tools to collaborate in order to implement the most correct choices. It is a classic problem, inherent to natural and existing language since the beginning of the researches of this area. Several possibilities to minimize its consequences have been proposed since then. This paper lists some of the proposals found on the literature by adding the possibility to use MTMDD structures during the process, looking for a substantial performance gain. / Atualmente as tecnologias de Processamento de Linguagem Natural (PLN) estão sendo utilizadas em análises de enormes quantidades de dados. Com o advento das novas mídias e a adoção em massa das redes sociais, o fluxo de informações geradas a cada segundo é o maior da história. Embora isso se concentre, em maior parte, por informações e arquivos de multimídia, uma grande parcela da informação produzida, principalmente nas redes sociais, é textual. Desta forma, as soluções de PLN necessitam ser mais robustas do que jamais foram, encontrando soluções de processamento que possam acompanhar esta geração constante de informações ou pelo menos apresentar resultados melhores se comparados aos procedimentos utilizados anteriormente. Os etiquetadores ou taggers são um dos principais componentes da PLN. Sua função, explorada neste trabalho é a capacidade de observar e catalogar as palavras em um texto de acordo com suas funções morfossintáticas. O nome comumente dado a este processo é o de POST (Part-Of-Speech Tagging).Dentro do contexto Part-Of-Speech (POS) encontra-se a função de processar e identificar um grupo de palavras agrupando-as em tipos pré-definidos. Este agrupamento pode ocorrer em razão sintática, morfológica ou morfossintática. Embora a velocidade de processamento seja uma caraterística digna de nota, quando tratamos de etiquetadores, a acuidade obtida por seu processo deve ser a premissa. O conceito da obtenção de etiquetas semânticas a partir de avaliações dos textos embora pareça simples em um primeiro momento, apresenta vários desafios. Um dos maiores desafios encontrado em PLN é o problema da ambiguidade. Esta situação que ocorre nas mais diversas etapas do processamento de linguagem natural é complexa, devido à necessidade de que a aplicação processadora tenha conhecimentos abrangentes que possam ser utilizados como ferramentas que colaborem no intuito de realizar as escolhas mais corretas. Devido ao fato de se tratar de um problema antigo, inerente à linguagem natural e existente desde o começo das pesquisas da área, diversas possibilidades de minimizar suas consequências foram propostas. O presente trabalho enumera algumas das propostas encontradas, adicionando a possibilidade de uso de estruturas do tipo MTMDD no processo, buscando um ganho substancial de desempenho. INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL
3	Learning non-verbal relations under open information extraction paradigm Xavier, Clarissa Castellã January 2014 (has links) Made available in DSpace on 2015-03-17T02:01:01Z (GMT). No. of bitstreams: 1 000466321-Texto+Completo-0.pdf: 1994049 bytes, checksum: fbbeef81814a876679c25f4e015925f5 (MD5) Previous issue date: 2014 / The Open Information Extraction (Open IE) is a relation extraction paradigm in which the target relationships cannot be specified in advance, and it aims to overcome the limitations imposed by traditional IE methods, such as domain-dependence and scalability. In order to extend Open IE to extract relationships that are not expressed by verbs from texts in English, we introduce CompIE, a component that learns relations expressed in noun compounds (NCs), such as (oil, extracted from, olive) from olive oil, or in adjectivenoun pairs (ANs), such as (moon, that is, gorgeous) from gorgeous moon. CompIE input is a text file, and the output is a set of triples describing binary relationships. The architecture comprises two main tasks: NCs and ANs Extraction (1) and NCs and ANs Interpretation (2). The first task generates a list of NCs and ANs from the input corpus. The second task performs the interpretation of NCs and ANs and generates the tuples that describe the relations extracted from the corpus. In order to study CompIE’s feasibility, we perform an evaluation based on hypotheses. In order to implement the strategies to validate each hypothesis we have built a prototype. The results show that our solution achieves 89% Precision and demonstrate that CompIE reaches its goal of extending Open IE paradigm extracting relationships within NCs and ANs. / O paradigma Open Information Extraction - Open IE (Extração Aberta de Informações) de extração de relações trabalha com a identificação de relações não definidas previamente, buscando superar as limitações impostas pelos métodos tradicionais de Extração de Informações como a dependência de domínio e a difícil escalabilidade. Visando estender o paradigma Open IE para que sejam extraídas relações não expressas por verbos a partir de textos em inglês, apresentamos CompIE, um componente que aprende relações expressas em compostos nominais (CNs), como (oil, extracted from, olive) - (óleo, extraído da, oliva) - do composto nominal olive oil - óleo de oliva, ou em pares do tipo adjetivo-substantivo (ASs), como (moon, that is, gorgeous) - (lua, que é, linda) - do AS gorgeous moon (linda lua). A entrada do CompIE é um arquivo texto, e sua saída é um conjunto de triplas descrevendo relações binárias. Sua arquitetura é composta por duas tarefas principais: Extrator de CNs e ASs (1) e Interpretador de CNs e ASs (2). A primeira tarefa gera uma lista de CNs e ASs a partir do corpus de entrada. A segunda tarefa realiza a interpretação dos CNs e ASs gerando as triplas que descrevem as relações extraídas do corpus. Para estudar a viabilidade da solução apresentada, realizamos uma avaliação baseada em hipóteses. Um protótipo foi construído com o intuito de validar cada uma das hipóteses. Os resultados obtidos mostram que nossa solução alcança 89% de Precisão e demonstram que o CompIE atinge sua meta de estender o paradigma Open IE extraindo relações expressas dentro dos CNs e ASs. INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL
4	Aquisição de Conhecimento de Mundo para Sistemas de Processamento de Linguagem Natural / World of Knowledge Acquisition for Systems of Natural Language Processing Silva, José Wellington Franco da January 2013 (has links) SILVA, J. W. F. Aquisição de Conhecimento de Mundo para Sistemas de Processamento de Linguagem Natural. 2013. 88 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2013. / Submitted by Daniel Eduardo Alencar da Silva (dealencar.silva@gmail.com) on 2015-01-23T19:47:08Z No. of bitstreams: 1 2013_dis_jwfsilva.pdf: 3234188 bytes, checksum: 9b5bbdb17bd9bce014a2e05dd96198bc (MD5) / Approved for entry into archive by Rocilda Sales(rocilda@ufc.br) on 2015-09-23T16:29:07Z (GMT) No. of bitstreams: 1 2013_dis_jwfsilva.pdf: 3234188 bytes, checksum: 9b5bbdb17bd9bce014a2e05dd96198bc (MD5) / Made available in DSpace on 2015-09-23T16:29:07Z (GMT). No. of bitstreams: 1 2013_dis_jwfsilva.pdf: 3234188 bytes, checksum: 9b5bbdb17bd9bce014a2e05dd96198bc (MD5) Previous issue date: 2013 / One of the challenges of research in Natural Language Processing(NLP) is to provide semantic and linguistic resources to express knowledge of the world to support tasks such as Information Extraction, Information Retrieval systems, Questions & Answering, Text Summarization, Annotation Semantics of texts, etc. For this challenge this work proposes strategies for acquiring knowledge of the world. We propose two methods. The first is a semi-automatic method that has main idea of using a semantic reasoning process on pre-existing knowledge base semantics. The second is an acquisition method that utilizes automatic Wikipedia for generating semantical content. Wikipedia was used as a source of knowledge because of the reliability, dynamism and scope of its content. In this work we propose a method for acquiring semantic relations between concepts from the texts of Wikipedia articles that makes use of an implicit knowledge that exists in Wikipedia and in hypermedia systems: links between articles. Throughout the descriptive text of a Wikipedia article appear links to other articles that are evidence that there is a relationship between the current article and another article referenced by the link. The proposed method aims to capture the semantic relationship expressed in the text between them (current article and link to another article), no regular expressions identifying similar relationships through a semantic similarity measure. / Um dos desafios das pesquisas na área de Processamento de Linguagem Natural (PLN) é prover recursos semântico-linguísticos que expressem conhecimento de mundo para suportar tarefas como: extração de informação, recuperação de informação, sistemas de perguntas e respostas, sumarização de textos, anotação semântica de textos, dentre outras. Para esse desafio este trabalho propõe estratégias para aquisição de conhecimento de mundo. Propomos dois métodos. O primeiro é um método semiautomático que tem como ideia principal utilizar um processo de raciocínio semântico sobre o conhecimento pré-existente em uma base semântica. O segundo é um método de aquisição automática que utiliza a Wikipédia para a geração de conteúdo semântico. A Wikipédia foi utilizada como fonte de conhecimento devido à confiabilidade, dinamicidade e abrangência de seu conteúdo. Neste trabalho propomos um método para aquisição de relações semânticas entre conceitos a partir de textos de artigos da Wikipédia que faz uso de um conhecimento implícito existente na Wikipédia e em sistemas hipermídia: os links entre artigos. Ao longo do texto descritivo de um artigo da Wikipédia aparecem links para outros artigos que são evidências de que há uma relação entre o artigo corrente e o outro artigo referenciado pelo link. O método proposto objetiva capturar a relação semântica expressa no texto entre eles (artigo corrente e link para outro artigo), sem expressões regulares identificando relações similares através de uma medida de similaridade semântica. Aquisição de conhecimento de mundo Entendimento de linguagem natural Processamento de linguagem natural
5	Xmile - um sistema especialista para aprendizagem de manutenção de software a partir de relatórios textuais / XMILE - AN EXPERT SYSTEM FOR MAINTENANCE LEARNING FROM TEXTUAL REPORTS (Inglês) Maximo, Eduardo Juliao 29 June 2018 (has links) Made available in DSpace on 2019-03-30T00:14:22Z (GMT). No. of bitstreams: 0 Previous issue date: 2018-06-29 / Software incidents are usually described in natural language (such as English or Portuguese), as the description of a problem in the form of text makes the representation of the text more natural and complete, and users are free to express themselves about the incident. On the other hand, textual reports are a source of unstructured knowledge, hindering the process of extracting information about the incident. In the context of ITC systems, several researches have proposed the reuse of experiences in Incident Management. However, Computerized Maintenance Management Systems (CMMS) use the way of describing software maintenance experiences using structured fields that need to be manually informed by users or ITC support technicians. In this research, we propose the XMILE (eXpert MaIntenance LEarning) - an expert system based on PLN (Natural Language Processing) and machine learning techniques, which is able to infer the main attributes of an incident from maintenance reports of software optimizing the process of generating knowledge about problems and maintenance of software. The XMILE system can be integrated with any CMMS to automatically extract incident information, automating the pre-processing and capitalization phases of the experience feedback processes. The differential of the XMILE is the possibility to make explicit the information on cases of maintenance (problems and solutions) described in natural language, for example, in Portuguese language, in real time and without human intervention. XMILE was used in a real set of reports of maintenance incidents in the ITC systems of a Brazilian automobile company, with good results in terms of accuracy and coverage in the categorization of incidents. Keywords: Incident Management, Reuse of Experiences. Information Extraction / Incidentes de software são normalmente descritos em linguagem natural (como inglês ou português), pois a descrição de um problema na forma de texto torna a representação do mesmo mais natural e completa, e os usuários ficam livres para se expressar sobre o incidente. Por outro lado, relatos textuais são uma fonte de conhecimento não estruturada, dificultando o processo de extração de informações sobre o incidente. No contexto de sistemas de TIC, diversas pesquisas propuseram a reutilização de experiências em Gerenciamento de Incidentes. No entanto, Sistemas Computacionais de Gestão de Manutenção (em inglês, Computerized Maintenance Management Systems ¿ CMMS) usam a forma de descrição de experiências de manutenção de software utilizando campos estruturados que precisam ser informados manualmente pelos usuários ou técnicos de suporte de TIC. Neste trabalho de pesquisa, propomos o XMILE (eXpert MaIntenance LEarning) - um sistema especialista baseado em PLN (Processamento de Linguagem Natural) e técnicas de aprendizado de máquina, que é capaz de inferir os principais atributos de um incidente a partir de relatos de manutenção de software otimizando o processo de geração de conhecimento sobre os problemas e manutenções de software. O sistema XMILE pode ser integrado a qualquer CMMS para extrair automaticamente informações sobre os incidentes, automatizando as fases de pré-processamento e de capitalização dos processos de feedback de experiência. O diferencial do XMILE é a possibilidade de tornar explícitas as informações sobre casos de manutenção (problemas e soluções) descritos em linguagem natural, por exemplo, em língua portuguesa, em tempo real e sem intervenção humana. XMILE foi usado em um conjunto real de relatos de incidentes de manutenção ocorridos nos sistemas de TIC de uma empresa automobilística brasileira, com bons resultados em termos de precisão e cobertura na categorização dos incidentes. Palavras-chave: Gestão de Incidentes, Reuso de Experiências. Extracão de Informação Manutenção de software Linguagem natural Software
6	Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa Ferreira, Vinicius Hartmann January 2012 (has links) Made available in DSpace on 2013-08-07T18:42:43Z (GMT). No. of bitstreams: 1 000446187-Texto+Completo-0.pdf: 2000156 bytes, checksum: d69c6168cd6efd48f1f38ca794de2813 (MD5) Previous issue date: 2012 / The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed. / A construção de ontologias é um processo complexo que compreende etapas como a extração de conceitos de domínio, bem como a extração de relações taxonômicas e não-taxonômicas entre esses conceitos. A etapa de extração de relações não-taxonômicas é a mais negligenciada, especialmente para textos na língua portuguesa. Essa dissertação apresenta uma proposta de extração de relações não-taxonômicas a partir de textos em língua portuguesa (corpora). Esses textos são representados por uma lista de conceitos e informações contextuais automaticamente extraídos pela ferramenta ExATOlp. Uma aplicação do processo proposto foi realizada com corpora de cinco domínios e uma análise sobre a relevância dos conceitos, a especifidade das relações e a aplicação das relações extraídas foi realizada. Através dessa análise o processo proposto mostrou-se relevante, sendo considerado a principal contribuição dessa dissertação. Adicionalmente, uma ferramenta para visualização das relações não-taxonômicas extraídas, útil para diversas aplicações linguísticas, também é proposta. INFORMÁTICA ONTOLOGIA PROCESSAMENTO DA LINGUAGEM NATURAL
7	Interpretação Automatizada de Textos: Processamento de Anáforas FREITAS, S. A. A. 11 April 2005 (has links) Made available in DSpace on 2016-08-29T15:32:42Z (GMT). No. of bitstreams: 1 tese_2376_TeseDoutoradoSergioAntonioAndradedeFreitas.pdf: 1020803 bytes, checksum: 73b2bf94bf90fb5a8311ac7ece3a65b3 (MD5) Previous issue date: 2005-04-11 / Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas. Considere o seguinte texto: (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade - o motor. No processo de interpretação, humano ou computacional, a utilização do artigo definido " o" é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identificar a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identificar como este motor está ligado com aquele carro. Isto é uma anáfora nominal definida. A interpretação das anáforas nominais definidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação: R(A, T ) (2) onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal definido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais definidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações. Processamen
8	Um ambiente para a analise superficial de linguas baseado em automatos finitos Cáccamo, Mario José 30 March 1998 (has links) Orientador: Tomasz Kowaltowski / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-07-23T12:27:31Z (GMT). No. of bitstreams: 1 Caccamo_MarioJose_M.pdf: 2620384 bytes, checksum: f5050f57d7a4e7f0276200dc83121f1c (MD5) Previous issue date: 1998 / Resumo: A análise sintática é uma componente fundamental da maioria dos sistemas de processamento automático de línguas. Tradicionalmente, esta tarefa foi implementada com técnicas derivadas do formalismo das Gramáticas Livres de Contexto. A demanda por sistemas eficientes motivou a pesquisa em busca de outras alternativas para a análise sintática. Alguns sistemas de processamento de línguas naturais não precisam de uma análise completa da estrutura profunda das sentenças (árvores de derivação), senão apenas dispor das relações superficiais entre às palavras de um texto. O objetivo de um analisador-superficial é determinar quais são as sentenças de uma língua, fornecendo apenas a informação sobre alguma característica em particular, evitando entrar em detalhes correspondentes à estrutura profunda. Este tipo de sistemas é mais eficientes e pode substituir uma análise sintática completa em várias aplicações. Nesta dissertação propõe-se um ambiente para implementar a análise superficial de línguas. A proposta consiste em representar as sentenças de uma língua usando seqüências de marcas chamadas de padrões sintáticos. Cada marca é uma categoria de palavras (adjetivos, substantivos, advérbios, etc). A hipótese é que o núcleo das sentenças usadas nos textos de uma língua pode ser capturado com um número computacionalmente tratável de padrões sintáticos. Estruturas de dados baseadas em autômatos finitos foram utilizadas para representar de forma compacta grandes vocabulários de palavras. Os padrões sintáticos são cadeias de símbolos comparáveis, em certo sentido, às palavras de um vocabulário e autômatos mostraram-se adequadas para armazená-los. Além disso, os autômatos permitem a implementação eficiente do algoritmo de reconhecimento proposto, e outros mais complexos, como o conselheiro gramatical apresentado nesta dissertação. Um dos problemas de muitas das propostas para a análise sintática de línguas é a falta de um método ou fonte de informação para construir um sistema que possa modelar um exemplo real. Como uma alternativa, propõe-se aqui a coleta de padrões sintáticos a partir de corpos de texto marcados. / Abstract: Syntactic analysis is an important component of most natural language processing systems. Typically parsers were implemented using techniques derived from Context Free Grammars. The increasing need for efficient systems was one of the reasons to search for new approaches to syntactic analysis. Some natural language applications do not need complete parsing of the deep structure of the sentences (derivation trees). In these cases, a representation of the surface relations among words in a text is enough. The goal of a surface parser is to recognize the natural language sentences providing information only about some particular features. It is not concerned with the deep structure of the sentences. This kind of parsers are more efficient and can replace a parser implementing a complete syntactic analysis in different situations. We propose in this dissertation an environment to implement surface parsing of natural languages. In our approach every sentence is represented by a sequence of part-of-speech tags cal\ed syntactic pattern. The hypothesis underlying our work is that the core of the sentences used in natural language texts can be captured with a computationally tractable number of syntactic patterns. Data structures based on finite-state automata have been used in representing1large word vocabularies. Syntactic patterns are strings of symbols that can be compared in some sense with words. We have shown that finite-state automata are adequate to' store syntactic patterns. Furthermore they allow an efficient implementation of the recognizing algorithms, and other more complex ones, as the agreement adviser presented in this work. One of the problems common to many approaches for syntactic parsing is the lack of a method or information source to build a system capable of mastering a real example. As an option, we propose the collection of syntactic patterns from annotated corpora of texts. / Mestrado / Mestre em Ciência da Computação Algoritmos
9	Beck: um chatbot baseado na terapia cognitivo-comportamental para apoiar adolescentes com depressão ALMEIDA JUNIOR, Oberdan Alves de 04 July 2017 (has links) Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-09-20T21:07:13Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Oberdan Alves de Almeida Junior.pdf: 7551633 bytes, checksum: 74ec88f33c65120c8747c65ad548ef4f (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-09-21T17:26:45Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Oberdan Alves de Almeida Junior.pdf: 7551633 bytes, checksum: 74ec88f33c65120c8747c65ad548ef4f (MD5) / Made available in DSpace on 2018-09-21T17:26:45Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Oberdan Alves de Almeida Junior.pdf: 7551633 bytes, checksum: 74ec88f33c65120c8747c65ad548ef4f (MD5) Previous issue date: 2017-07-04 / CAPES / A depressão é um dos distúrbios psicológicos mais frequentes no mundo. Esse distúrbio causa um grande impacto na qualidade de vida do indivíduo, compromete as relações sociais e familiares, e pode levar ao suicídio. Na adolescência, a depressão é uma das doenças psicológicas mais comuns. Muitos dos problemas emocionais têm início e pico durante esta fase da vida. No Brasil, entre os jovens, o suicídio representa a terceira principal causa de morte. A Terapia Cognitivo-Comportamental (TCC) tem se mostrado bastante eficaz no tratamento da depressão. Esse tipo de terapia também pode ser realizado através do computador, sem o acompanhamento de um terapeuta. Estudos identificaram vantagens importantes na comunicação mediada por computador em comparação com a interação humana face a face, como na promoção do sentimento de anonimato e no aumento da autorrevelação. Contudo, a maioria dos sistemas atuais baseados em TCC não apresenta um grau satisfatório de interatividade. Neste cenário, os chatbots são uma alternativa para diminuir essa deficiência dos sistemas de terapia via computador. Chatbots são sistemas criados para simular um diálogo real com o usuário, podendo ter a capacidade de analisar e influenciar seus comportamentos. Esse tipo de sistema interage com o usuário através do uso da linguagem natural. Este projeto de mestrado desenvolveu um chatbot, baseado nos princípios da TCC, capaz de conversar com adolescentes que sofrem depressão. Para construir o chatbot Beck, utilizamos o ChatScript, uma linguagem de desenvolvimento desse tipo de sistema, que foi vencedora de vários prêmios. Avaliamos o desempenho e a utilidade de Beck através de um teste de conversação e de um Survey com adolescentes. Os resultados obtidos foram muito satisfatórios. De acordo com os resultados, 85,94% dos adolescentes ficaram satisfeitos com o desempenho de Beck, e em relação à sua utilidade, 92,19% dos adolescentes concordam que o chatbot foi útil para eles. / Depression is one of the most frequent psychological disorders in the world. This disorder has a major impact on the individual’s quality of life, compromises social and family relationships and can lead to suicide. In adolescence, depression is one of the most usual psychological illnesses. Several emotional problems start and peak during this phase of life. In Brazil, for instance, suicide is the third leading cause of death among youngsters. Cognitive-Behavioural Therapy (CBT) has been shown to be effective in treating depression. This type of therapy can also be performed through the computer, without the accompaniment of a therapist. Studies have identified important advantages in computer-mediated communication compared to face-to-face human interaction, such as promoting anonymity and increasing self-disclosure. However, most current CBT-based systems have not shown a satisfactory degree of interactivity. In this scenario, chatbots are an alternative to minor this deficiency of computer based therapy systems. Chatbots are systems created to simulate a real dialogue with users, being able to analyze and influence their behavior. This type of system interacts with the user through the use of natural language. This research project developed a chatbot based on the principles of CBT, whose aim is to dialogue with adolescents who suffer from depression. To build the chatbot Beck, we deployed ChatScript, a computer language tailored for the development of this type of system, which has won several awards. We evaluated the performance and usefulness of our chatbot Beck through a conversation test and a survey conducted with adolescents. The results obtained are very satisfactory: 85.94% of the adolescents answered that they were satisfied with Beck’s performance, and 92.19% of the adolescents agreed that the chatbot was useful for them. Inteligência artificial Processamento de linguagem natural
10	Aspectos do processamento de interfaces em linguagem natural. / Sem título em inglês. Camargo Júnior, João Batista 05 September 1989 (has links) Esta dissertação apresenta alguns formalismos usados no tratamento computacional de linguagens naturais, bem como uma proposta de método de processamento para as mesmas, envolvendo as fases de tradução, planejamento e execução. A etapa de tradução consiste da análise, interpretação e determinação do escopo de sentenças interrogativas. Esta etapa traduz sentenças em linguagem natural para uma forma lógica que representa sua semântica. Na etapa de planejamento, a forma lógica, obtida na etapa de tradução, é convertida em uma regra Prolog a se interpretada durante a etapa de execução. A principal etapa no processamento de linguagem natural é a etapa de tradução. Alguns formalismos, tais como a Gramática de Cláusulas Definidas - DCG, e a Gramática de Extraposição - XG, são discutidos em detalhe, para ilustrar os processos usados durante a tradução. Em seguida é apresentado um protótipo que implementa o interfaceamento de uma base de dados em linguagem natural, no caso um sub-conjunto restrito da língua portuguesa. Finalmente são feitos alguns comentários sobre a perspectiva da utilização da linguagem natural em diversos campos da computação, tais como entendimento de texto, programação automática e engenharia de software. / This work presents a methodology and some formalisms to be used in natural language processing. The present proposal manipulates natural languages by appling three processing steps translation, planning and execution. The translation step consists of parsing, interpreting, and determining the scope of the sentences. This step maps natural language sentences into some logical form that represents its semantics. In the planning step the logical form, obtained in the translation step, is converted into a Prolog rule to be interpreted during the execution step. The most important phase of natural language processing is the translation step. Some formalisms, like Definitive Clause Grammar - DCG and Extraposition Grammar - XG are discussed in detail to illustrate the methods used by the translation step. Next, is presented a prototype that implements a natural language interface to a database, by using a restrict subset of Portuguese language. Finally, some comments are made about the perspectives of using natural language in some fields of computation, such as text understanding, automatic programming and software engineering . Natural language processing Processamento de linguagem natural

Search results