Spelling suggestions: "subject:"processamento dda linguagem batural"" "subject:"processamento dda linguagem datural""
71 |
Feature-level sentiment analysis applied to brazilian portuguese reviewsFreitas, Larissa Astrogildo de 23 March 2015 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-05-19T12:00:48Z
No. of bitstreams: 1
468945 - Txto Completo.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) / Made available in DSpace on 2015-05-19T12:00:48Z (GMT). No. of bitstreams: 1
468945 - Txto Completo.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5)
Previous issue date: 2015-03-23 / Funda??o de Amparo ? Pesquisa do Estado do Rio Grande do Sul - FAPERGS / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / Sentiment Analysis is the field of study that analyzes people?s opinions in texts. In the last decade, humans have come to share their opinions in social media on the Web (e.g., forum discussions and posts in social network sites). Opinions are important because whenever we need to take a decision, we want to know others? points of view. The interest of industry and academia in this field of study is partly due to its potential applications, such as: marketing, public relations and political campaign. Research in this field often considers English data, while data from other languages are less explored. It is possible realize data analysis in different levels, in this work we choose a finer-grain analysis, at aspect-level. Ontologies can represent aspects, that are ?part-of? an object or property of ?part-of? an object, we proposed a method for feature-level sentiment analysis using ontologies applied to Brazilian Portuguese reviews. In order to obtain a complete analysis, we recognized features explicit and implicit using ontologies. Relatively less work has been done about implicit feature identification. Finally, determine whether the sentiment in relation to the aspects is positive or negative using sentiment lexicons and linguistic rules. Our method is comprised of four steps: preprocessing, feature identification, polarity identification and summarizing. For evaluate this work, we apply our proposal method to a dataset of accommodation sector. According to our experiments, in general the best results were obtained when using TreeTagger, synsets with polarities from Onto.PT and linguistic rule (adjective position) for negative polarity identification and (baseline) for positive polarity identificatio / An?lise de sentimento ? o campo de estudo que analisa a opini?o de pessoas em textos. Na ?ltima d?cada, humanos t?m compartilhado suas opini?es em m?dias sociais na Web (por exemplo, f?runs de discuss?o e posts em sites de redes sociais). Opini?es s?o importantes porque sempre que necessitamos tomar uma decis?o, queremos saber o ponto de vista de outras pessoas. O interesse da ind?stria e da academia neste campo de estudo se deve a aplica??es potenciais, tais como: compra/venda, rela??es p?blicas e campanhas pol?ticas. Pesquisas neste campo muitas vezes consideram dados em ingl?s, enquanto dados em outros idiomas s?o pouco explorados. ? poss?vel realizar a an?lise dos dados em diferentes n?veis, neste trabalho optamos pela an?lise no n?vel de aspecto, na qual a granularidade ? mais fina. Como ontologias podem ser utilizadas para representar aspectos, que s?o ?parte-de? um objeto ou propriedade de ?parte-de? um objeto, propomos um m?todo para an?lise de sentimento aplicado a coment?rios em portugu?s brasileiro, sob o n?vel de aspecto usando ontologias. A fim de obter uma an?lise completa, reconhecemos aspectos expl?citos e impl?citos usando ontologias. Relativamente poucos trabalhos t?m sido feitos sobre identifica??o de aspectos impl?citos. Finalmente determinamos se o sentimento em rela??o aos aspectos ? positivo ou negativo usando l?xicos de sentimento e regras lingu?sticas. Nosso m?todo ? composto de quatro etapas: pr?-processamento, identifica??o de aspecto, identifica??o de polaridade e sumariza??o. Para avaliar este trabalho, aplicamos o m?todo proposto nos coment?rios do setor hoteleiro. De acordo com nosso experimento, o melhor resultado obtido foi quando utilizamos o TreeTagger, o synset com polaridade do Onto.PT e a regra lingu?stica (posi??o do adjetivo) na identifica??o da polaridade negativa e (baseline) na identifica??o da polaridade positiva
|
72 |
Extra??o de rela??es hipon?micas em corpora de l?ngua portuguesaMachado, Pablo Neves 26 March 2015 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-06-08T11:20:00Z
No. of bitstreams: 1
470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5) / Made available in DSpace on 2015-06-08T11:20:00Z (GMT). No. of bitstreams: 1
470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5)
Previous issue date: 2015-03-26 / Natural Language Processing (NLP) is a Computer Science area featured by its relevance
to the development of applications that process large amounts of text or speech.
In this paper we focus on texts in Portuguese, extracting from them hyponymic relations
between entities, using a rules-based approach adapted from Hearst to English, and
Freitas and Quental and Taba and Caseli to Portuguese. The prototype was executed over
a corpus of Portuguese texts and the output was analyzed according to the reference
author and rule sets. The evaluation process followed the one proposed by Freitas and
Quental with human judgment, and the results are compared to those reported in the main
references. The dissertation also studies in detail the most common errors identified. / O Processamento da Linguagem Natural (PLN) ? uma ?rea da Ci?ncia da Computa??o
destacada por sua relev?ncia para o desenvolvimento de aplica??es em processamento
de grandes quantidades de documentos textuais ou orais.
Neste trabalho focamos nos textos em l?ngua portuguesa, deles extraindo rela??es
hipon?micas entre entidades, usando uma abordagem baseada em regras adaptadas dos
trabalhos de Hearst para o ingl?s, Freitas e Quental e Taba e Caseli para o portugu?s,
aqui complementadas.
Para validar a proposta foi desenvolvido um prot?tipo que extrai rela??es hipon?micas de
corpora em l?ngua portuguesa. O prot?tipo foi executado sobre corpus de textos e os
resultados obtidos foram analisados tanto por fonte de refer?ncia como por grupos de
regras. O processo avaliativo seguiu o proposto por Freitas e Quental com avalia??o
humana, e as medidas obtidas s?o comparadas com as relatadas nas principais fontes de
refer?ncia. A disserta??o ainda estuda em detalhe os erros mais frequentes identificados.
|
73 |
Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpediaWeber, Cristofer 16 March 2015 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-12-14T19:55:10Z
No. of bitstreams: 1
476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) / Made available in DSpace on 2015-12-14T19:55:11Z (GMT). No. of bitstreams: 1
476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5)
Previous issue date: 2015-03-16 / Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. / Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos
a partir de corpus de exemplo, mas a obten??o destes exemplos pode ser um gargalo. Neste
trabalho n?s investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem dispon?veis
de forma gratuita, podem ser utilizados como corpus para a classifica??o de entidades nomeadas,
uma tarefa fundamental de extra??o de informa??es e um passo necess?rio para outras tarefas como
extra??o de rela??es e resolu??o de co-refer?ncias.
|
74 |
Identifying potential conflicts between norms in contractsAires, Jo?o Paulo de Souza 07 August 2015 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-04-18T11:41:31Z
No. of bitstreams: 1
DIS_JOAO_PAULO_DE_SOUZA_AIRES_COMPLETO.pdf: 962726 bytes, checksum: 42f46ef4c73e4f45496827e72b7fbf27 (MD5) / Made available in DSpace on 2016-04-18T11:41:31Z (GMT). No. of bitstreams: 1
DIS_JOAO_PAULO_DE_SOUZA_AIRES_COMPLETO.pdf: 962726 bytes, checksum: 42f46ef4c73e4f45496827e72b7fbf27 (MD5)
Previous issue date: 2015-08-07 / Contracts formally represent agreements between parties and often involve the exchange
of goods and services. In contracts, norms define the expected behaviors of the parties using deontic statements, such as obligations, permissions, and prohibitions. However, norms may conflict invalidating themselves and producing a contract inconsistency. A conflict arises when two or more norms are applied to the same context but have different deontic statements, such as permissions x obligations and prohibitions x obligations. The identification of such conflicts is often made by humans, which makes the task time consuming and error-prone. In order to automate such identification, in this work we propose an approach to identify potential conflicts between norms in contracts written in natural language. We build a two-phase approach that extracts norms and norm elements from contracts, creating a norm representation that we use to compare norms and identify
potential conflicts. We evaluated the approach using a corpus of contracts with norm conflicts inserted, and we measured the accuracy for different cases of conflict, which resulted on values higher than 70%. / Contratos s?o utilizados para formalizar acordos envolvendo troca de bens e servi?os entre
duas ou mais partes. Eles definem a??es esperadas durante o per?odo de vig?ncia do contrato
atrav?s de normas. Tais normas seguem conceitos baseados em l?gica de?ntica, definindo permiss?es,
proibi??es e obriga??es. No entanto, conflitos podem ser gerados quando duas normas s?o
aplicadas a um mesmo contexto tendo sentidos de?nticos diferentes, como a proibi??o e a obriga??o
da realiza??o de uma mesma a??o. Estes conflitos invalidam as normas e criam uma inconsist?ncia
para o contrato. Para evit?-los ? necess?rio que um revisor leia as normas e encontre quais
apresentam elementos conflitantes. Uma vez que contratos podem ser longos e complexos, esta
tarefa consome tempo e ? pass?vel de erro humano. Para automatizar o processo de identifica??o
de conflitos, neste trabalho criamos uma abordagem que busca identificar potenciais conflitos entre
normas atrav?s da compara??o de suas estruturas. Nossa abordagem ? dividida em duas fases: na
primeira, identificamos as normas e seus elementos dentro de um contrato; na segunda, utilizamos os
elementos extra?dos para comparar diferentes normas e identificar quais apresentam caracter?sticas
de um conflito normativo. N?s avaliamos a abordagem aplicando-a em contratos contendo conflitos
e obtivemos resultados com acur?cia superior a 70%.
|
75 |
Heart: processos criativos (comunicativos) envolvendo mídias orgânicas e não-orgânicasOliveira, Adriana Gomes de 14 December 2009 (has links)
Made available in DSpace on 2016-04-26T18:18:21Z (GMT). No. of bitstreams: 1
Adriana Gomes de Oliveira.pdf: 28670380 bytes, checksum: beb3039565f99d6352fd5740c2749cbd (MD5)
Previous issue date: 2009-12-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / From the cross-combination of biological and technological systems language
emerges.
Human language is manifested by operator mechanism in which minimal units of
meaning can be found. These units are widely exploited in poetry and can be
trained, since they are important hypermedia tools; in themselves they are
communication tools.
The informational contact with any and every system changes that system through
what constitutes its form of organization through language that, in humans, have
emotions and feelings as an ontology.
Evolving technologies help us to infer about our own ontology or ontologies that
make up reality due to organizational similarities.
The field of art is a suitable field for tests with such technologies, where a specific
fruition time-space is established.
In this research we present this finding about the time-space specifically to the
enjoyment of art when the proposition appears implemented with evolutionary tools
exploring verbal language, since a differential coupling can manifests itself in the
scope of verbal language, in these biological-technological interactions involving
computers.
This observation about language expands to human-computer interactions when
hardware and software interfaces are not working properly / Do cruzamento de sistemas biológicos e tecnológicos emerge linguagem.
Linguagem humana se manifesta por um mecanismo operador no qual unidades
mínimas de significação podem ser encontradas. Essas unidades são largamente
exploradas pela poesia e podem ser treinadas, visto que constituem-se como
importantes ferramentas hipermidiáticas; em si mesmas, ferramentas de
comunicação.
O contato informacional com todo e qualquer sistema modifica-o pelo que constitui
sua forma de organização via linguagem que, nos seres humanos, têm emoções e
sentimentos como uma ontologia.
Tecnologias evolutivas ajudam-nos a depreender sobre nossas próprias ontologias
ou ontologias que compõem a realidade devido a isomorfismos organizacionais.
O terreno da arte é o campo propício para experimentações com tais tecnologias,
onde um tempo-espaço de fruição específico se instaura.
Apresenta-se, nesta pesquisa esta constatação acerca do tempo-espaço
específico para fruição de arte quando a proposição se apresenta implementada
com ferramentas evolutivas explorando linguagem verbal, visto que um
acoplamento diferenciado pode se manifestar no âmbito da linguagem verbal,
nestas interações biológico-tecnológico envolvendo computadores.
Esta constatação acerca da linguagem expande-se para interações Homemcomputadores
quando interfaces de hardware e software não estejam funcionando
corretamente
|
76 |
O efeito de priming sint?tico no processamento de senten?as ativas e passivas do portugu?s brasileiro / The syntatic priming effect in the processing of actives and passives sentences in brazilian portugueseTeixeira, Mariana Terra 29 March 2016 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-07-08T16:48:09Z
No. of bitstreams: 1
DIS_MARIANA_TERRA_TEIXEIRA_COMPLETO.pdf: 1514041 bytes, checksum: 8ec22d9e8b8120788ca51b607cfac661 (MD5) / Made available in DSpace on 2016-07-08T16:48:09Z (GMT). No. of bitstreams: 1
DIS_MARIANA_TERRA_TEIXEIRA_COMPLETO.pdf: 1514041 bytes, checksum: 8ec22d9e8b8120788ca51b607cfac661 (MD5)
Previous issue date: 2016-03-29 / Syntactic priming is the effect of repeating a sentence structure previously processed. In general, in natural languages, active sentences are more frequent than passive structures in spoken language (88% in English, 92% in Dutch, 89.5% in Brazilian Portuguese). Nonetheless, passive structures such as ?the woman was helped by the man? are also produced. It is possible to stimulate the production of passive (or infrequent) structures using a passive sentence as a prime (hence, syntactic priming). The effect of priming occurs when a passive sentence is offered and, subsequently, the speaker generates a passive sentence, indicating these two structures have a structural relation between them. In this research, we investigated the effect of syntactic priming during production of active and passive sentences by children and adults who are speakers of Brazilian Portuguese (BP). Our experiment is based on Segaert et al.?s (2011) syntactic priming paradigm of sentence production, used with Dutch adults. Our participants were 8 and 9-year-old-children, regularly enrolled in the public schools of the Project ACERTA (Avalia??o de Crian?as Em Risco de Transtorno de Aprendizagem from Instituto do C?rebro do Rio Grande do Sul (InsCer), and undergraduate students of the Pontif?cia Universidade Cat?lica do Rio Grande do Sul (PUCRS) and Universidade Federal do Rio Grande do Sul (UFRGS). The objectives of this research were: (i) to investigate syntactic processing in children and adults using the syntactic priming paradigm; (ii) to investigate the syntactic priming effect in BP; (iii) to analyze the baseline (unprovoked, not-primed) frequency of passive and active sentences in oral language of BP speakers; (iv) to compare the production of passive and active structures in children and adults; (v) to address a possible effect of syntactic priming in the light of the cognitive theory of Implicit Learning (CHANG, DELL, GRIFFIN & BOCK, 2000; CHANG, DEEL & BOCK, 2006). The results indicate the baseline proportion of 89,5% of active sentences and 10,5% of passive in oral production in BP; the generation of passives by adults was higher than by children; the children produced, in addition to passive structures, other structures to topicalize non-agent. The production of short and long passives with agentive verbs seems to be productive in BP children in the study; the greater production of passives by adults may be related to a more frequent contact with reading and writing. The effect of syntactic priming occurred in children but not in adult speakers of BP. / Priming sint?tico ? a facilita??o no processamento de uma senten?a posterior, quando uma senten?a com a mesma estrutura foi processada anteriormente. Nas l?nguas naturais em geral, na oralidade, produzimos mais frases na voz ativa (88% em ingl?s, 92% em holand?s e 89,5% em portugu?s brasileiro, por exemplo ? SEGAERT et al. 2011; PINCKERING & BRANIGAN, 1998) do que na voz passiva. Entretanto, senten?as passivas e outras estruturas transitivas tamb?m s?o produzidas. ? poss?vel estimular a produ??o de estruturas passivas (ou de estruturas infrequentes), como ?A mulher foi ajudada pelo homem?, se for dado ao falante, em um momento anterior, um prime passivo, como a senten?a ?O menino foi fotografado pela menina?. O efeito de priming sint?tico ocorre quando, ao ser induzido, em um primeiro momento, a produzir uma frase na voz passiva, o falante gera, em um segundo momento, uma senten?a tamb?m na voz passiva, indicando que essas duas senten?as t?m uma rela??o estrutural entre si. Neste trabalho, investigamos o efeito de priming sint?tico na produ??o de senten?as ativas e passivas de crian?as e adultos falantes de portugu?s brasileiro (PB). Nosso experimento ? baseado no paradigma de priming sint?tico na produ??o de senten?as de Segaert et al. (2011), feito com adultos holandeses. Os participantes do presente estudo s?o crian?as de 8 e 9 anos regularmente matriculadas em escolas p?blicas vinculadas ao Projeto ACERTA (Avalia??o de Crian?as Em Risco de Transtorno de Aprendizagem), do Instituto do C?rebro do Rio Grande do Sul, e adultos estudantes de gradua??o da Pontif?cia Universidade Cat?lica do Rio Grande do Sul e da Universidade Federal do Rio Grande do sul. Os objetivos desta pesquisa s?o (i) investigar o processamento sint?tico de senten?as ativas e passivas de crian?as e adultos atrav?s do efeito de priming sint?tico; (ii) verificar, pela primeira vez em portugu?s brasileiro, a exist?ncia do efeito de priming sint?tico em estruturas ativas e passivas do PB; (iii) analisar a frequ?ncia de senten?as passivas e ativas na linguagem oral em portugu?s brasileiro; (iv) comparar a produ??o de senten?as passivas de crian?as e adultos; e (v) verificar se o efeito de priming sint?tico pode ser explicado pela teoria cognitiva de Implicit Learning (CHANG; DELL; GRIFFIN; BOCK, 2000; CHANG; DELL; BOCK, 2006). Os resultados indicam a propor??o de 89,5% de senten?as ativas e 10,5% de senten?as passivas na produ??o oral em PB; a produ??o de passivas de adultos ? maior do que a das crian?as que utilizam, al?m da passiva, outras estruturas para topicalizar o participante afetado pelo evento. A produ??o de passivas curtas e longas com verbos agentivos parece ser produtiva nas crian?as falantes de PB deste estudo; a maior produ??o de passivas por adultos parece estar relacionada ? leitura e ? escrita. O efeito de priming sint?tico se manifestou significativamente em crian?as e n?o foi encontrado em adultos falantes do PB, o que parece ser mais uma evid?ncia de que priming sint?tico ? implicit learning.
|
77 |
Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil / Research of word sense disambiguation methods for verbs in brazilian portugueseMarco Antonio Sobrevilla Cabezudo 28 August 2015 (has links)
A Desambiguação Lexical de Sentido (DLS) consiste em determinar o sentido mais apropriado da palavra em um contexto determinado, utilizando-se um repositório de sentidos pré-especificado. Esta tarefa é importante para outras aplicações, por exemplo, a tradução automática. Para o inglês, a DLS tem sido amplamente explorada, utilizando diferentes abordagens e técnicas, contudo, esta tarefa ainda é um desafio para os pesquisadores em semântica. Analisando os resultados dos métodos por classes gramaticais, nota-se que todas as classes não apresentam os mesmos resultados, sendo que os verbos são os que apresentam os piores resultados. Estudos ressaltam que os métodos de DLS usam informações superficiais e os verbos precisam de informação mais profunda para sua desambiguação, como frames sintáticos ou restrições seletivas. Para o português, existem poucos trabalhos nesta área e só recentemente tem-se investigado métodos de uso geral. Além disso, salienta-se que, nos últimos anos, têm sido desenvolvidos recursos lexicais focados nos verbos. Nesse contexto, neste trabalho de mestrado, visou-se investigar métodos de DLS de verbos em textos escritos em português do Brasil. Em particular, foram explorados alguns métodos tradicionais da área e, posteriormente, foi incorporado conhecimento linguístico proveniente da Verbnet.Br. Para subsidiar esta investigação, o córpus CSTNews foi anotado com sentidos de verbos usando a WordNet-Pr como repositório de sentidos. Os resultados obtidos mostraram que os métodos de DLS investigados não conseguiram superar o baseline mais forte e que a incorporação de conhecimento da VerbNet.Br produziu melhorias nos métodos, porém, estas melhorias não foram estatisticamente significantes. Algumas contribuições deste trabalho de mestrado foram um córpus anotado com sentidos de verbos, a criação de uma ferramenta que auxilie a anotação de sentidos, a investigação de métodos de DLS e o uso de informações especificas de verbos (provenientes da VerbNet.Br) na DLS de verbos. / Word Sense Disambiguation (WSD) aims at identifying the appropriate sense of a word in a given context, using a pre-specified sense-repository. This task is important to other applications as Machine Translation. For English, WSD has been widely studied, using different approaches and techniques, however, this task is still a challenge for researchers in Semantics. Analyzing the performance of different methods by the morphosyntactic class, note that not all classes have the same results, and the worst results are obtained for Verbs. Studies highlight that WSD methods use shallow information and Verbs need deeper information for its disambiguation, like syntactic frames or selectional restrictions. For Portuguese, there are few works in WSD and, recently, some works for general purpose. In addition, it is noted that, recently, have been developed lexical resources focused on Verbs. In this context, this master work aimed at researching WSD methods for verbs in texts written in Brazilian Portuguese. In particular, traditional WSD methods were explored and, subsequently, linguistic knowledge of VerbNet.Br was incorporated in these methods. To support this research, CSTNews corpus was annotated with verb senses using the WordNet-Pr as a sense-repository. The results showed that explored WSD methods did not outperform the hard baseline and the incorporation of VerbNet.Br knowledge yielded improvements in the methods, however, these improvements were not statistically significant. Some contributions of this work were the sense-annotated corpus, the creation of a tool for support the sense-annotation, the research of WSD methods for verbs and the use of specific information of verbs (from VerbNet.Br) in the WSD of verbs.
|
78 |
Método semi-automático de construção de ontologias parciais de domínio com base em textos. / Semi-automatic method for the construction of partial domain ontologies based on texts.Luiz Carlos da Cruz Carvalheira 31 August 2007 (has links)
Os recentes desenvolvimentos relacionados à gestão do conhecimento, à web semântica e à troca de informações eletrônicas por meio de agentes têm suscitado a necessidade de ontologias para descrever de modo formal conceituações compartilhadas à respeito dos mais variados domínios. Para que computadores e pessoas possam trabalhar em cooperação é necessário que as informações por eles utilizadas tenham significados bem definidos e compartilhados. Ontologias são instrumentos viabilizadores dessa cooperação. Entretanto, a construção de ontologias envolve um processo complexo e longo de aquisição de conhecimento, o que tem dificultado a utilização desse tipo de solução em mais larga escala. Este trabalho apresenta um método de criação semi-automática de ontologias a partir do uso de textos de um domínio qualquer para a extração dos conceitos e relações presentes nesses textos. Baseando-se na comparação da freqüência relativa dos termos extraídos com os escritos típicos da língua e na extração de padrões lingüísticos específicos, este método identifica termos candidatos a conceitos e relações existentes entre eles, apresenta-os a um ontologista para validação e, ao final, disponibiliza a ontologia ratificada para publicação e uso especificando-a na linguagem OWL. / The recent developments related to knowledge management, the semantic web and the exchange of electronic information through the use of agents have increased the need for ontologies to describe, in a formal way, shared understanding of a given domain. For computers and people to work in cooperation it is necessary that information have well defined and shared definitions. Ontologies are enablers of that cooperation. However, ontology construction remains a very complex and costly process, which has hindered its use in a wider scale. This work presents a method for the semi-automatic construction of ontologies using texts of any domain for the extraction of concepts and relations. By comparing the relative frequency of terms in the text with their expected use and extracting specific linguistic patterns, the method identifies concepts and relations and specifies the corresponding ontology using OWL for further use by other applications.
|
79 |
Produ??o de textos paralelos em l?ngua portuguesa e uma interl?ngua de librasSantos, Guilherme Spolavori dos 05 March 2009 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-10-13T13:35:03Z
No. of bitstreams: 1
DIS_GUILHERME_SPOLAVORI_DOS_SANTOS_COMPLETO.pdf: 1568900 bytes, checksum: 7b9bd74b5c4753cb8e210573b49d6adf (MD5) / Made available in DSpace on 2016-10-13T13:35:03Z (GMT). No. of bitstreams: 1
DIS_GUILHERME_SPOLAVORI_DOS_SANTOS_COMPLETO.pdf: 1568900 bytes, checksum: 7b9bd74b5c4753cb8e210573b49d6adf (MD5)
Previous issue date: 2009-03-05 / This work embraces the Human-Computer Interaction and the Natural Language Processing areas of knowledge, touching accessibility concepts, based on one textual simplification architecture and on one corpus structure. The result of this research is the generation of parallel texts ? in the Portuguese Language version and in Brazilian Sign Language (LIBRAS) version ? with the objective of supplying a data repository created for future works in the Natural Language Processing area that have relation with the language of the Brazilian deaf people. This work presents a theoretical revision where are discussed questions like studies about LIBRAS linguistic aspects, acquisition of a second language in the deaf community as well as concepts of textual simplification. Complementing this discussion, related works are presented as contributions concerning to the application of the referred concepts. Based on this revision, this work studies the architecture and the functionalities of the Editor de Anota??es de Simplifica??o, in the context of PorSimples
project, as a platform for the development of a module of textual generation in a LIBRAS interlingua which is based in a simplification process. At last, the functionalities of the module are explored by a LIBRAS expert and the generated texts are analyzed searching for future improvements in the process of text production. / Esse trabalho situa-se nas ?reas de Intera??o Humano-Computador e Processamento de Linguagem Natural, atuando em conceitos sobre acessibilidade, a partir de uma arquitetura de simplifica??o textual e uma estrutura de corpus. O resultado da pesquisa trata da produ??o de textos paralelos ? na vers?o da L?ngua Portuguesa e na vers?o da L?ngua Brasileira de Sinais (LIBRAS) ? como forma de abastecer um reposit?rio de dados para trabalhos futuros na ?rea de processamento de l?ngua natural envolvendo a l?ngua dos surdos brasileiros. Sendo assim, foi elaborado um referencial te?rico em que, al?m de estudos sobre aspectos lingu?sticos da LIBRAS e aquisi??o da segunda l?ngua pelo surdo, faz-se refer?ncia a conceitos da simplifica??o textual. De forma complementar, trabalhos relacionados s?o apresentados como contribui??es no que diz respeito ? aplica??o desses conceitos. A partir disso, o trabalho estuda a arquitetura e funcionalidades do Editor de Anota??es de Simplifica??o, dentro do contexto do projeto PorSimples, como plataforma para o desenvolvimento de um m?dulo de produ??o textual em uma interl?ngua da LIBRAS baseado em um processo de simplifica??o. Por fim, as funcionalidades do m?dulo s?o exploradas por um especialista da l?ngua de sinais em quest?o e os textos produzidos s?o analisados buscando melhorias no processo de produ??o dos textos.
|
80 |
Evaluation of methods for taxonomic relation extraction from text / Avalia??o de m?todos para extra??o autom?tica de rela??es a partir de textosGranada, Roger Leitzke 28 September 2015 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-12-26T16:34:57Z
No. of bitstreams: 1
TES_ROGER_LEITZKE_GRANADA_COMPLETO.pdf: 2483840 bytes, checksum: 8f81d3f0496d8fa8d3a1b013dfdf932b (MD5) / Made available in DSpace on 2016-12-26T16:34:57Z (GMT). No. of bitstreams: 1
TES_ROGER_LEITZKE_GRANADA_COMPLETO.pdf: 2483840 bytes, checksum: 8f81d3f0496d8fa8d3a1b013dfdf932b (MD5)
Previous issue date: 2015-09-28 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / Sistemas de informa??o modernos t?m mudado a ideia ?processamento de dados? para a ideia de ?processamento de conceitos?, assim, ao inv?s de processarem palavras, tais sistemas fazem o processamento de conceitos que cont?m ignificado e que compartilham contextos com outros contextos. Ontologias s?o normalmente utilizadas como uma estrutura que captura o conhecimento a cerca de uma certa ?rea, provendo conceitos e rela??es entre tais conceitos. Tradicionalmente, hierarquias de conceitos s?o constru?das manualmente por engenheiros do conhecimento ou especialistas do dom?nio. Entretanto, este tipo de constru??o sofre com diversas limita??es, tais como, cobertura e o alto custo de extens?o e manuten??o. Assim, se faz necess?ria a constru??o de tais estruturas automaticamente. O suporte (semi-)automatico no desenvolvimento de ontologias ? comumente referenciado como aprendizagem de ontologias e ? normalmente dividido em etapas, como identifica??o de conceitos, detec??o de rela??es hierarquicas e n?o hierarquicas, e extra??o de axiomas. ? razo?vel dizer que entre tais passos a fronteira est? no estabelecimento de hierarquias de conceitos, pois ? a espinha dorsal das ontologias e, por consequ?ncia, uma boa hierarquia de conceitos ? um recurso v?lido para v?rias aplica??es de ontologias. Hierarquias de conceitos s?o representadas por estruturas em ?rvore com relacionamentos de especializa??o/generaliza??o, onde conceitos nos n?veis mais baixos s?o mais espec?ficos e conceitos nos n?veis mais altos s?o mais gerais. A constru??o autom?tica de tais hierarquias ? uma tarefa complexa e desde a d?cada de 80 muitos trabalhos t?m proposto melhores formas para fazer a extra??o de rela??es entre conceitos. Estas propostas nunca foram contrastadas usando um mesmo conjunto de dados. Tal compara??o ? importante para ver se os m?todos s?o complementares ou incrementais, bem como se apresentam diferentes tend?ncias em rela??o ? precis?o e abrang?ncia, i.e., alguns podem ser bastante precisos e ter uma baixa abrang?ncia enquanto outros t?m uma abrang?ncia melhor por?m com uma baixa precis?o. Outro aspecto refere-se ? varia??o dos resultados em diferentes l?nguas. Esta tese avalia os m?todos utilizando m?tricas de hierarquias como densidade e profundidade, e m?tricas de evalia??o como precis?o e abrang?ncia. A avalia??o ? realizada utilizando o mesmo corpora, consistindo de textos paralelos e compar?veis em ingl?s e portugu?s. S?o realizadas avalia??es autom?tica e manual, sendo a sa?da de sete m?todos avaliados automaticamente e quatro manualmente. Os resultados d?o uma luz sobre a abrang?ncia dos m?todos que s?o utilizados no estado da arte de acordo com a literatura. / Modern information systems are changing the idea of ?data processing? to the idea of ?concept
processing?, meaning that instead of processing words, such systems process semantic concepts
which carry meaning and share contexts with other concepts. Ontology is commonly used as a
structure that captures the knowledge about a certain area via providing concepts and relations
between them. Traditionally, concept hierarchies have been built manually by knowledge engineers or domain
experts. However, the manual construction of a concept hierarchy suffers from several limitations
such as its coverage and the enormous costs of extension and maintenance. Furthermore, keeping
up with a hand-crafted concept hierarchy along with the evolution of domain knowledge is an
overwhelming task, being necessary to build concept hierarchies automatically. The (semi-)automatic support in ontology development is usually referred to as ontology learning.
The ontology learning from texts is usually divided in steps, going from concepts identification,
passing through hierarchy and non-hierarchy relations detection and, seldom, axiom extraction. It
is reasonable to say that among these steps the current frontier is in the establishment of concept
hierarchies, since this is the backbone of ontologies and, therefore, a good concept hierarchy is
already a valuable resource for many ontology applications. A concept hierarchy is represented with a tree-structured form with specialization/generalization
relations between concepts, in which lower-level concepts are more specific while higher-level are
more general. The automatic construction of concept hierarchies from texts is a complex task and
since the 1980 decade a large number of works have been proposing approaches to better extract
relations between concepts. These different proposals have never been contrasted against each other
on the same set of data and across different languages. Such comparison is important to see whether
they are complementary or incremental, also we can see whether they present different tendencies
towards recall and precision, i.e., some can be very precise but with very low recall and others can
achieve better recall but low precision. Another aspect concerns to the variation of results for different languages. This thesis evaluates
these different methods on the basis of hierarchy metrics such as density and depth, and evaluation
metrics such as Recall and Precision. The evaluation is performed over the same corpora, which
consist of English and Portuguese parallel and comparable texts. Both automatic and manual
evaluations are presented. The output of seven methods are evaluated automatically and the output
of four methods are evaluated manually. Results shed light over the comprehensive set of methods
that are the state of the art according to the literature in the area.
|
Page generated in 0.1307 seconds