Spelling suggestions: "subject:"semântico."" "subject:"semântica.""
1 |
Wikis semânticos: da Web para a Web Semântica / Semantic Wikis: from the Web to the Semantic WebFerreira, Jaider Andrade [UNESP] 30 July 2014 (has links) (PDF)
Submitted by Jaider Andrade Ferreira (jaideraf@gmail.com) on 2014-08-08T13:12:46Z
No. of bitstreams: 1
ferreira_ja_me_mar.pdf: 2583232 bytes, checksum: 13793146fcfbbf0f3e90673d816e0f8d (MD5) / Made available in DSpace on 2014-08-08T13:12:46Z (GMT). No. of bitstreams: 1
ferreira_ja_me_mar.pdf: 2583232 bytes, checksum: 13793146fcfbbf0f3e90673d816e0f8d (MD5)
Previous issue date: 2014-07-30 / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Com o desenvolvimento das Tecnologias de Informação e Comunicação, a Ciência da Informação precisou repensar a postura tradicional de gerenciamento informacional. O hipertexto, advindo principalmente por meio do ambiente Web, elevou ainda mais a complexidade do tratamento informacional. A popularização da Internet fez com que a Web se tornasse mais interativa e colaborativa tornando comum a utilização de sistemas wiki para o gerenciamento informacional. Idealizada por Tim Berners-Lee, surge a iniciativa da Web Semântica, na qual as máquinas são capazes de analisar os dados presentes na rede. Nesse contexto aparecem os wikis semânticos, caracterizados por fazerem uso das tecnologias da Web Semântica. Diante desse cenário, considera-se que a Ciência da Informação, que já se preocupa com o desenvolvimento da Web e da Web Semântica, deve também se preocupar com os wikis semânticos. Assim, por meio de uma pesquisa descritiva e exploratória, objetivou-se explorar, apresentar e descrever as características dos wikis semânticos com enfoque nas atividades de descrição, de recuperação e de intercâmbio de informações apoiadas em tecnologias da Web Semântica, visando a favorecer o entendimento, a discussão e o uso dessas tecnologias em ambientes informacionais digitais. Após uma apresentação sobre as raízes históricas da Web Semântica, são destacados os padrões de representação, codificação, descrição, relação e consulta de dados estruturados (URI, XML, RDF, RDFS, OWL e SPARQL) que, junto a outras tecnologias, formam a base da Web Semântica e apoiam o funcionamento dos wikis semânticos. Os wikis semânticos são apresentados e definidos como sistemas wiki que se utilizam de tecnologias da Web Semântica para incorporar conhecimento formalizado, conteúdo, estruturas e links em suas páginas. Após essa etapa, são descritas as principais atividades de descrição, de recuperação e de intercâmbio de informações no Semantic MediaWiki, o wiki semântico mais utilizado até o momento. Como considerações finais, entende-se que os wikis semânticos favorecem o entendimento, a discussão e o uso de tecnologias da Web Semântica em ambientes informacionais digitais. / Due to the development of Information and Communication Technologies, Information Science has been forced to rethink the traditional posture of information management. Hypertext, arising mainly through the Web environment, further increased the complexity of the information handling. The popularization of the Internet has led the Web to a more interactive and a more collaborative environment, bringing wiki systems, for example, to manage information in a collaborative way. Conceived by Tim Berners-Lee, there is the Semantic Web initiative in which machines are able to analyze data on the network. In this context, semantic wikis arise: wikis characterized by the use of Semantic Web technologies. Therefore, we believe that Information Science, which cares about the development of the Web and the Semantic Web, should also care about semantic wikis. Thus, by a descriptive and an exploratory research, the objective is to explore, to present and to describe the characteristics of the semantic wikis on the activities of representation, retrieval and exchange of information supported by Semantic Web technologies in order to facilitate the understanding, the discussion, and the use of these technologies in digital information environments. After a presentation about the origins of the Semantic Web, we highlight the data representation, encoding, description, relation, and query standards (URI, XML, RDF, RDFS, OWL and SPARQL) which, with other technologies, form the basis of the Semantic Web and support the functioning of semantic wikis. Semantic wikis are presented and defined as wiki systems that use Semantic Web technologies in order to incorporate formalized knowledge, content, structure and links on their pages. After that, we describe the main activities for information description, retrieval and interchange on Semantic MediaWiki, the most popular and most used semantic wiki engine so far. As conclusion, we consider that semantic wikis can promote understanding, discussions, and use of Semantic Web technologies in digital information environments. / FAPESP: 2011/15085-6
|
2 |
Gramaticalização da preposição a e a interferência de campos semânticos entre as preposições a, em e para.França, Ironildes Santos January 2006 (has links)
146f. / Submitted by Suelen Reis (suziy.ellen@gmail.com) on 2013-05-13T17:50:01Z
No. of bitstreams: 1
Dissertacao Ironildes Franca.pdf: 408703 bytes, checksum: 37100227656b91b1d7a1a8d6f339e10d (MD5) / Approved for entry into archive by Alda Lima da Silva(sivalda@ufba.br) on 2013-06-04T17:04:07Z (GMT) No. of bitstreams: 1
Dissertacao Ironildes Franca.pdf: 408703 bytes, checksum: 37100227656b91b1d7a1a8d6f339e10d (MD5) / Made available in DSpace on 2013-06-04T17:04:07Z (GMT). No. of bitstreams: 1
Dissertacao Ironildes Franca.pdf: 408703 bytes, checksum: 37100227656b91b1d7a1a8d6f339e10d (MD5)
Previous issue date: 2006 / As raízes das preposições a, em e para da língua portuguesa podem ser traçadas desde as preposições latinas ad, in e da locução prepositiva per ad. Esses simples morfemas assumem diversos significados e usos ao longo dos séculos e expressam simples idéias concretas de deslocamento de coisas e/ou pessoas, tanto quanto as mais abstratas noções de dedicação, devoção e atribuição. O objetivo principal deste trabalho é estudar o processo de gramaticalização passado pela preposição a, em textos representativos dos séculos XVI e XVII, e observar até que ponto ocorre interferência de campos semânticos entre as preposições a, em e para, identificando as sutilezas de seus usos. / Salvador
|
3 |
Uma análise de auto-referência baseada em fluxos semânticosda Silva Aguiar, Sergio 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T15:51:05Z (GMT). No. of bitstreams: 2
arquivo1994_1.pdf: 1208830 bytes, checksum: 32c7ea2d84b4aa7902debd9b73581d77 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2008 / O objetivo principal desse trabalho é apresentar uma teoria de ‡uxos (streams
em inglês), que são pares ordenados possivelmente aninhados, capaz de anal-
isar sentenças (proposições) em geral, incluindo aquelas que apresentam auto-
referência. Desejamos que uma teoria geral, como a teoria dos conjuntos, possa
fundamentá-las. Entretanto, teorias clássicas de conjuntos como a ZFC controlam
auto-referência por meio de um axioma - O Axioma da Fundação. Por esse motivo
fundamentamos nossa semântica numa teoria mais abrangente desenvolvida por
Honsell e Forti (1983) e aperfeiçoada por Peter Aczel (1988) - A Teoria dos Hiper-
conjuntos. Na perspectiva dos hiperconjuntos, estruturas com auto-referência
(circularidade) são admitidas sem problemas.
Como desejamos analisar sentenças, isto é, interpretá-las num certo mundo e
avaliá-las, uma das principais preocupações são os critérios …losó…cos do que en-
tendemos como verdade. Por isso, começamos em nosso primeiro capítulo, fazendo
um apanhado geral das teorias …losó…cas da verdade.
A…m de compararmos o poder de interpretação de teorias clássicas com teo-
rias mais modernas como a dos hiperconjuntos, apresentamos, ainda que muito
resumidamente, os principais aspectos da teoria dos conjuntos (ZFC) e em seguida
falamos sobre hiperconjuntos, bissimulação e ‡uxos, cuja compreensão é essencial
para a semântica da linguagem em nossa abordagem.
Com essas noções em mãos, entendemos que podemos analisar proposições
tidas como paradoxais. O principal representante dos paradoxos com auto-
referência é o assim chamado Paradoxo do Mentiroso: “Esta sentença é falsa”. Al-
gumas linguagens foram desenvolvidas objetivando dar uma semântica adequada
ao paradoxo, mas cadas uma delas apresentaram problemas e sofreram críticas por
apresentarem pontos fracos sob alguns aspectos tidos como essenciais. Então,
apresentamos algumas abordagens, concebidas para minimizar esses problemas:
as abordagens de Bertrand Russel, Tarski, Kripke, Barwise & Etchemendy e de
A. N. Prior.
A nossa abordagem baseou-se principalmente numa a…rmação de Prior que
"toda sentença pode ser entendida como uma a…rmação de verdade sobre ela
mesma". Entretanto, apresenta também aspectos semelhantes às linguagens de-
senvolvidas por Tarski (metalinguagens), Kripke (apelo semântico) e Barwise &
Etchemendy (semântica situacional). Desenvolvemos uma linguagem que pode acomodar sentenças em geral, inclusive as que apresentam auto-referência. Al-
guns problemas apresentados em abordagens multivaloradas foram resolvidos, pois
o nosso sistema não apresenta mais do que dois valores para avaliação. Problemas
de linguagens puramente sintáticas também foram sanados, pois a nossa estru-
tura não é baseada apenas em aspectos sintáticos e possui ponto …xo. Com isso
acreditamos que, sem perdermos intuição, ganhamos poder de interpretação.
Acreditamos também que uma prova pode ser interpretada como sendo um
‡uxo semântico, pois é nada mais que uma seqüência de proposições adequada-
mente encadeadas. Sendo assim, no último capítulo falamos sobre provas diretas
e provas por absurdo. Um resultado interessante é que a interpretação de provas
por absurdo dá origem a um objeto potencialmente in…nito bissimilar à sentença
do Mentiroso
|
4 |
Uma biblioteca de componentes semânticos para especificação de linguagens de programaçãoTravassos Sarinho, Victor January 2003 (has links)
Made available in DSpace on 2014-06-12T15:58:53Z (GMT). No. of bitstreams: 2
arquivo4739_1.pdf: 546621 bytes, checksum: 436ff68296454e12baa513372b9a2fe8 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2003 / Semântica de ações, um formalismo para especificação de linguagens de programação,
define um conjunto padrão de operadores que descrevem conceitos comuns encontrados
em linguagens de programação. Estes operadores facilitam a especificação de linguagens
de programação porque eles liberam o projetista de linguagens da manipulação de
definições complexas usadas para descrevê-las.
Entretanto, as especificações em semântica de ações não foram projetadas para
serem reusadas ou estendidas. De fato, copiar/colar especificações é o único caminho
para reutilizar semânticas de linguagens de programação, ou seja, é extremamente
ineficiente e perigosa, no sentido de não produzir uma especificação totalmente
confiável, seja por funções semânticas extremamente restritas à linguagem, seja por
diferenças sintáticas mínimas que impedem uma integração adequada.
Também devemos considerar o fato de que a maioria das linguagens existentes
apresentam uma grande semelhança conceitual do ponto de vista semântico, uma vez que
o desenvolvimento de novas linguagens de programação geralmente é influenciado por
linguagens previamente existente.
Portanto, o objetivo deste trabalho é, através do uso da semântica de ações
baseada em componentes, uma técnica que permite melhorar a reutilização de
especificações em semântica de ações, definir componentes semânticos para estruturas
sintáticas abstratas, capazes de representar conceitos de linguagens de programação
separados pelos diversos paradigmas de linguagens de programação existentes, e
organizados de forma hierárquica garantindo assim um alto grau de reutilização
semântica.
Como resultados, produzimos uma biblioteca de componentes semânticos,
formada pelo agrupamento de componentes semânticos capazes de representar conceitos
de linguagens de expressões, imperativas, funcionais e orientada a objetos; e projetamos
uma linguagem multiparadigma denominada EIFOO, formada pelo agrupamento dos
componentes semânticos especificados em cada um dos paradigmas abordados neste
trabalho
|
5 |
O português culto falado por alemães residentes na cidade de São Paulo: gramaticalização e contato entre línguas / The formal Portuguese spoken by resident germans in São Paulo: grammaticalization and contact between languagesRezagli, Caroline Calderon 31 March 2010 (has links)
O presente trabalho apresenta a análise de orações que contêm a preposição para acompanhada de verbos no infinitivo (para+infinitivo), iniciando orações subordinadas em discursos proferidos por alemães residentes em São Paulo, com o intuito de estabelecer se todas as orações, de fato, constituem a ideia de finalidade, ou se apresentam diferentes valores semânticos. O corpus é constituído por ocorrências retiradas de entrevistas com os referidos alemães feitas por mim. São entrevistas de caráter informal sem tema preestabelecido. A estrutura para+infinitivo foi utilizada em contextos semânticos que põem em dúvida seu valor de finalidade, sendo ambíguos ou apresentando desbotamento semântico. Esses outros sentidos, mais abstratos, indicam um processo de gramaticalização na língua portuguesa falada por esses alemães. A estrutura final na língua alemã apresenta variações: um...zu e damit. Além dessas estruturas, a forma zu+verbo no infinitivo responsável, segundo o Hochdeustch (alemão padrão), por indicar verbos no infinitivo, simplesmente, ou orações subordinadas reduzidas de infinitivo, também se apresentou em contextos que geraram dúvidas quanto à sua significação, sendo, por isso, considerada ambígua. Esse fato apontou para um processo de gramaticalização também na língua alemã. Por haver mais de um elemento na língua alemã traduzido para a língua portuguesa com o significado da preposição para, utilizei traduções (para o alemão) do corpus, bem como dados retirados de blogs alemães e jornais digitais alemães, a fim de estabelecer comparações para o desenvolvimento das análises. Este trabalho, dada sua natureza, pode ser uma relevante contribuição para a compreensão do processo pedagógico de ensino-aprendizagem da língua alemã enquanto L2, demonstrando que pode haver diferentes percepções semânticas de estruturas sintáticas tanto por parte dos alunos quanto dos professores ao produzirem discursos em L1 e em L2. / This work presents the analysis of sentences that contain the preposition to (para) accompanied of verbs in the infinitive (to+infinitive), beginning subordinate sentences in speeches uttered by resident Germans in São Paulo, with the intention of establishing if all the sentences, in fact, constitute the idea of purpose, or if they have different semantic values. The corpus is constituted by occurrences that came from interviews with the referred Germans done by me. They are interviews of informal character without a preestablished theme. The structure to+infinitive was used in semantic contexts that question its purpose value, being ambiguous or presenting semantic fading. Those other meanings, more abstract, indicate the grammaticalization process in the Portuguese language spoken by those Germans. The final structure in the German language presents variations: um...zu and damit. Besides those structures, the form zu+verb in infinitive, according to Hochdeutsch (pattern German), for indicating verbs in the infinitive, simply, or subordinated sentences reduced of infinitive, also came in contexts that generated doubts about its significance, being, for that, considered ambiguous. That fact appeared for a grammaticalization process also in the German language. For there being more than an element in the German language translated for the Portuguese language with the meaning of the preposition to, I used translations (for German) of the corpus, as well as data of German blogs and German online newspapers, in order to establish comparisons for the development of the analyses. The purpose of this work is to contribute in the pedagogic process of teaching-learning of the German language while L2, demonstrating that there can be different semantic perceptions of syntactic structures not only of the students but also of the teachers when they produce speeches in L1 and in L2.
|
6 |
Uma abordagem conexionista para anotação de papéis semânticos / A connectionist approach to semantic role labelingFonseca, Erick Rocha 10 April 2013 (has links)
A anotação de papéis semânticos (APS) é uma subárea do Processamento de Línguas Naturais (PLN) que começou a ser explorada para a língua inglesa a partir de 2002. Seu objetivo é detectar estruturas de predicador e argumentos em sentenças escritas, que correspondem a descrições de eventos (normalmente feitas por verbos); seus participantes, como agente e paciente; e circunstâncias, como tempo, local, etc. Diversas aplicações de PLN, como tradução automática e recuperação de informação, têm obtido melhorias em seu desempenho ao empregar a APS como uma etapa de pré-processamento. Para a língua portuguesa, os avanços na pesquisa de APS são ainda muito incipientes. Dado que a grande maioria dos trabalhos encontrados na literatura desta área emprega aprendizado de máquina supervisionado, um fator limitante tem sido a ausência de dados rotulados em português, problema que apenas recentemente foi parcialmente resolvido com a criação do PropBank-Br. Este recurso segue o modelo de anotação usado no Prop- Bank, o principal conjunto de dados rotulados empregado na tarefa de APS para a língua inglesa. Ainda assim, o PropBank-Br contém menos de um décimo do total de instâncias de dados presentes no PropBank original. Outro ponto a ser observado é que a abordagem mais comum para a APS baseia-se na extração de uma grande quantidade de informação linguística das sentenças de entrada para ser usada por classificadores automáticos. Tal abordagem mostra-se extremamente dependente de outras ferramentas de PLN, característica particularmente indesejável no caso da língua portuguesa, que não possui muitos recursos livremente disponíveis. Em contrapartida, uma outra abordagem bem sucedida encontrada na literatura abre mão do uso de conhecimento linguístico explícito e associa palavras a sequências numéricas, cujos valores são ajustados durante o treinamento de uma rede neural artificial. Estas sequências são então empregadas pela rede para realizar a APS, e podem servir também para outras tarefas de PLN. O presente trabalho seguiu o segundo método descrito acima. Foram implementadas alterações nesse método que permitiram um ganho de desempenho em comparação com sua versão original quando testada no PropBank-Br. A versão final do sistema desenvolvido está pronta para uso e poderá auxiliar pesquisas de PLN em português / Semantic Role Labeling (SRL) is a subfield of Natural Language Processing (NLP) which began to be explored for English in 2002. Its goal is to detect structures of predicate and arguments in written sentences, which correspond to descriptions of events (usually made by verbs); its participants, such as agents and patients; and circumstances, such as time, place, etc. Many NLP applications, as machine translation and information retrieval, have achieved performance gains by applying SRL as a pre-processing step. For Portuguese, advances in SRL research are still in very early stages. Given that the majority of works found in the literature of this area employ supervised machine learning, a limiting factor has been the absence of labeled data in Portuguese, a problem that only recently was partially solved with the creation of PropBank-Br. This resource follows the annotation model used in PropBank, the main labeled data set employed in the SRL task for English. Even then, PropBank-Br contains less than one tenth of the data instances present in the original PropBank. Another point to be observed is that the most common approach to SRL is based on the extraction of a great amount of information from the input sentences to be used by automatic classifiers. Such approach is extremely dependent on other NLP tools, a particularly undesirable feature in the case of Portuguese, which does not have many freely available resources. On the other hand, another succesful approach found in the literature forgoes the use of explicit linguistic knowledge and associates words to numeric sequences, whose values are adjusted during the training of an artificial neural network. These sequences are then employed by the network in order to perform SRL, and can also be useful for other NLP tasks. This work followed the second method described above. Modifications on this method were implemented and allowed for a performance gain in comparison with its original version when tested on PropBank-Br. The final version of the developed system is ready for use and will be able to help NLP research in Portuguese
|
7 |
O português culto falado por alemães residentes na cidade de São Paulo: gramaticalização e contato entre línguas / The formal Portuguese spoken by resident germans in São Paulo: grammaticalization and contact between languagesCaroline Calderon Rezagli 31 March 2010 (has links)
O presente trabalho apresenta a análise de orações que contêm a preposição para acompanhada de verbos no infinitivo (para+infinitivo), iniciando orações subordinadas em discursos proferidos por alemães residentes em São Paulo, com o intuito de estabelecer se todas as orações, de fato, constituem a ideia de finalidade, ou se apresentam diferentes valores semânticos. O corpus é constituído por ocorrências retiradas de entrevistas com os referidos alemães feitas por mim. São entrevistas de caráter informal sem tema preestabelecido. A estrutura para+infinitivo foi utilizada em contextos semânticos que põem em dúvida seu valor de finalidade, sendo ambíguos ou apresentando desbotamento semântico. Esses outros sentidos, mais abstratos, indicam um processo de gramaticalização na língua portuguesa falada por esses alemães. A estrutura final na língua alemã apresenta variações: um...zu e damit. Além dessas estruturas, a forma zu+verbo no infinitivo responsável, segundo o Hochdeustch (alemão padrão), por indicar verbos no infinitivo, simplesmente, ou orações subordinadas reduzidas de infinitivo, também se apresentou em contextos que geraram dúvidas quanto à sua significação, sendo, por isso, considerada ambígua. Esse fato apontou para um processo de gramaticalização também na língua alemã. Por haver mais de um elemento na língua alemã traduzido para a língua portuguesa com o significado da preposição para, utilizei traduções (para o alemão) do corpus, bem como dados retirados de blogs alemães e jornais digitais alemães, a fim de estabelecer comparações para o desenvolvimento das análises. Este trabalho, dada sua natureza, pode ser uma relevante contribuição para a compreensão do processo pedagógico de ensino-aprendizagem da língua alemã enquanto L2, demonstrando que pode haver diferentes percepções semânticas de estruturas sintáticas tanto por parte dos alunos quanto dos professores ao produzirem discursos em L1 e em L2. / This work presents the analysis of sentences that contain the preposition to (para) accompanied of verbs in the infinitive (to+infinitive), beginning subordinate sentences in speeches uttered by resident Germans in São Paulo, with the intention of establishing if all the sentences, in fact, constitute the idea of purpose, or if they have different semantic values. The corpus is constituted by occurrences that came from interviews with the referred Germans done by me. They are interviews of informal character without a preestablished theme. The structure to+infinitive was used in semantic contexts that question its purpose value, being ambiguous or presenting semantic fading. Those other meanings, more abstract, indicate the grammaticalization process in the Portuguese language spoken by those Germans. The final structure in the German language presents variations: um...zu and damit. Besides those structures, the form zu+verb in infinitive, according to Hochdeutsch (pattern German), for indicating verbs in the infinitive, simply, or subordinated sentences reduced of infinitive, also came in contexts that generated doubts about its significance, being, for that, considered ambiguous. That fact appeared for a grammaticalization process also in the German language. For there being more than an element in the German language translated for the Portuguese language with the meaning of the preposition to, I used translations (for German) of the corpus, as well as data of German blogs and German online newspapers, in order to establish comparisons for the development of the analyses. The purpose of this work is to contribute in the pedagogic process of teaching-learning of the German language while L2, demonstrating that there can be different semantic perceptions of syntactic structures not only of the students but also of the teachers when they produce speeches in L1 and in L2.
|
8 |
Anotação automática de papéis semânticos de textos jornalísticos e de opinião sobre árvores sintáticas não revisadas / Automatic semantic role labeling on non-revised syntactic trees of journalistic and opinion textsHartmann, Nathan Siegle 25 June 2015 (has links)
Contexto: A Anotação de Papéis Semânticos (APS) é uma tarefa da área de Processamento de Línguas Naturais (PLN) que permite detectar os eventos descritos nas sentenças e os participantes destes eventos (Palmer et al., 2010). A APS responde perguntas como Quem?, Quando?, Onde?, O quê?, e Por quê?, dentre outras e, sendo assim, é importante para várias aplicações de PLN. Para anotar automaticamente um texto com papéis semânticos, a maioria dos sistemas atuais emprega técnicas de Aprendizagem de Máquina (AM). Porém, alguns papéis semânticos são previsíveis e, portanto, não necessitam ser tratados via AM. Além disso, a grande maioria das pesquisas desenvolvidas em APS tem dado foco ao inglês, considerando as particularidades gramaticais e semânticas dessa língua, o que impede que essas ferramentas e resultados sejam diretamente transportados para outras línguas. Revisão da Literatura: Para o português do Brasil, há três trabalhos finalizados recentemente que lidam com textos jornalísticos, porém com performance inferior ao estado da arte para o inglês. O primeiro (Alva- Manchego, 2013) obteve 79,6 de F1 na APS sobre o córpus PropBank.Br; o segundo (Fonseca, 2013), sem fazer uso de um treebank para treinamento, obteve 68,0 de F1 sobre o córpus PropBank.Br; o terceiro (Sequeira et al., 2012) realizou anotação apenas dos papéis Arg0 (sujeito prototípico) e Arg1 (paciente prototípico) no córpus CETEMPúblico, com performance de 31,3 pontos de F1 para o primeiro papel e de 19,0 de F1 para o segundo. Objetivos: O objetivo desse trabalho de mestrado é avançar o estado da arte na APS do português brasileiro no gênero jornalístico, avaliando o desempenho de um sistema de APS treinado com árvores sintáticas geradas por um parser automático (Bick, 2000), sem revisão humana, usando uma amostragem do córpus PLN-Br. Como objetivo adicional, foi avaliada a robustez da tarefa de APS frente a gêneros diferentes, testando o sistema de APS, treinado no gênero jornalístico, em uma amostra de revisões de produtos da web. Esse gênero não foi explorado até então na área de APS e poucas de suas características foram formalizadas. Resultados: Foi compilado o primeiro córpus de opiniões sobre produtos da web, o córpus Buscapé (Hartmann et al., 2014). A diferença de performance entre um sistema treinado sobre árvores revisadas e outro sobre árvores não revisadas ambos no gênero jornalístico foi de 10,48 pontos de F1. A troca de gênero entre as fases de treinamento e teste, em APS, é possível, com perda de performance de 3,78 pontos de F1 (córpus PLN-Br e Buscapé, respectivamente). Foi desenvolvido um sistema de inserção de sujeitos não expressos no texto, com precisão de 87,8% no córpus PLN-Br e de 94,5% no córpus Buscapé. Foi desenvolvido um sistema, baseado em regras, para anotar verbos auxiliares com papéis semânticos modificadores, com confiança de 96,76% no córpus PLN-Br. Conclusões: Foi mostrado que o sistema de Alva-Manchego (2013), baseado em árvores sintáticas, desempenha melhor APS do que o sistema de Fonseca (2013), independente de árvores sintáticas. Foi mostrado que sistemas de APS treinados sobre árvores sintáticas não revisadas desempenham melhor APS sobre árvores não revisadas do que um sistema treinado sobre dados gold-standard. Mostramos que a explicitação de sujeitos não expressos nos textos do Buscapé, um córpus do gênero de opinião de produtos na web, melhora a performance da sua APS. Também mostramos que é possível anotar verbos auxiliares com papéis semânticos modificadores, utilizando um sistema baseado em regras, com alta confiança. Por fim, mostramos que o uso do sentido do verbo, como feature de AM, para APS, não melhora a perfomance dos sistemas treinados sobre o PLN-Br e o Buscapé, por serem córpus pequenos. / Background: Semantic Role Labeling (SRL) is a Natural Language Processing (NLP) task that enables the detection of events described in sentences and the participants of these events (Palmer et al., 2010). SRL answers questions such as Who?, When?, Where?, What? and Why? (and others), that are important for several NLP applications. In order to automatically annotate a text with semantic roles, most current systems use Machine Learning (ML) techniques. However, some semantic roles are predictable, and therefore, do not need to be classified through ML. In spite of SRL being well advanced in English, there are grammatical and semantic particularities that prevents full reuse of tools and results in other languages. Related work: For Brazilian Portuguese, there are three studies recently concluded that performs SRL in journalistic texts. The first one (Alva-Manchego, 2013) obtained 79.6 of F1 on the SRL of the PropBank.Br corpus; the second one (Fonseca, 2013), without using a treebank for training, obtained 68.0 of F1 for the same corpus; and the third one (Sequeira et al., 2012) annotated only the Arg0 (prototypical agent) and Arg1 (prototypical patient) roles on the CETEMPúblico corpus, with a perfomance of 31.3 of F1 for the first semantic role and 19.0 for the second one. None of them, however, reached the state of the art of the English language. Purpose: The goal of this masters dissertation was to advance the state of the art of SRL in Brazilian Portuguese. The training corpus used is from the journalistic genre, as previous works, but the SRL annotation is performed on non-revised syntactic trees, i.e., generated by an automatic parser (Bick, 2000) without human revision, using a sampling of the corpus PLN-Br. To evaluate the resulting SRL classifier in another text genre, a sample of product reviews from web was used. Until now, product reviews was a genre not explored in SRL research, and few of its characteristics are formalized. Results: The first corpus of web product reviews, the Buscapé corpus (Hartmann et al., 2014), was compiled. It is shown that the difference in the performance of a system trained on revised syntactic trees and another trained on non-revised trees both from the journalistic genre was of 10.48 of F1. The change of genres during the training and testing steps in SRL is possible, with a performance loss of 3.78 of F1 (corpus PLN-Br and Buscapé, respectively). A system to insert unexpressed subjects reached 87.8% of precision on the PLN-Br corpus and a 94.5% of precision on the Buscapé corpus. A rule-based system was developed to annotated auxiliary verbs with semantic roles of modifiers (ArgMs), achieving 96.76% confidence on the PLN-Br corpus. Conclusions: First we have shown that Alva-Manchego (2013) SRL system, that is based on syntactic trees, performs better annotation than Fonseca (2013)s system, that is nondependent on syntactic trees. Second the SRL system trained on non-revised syntactic trees performs better over non-revised trees than a system trained on gold-standard data. Third, the explicitation of unexpressed subjects on the Buscapé texts improves their SRL performance. Additionally, we show it is possible to annotate auxiliary verbs with semantic roles of modifiers, using a rule-based system. Last, we have shown that the use of the verb sense as a feature of ML, for SRL, does not improve the performance of the systems trained over PLN-Br and Buscapé corpus, since they are small.
|
9 |
SWoDS: Semantic Web (of Data) ServiceAndrade, Leandro José Silva 05 December 2014 (has links)
Submitted by Santos Davilene (davilenes@ufba.br) on 2016-05-25T16:24:08Z
No. of bitstreams: 1
DissertacaoMestradoDCC_Leandro_Andrade.pdf: 4292793 bytes, checksum: 81fe16e2cd1e5c84283f5931ba388398 (MD5) / Made available in DSpace on 2016-05-25T16:24:08Z (GMT). No. of bitstreams: 1
DissertacaoMestradoDCC_Leandro_Andrade.pdf: 4292793 bytes, checksum: 81fe16e2cd1e5c84283f5931ba388398 (MD5) / Criada com a proposta inicial de conectar basicamente documentos HTML, a Web
hoje expandiu suas capacidades, tornando-se um ambiente bastante heterogêneo de
aplicações, recursos, dados e usuários que interagem entre si. A proposta da Web
Semântica, associada aos Serviços Web, busca estabelecer padrões que viabilizem a
comunicação entre aplicações heterogêneas na Web. A Web de Dados, outra linha de
evolução da Web, fornece orientações (Linked Data) sobre como usar as tecnologias da
Web Semântica para publicar e definir ligações semânticas entre dados de diferentes
fontes. Contudo, existe uma lacuna na integração entre aplicações baseadas em Serviços
Web e aplicações da Web de Dados. Essa lacuna ocorre porque os Serviços Web
são “executados”, enquanto que a Web de Dados é “consultada”. Dessa forma, esta
dissertação apresenta o Semantic Web (of Data) Services (SWoDS) com objetivo de
prover Serviços Web a partir de bases Linked Data. O Semantic Web (of Data) Services
pode preencher a lacuna entre Serviços Web e aplicações baseadas na Web de Dados,
fazendo que a Web de Dados seja “executada” através de Serviços Web Semânticos.
Assim, permitindo que dados Linked Data, através do SWoDS, integrem aos Serviços
Web, por meio de operações de composição automática e descoberta de serviços.
|
10 |
Contando uma história: ficcionando uma dissertação sobre a relação entre professor e aluno / Narrating a story: make a master's thesis about teacher-student interactionPaulo, João Pedro Antunes de [UNESP] 14 January 2016 (has links)
Submitted by JOÃO PEDRO ANTUNES DE PAULO (jpadepaula@hotmail.com) on 2016-01-22T17:04:19Z
No. of bitstreams: 1
PAULO,JPA (1).PDF: 3271784 bytes, checksum: d688e6b6f249d35c6853a786206cc413 (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-01-25T15:48:39Z (GMT) No. of bitstreams: 1
paulo_jpa_me_rcla.pdf: 3271784 bytes, checksum: d688e6b6f249d35c6853a786206cc413 (MD5) / Made available in DSpace on 2016-01-25T15:48:39Z (GMT). No. of bitstreams: 1
paulo_jpa_me_rcla.pdf: 3271784 bytes, checksum: d688e6b6f249d35c6853a786206cc413 (MD5)
Previous issue date: 2016-01-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O objetivo deste trabalho é fazer uma Leitura da relação entre professor e aluno a partir das falas de alunos de um curso de Licenciatura em Matemática, a fim de constituir legitimidades que possibilitem ao pesquisador dizer sobre a influência daquela relação na prática docente daqueles alunos. Para atingir este objetivo foram mobilizados como referencial teórico o Modelo dos Campos Semânticos, a escrita em narrativa e a ficção. Apresentando a sua história no decorrer do curso de mestrado o pesquisador tece considerações sobre: a relação entre professor e aluno como uma construção social; o fazer pesquisa como uma prática de descentramento; e, as possibilidades da ficção como uma perspectiva de teorização em Educação Matemática. / The purpose of this research is produce a 'Read' of the teacher-student interaction from speech of students of mathematics teacher education courses. This 'Read' aims constitute legitimacy that make possible the researcher speak about influence of this interaction in the teaching practice of those students. To achieve this goal it was mobilized the theoretical foundations of the Model of Semantic Fields, the writing in narrative and the fiction. Presenting a story of your history in the master degree, the researcher weaves considerations about: the teacher-student interaction as a social construction; research like a 'descentramento' pratice (critical awareness about myself and my certainties); and the possibilities of fiction like a perspective of teorization in Mathematics Education.
|
Page generated in 0.0607 seconds