• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 11
  • Tagged with
  • 11
  • 11
  • 10
  • 9
  • 4
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

A terminologia dos equipamentos médicos utilizados nas Unidades de Terapia Intensiva (UTIs): uma proposta de estudo / The terminology of medical equipment used in Intensive Care Units (ICUs): a study proposal

Ribeiro, Pâmela Teixeira 30 November 2015 (has links)
O objetivo geral do estudo proposto é analisar a terminologia presente em manuais de empresas fabricantes de equipamentos médicos utilizados nas Unidades de Terapia Intensiva UTIs, cujo tema foi definido em parceria com os especialistas do Grupo de Engenharia Biomédica da UNIFEI. Primeiramente, levantamos a lista dos equipamentos médicos utilizados em UTIs, com o auxílio dos especialistas, e formamos um corpus de estudo. Verificamos a existência de possíveis variantes denominativas no corpus constituído e, posteriormente, analisamos as relações semânticas estabelecidas entre os termos validados. A identificação e a extração dos termos presentes nos manuais foram realizadas por meio da plataforma Terminus, desenvolvida pelo Grupo IULATERM, do Institut Universitari de Lingüística Aplicada da Universitat Pompeu Fabra. A partir dos dados coletados, pudemos verificar a existência de muitas variantes e propusemos uma análise das relações semânticas existentes entre eles. Para esta pesquisa, adotamos a perspectiva teórica veiculada pela Teoria Comunicativa da Terminologia TCT, que considera que as unidades terminológicas são parte da língua geral e apresentam as mesmas características desta, comportando variações denominativas e outros fenômenos. / The overall goal of the proposed study is to analyze the terminology used in manuals of manufacturers of medical equipment used in Intensive Care Units ICUs, theme established in partnership with UNIFEI´s Group of Experts on Biomedical Engineering. First, with the support from experts, a list of medical devices used in ICUs was raised and a study corpus generated. We searched possible denominational variants in the constituted corpus and then analyzed the semantic relations between the validated terms. The identification and extraction of these terms from the manuals were made by the Terminus platform developed by IULATERM Group, Institute for Applied Linguistics at Universitat Pompeu Fabra. From the data collected, we could confirm the existence of many variants and, therefore, propose an analysis of the semantic relationships among them. For this research, we adopted the theoretical perspective conveyed by the Communicative Theory of Terminology, which considers that the terminological units are part of the general language and have the same characteristics, comprising denominational variations and other phenomena.
2

Extração automática de relações semânticas a partir de textos escritos em português do Brasil

Taba, Leonardo Sameshima 11 July 2013 (has links)
Made available in DSpace on 2016-06-02T19:06:08Z (GMT). No. of bitstreams: 1 5456.pdf: 1895896 bytes, checksum: 0a6d9c5bee84eaab067717a8c3e11b11 (MD5) Previous issue date: 2013-07-11 / Universidade Federal de Minas Gerais / Information extraction (IE) is one of the many applications in Natural Language Processing (NLP); it focuses on processing texts in order to retrieve specific information about a certain entity or concept. One of its subtasks is the automatic extraction of semantic relations between terms, which is very useful in the construction and improvement of linguistic resources such as ontologies and lexical bases. Moreover, there s a rising demand for semantic knowledge, as many computational NLP systems need that information in their processing. Applications such as information retrieval from web documents and automatic translation to other languages could benefit from that kind of knowledge. However, there aren t sufficient human resources to produce that knowledge at the same rate of its demand. Aiming to solve that semantic data scarcity problem, this work investigates how binary semantic relations can be automatically extracted from Brazilian Portuguese texts. These relations are based on Minsky s (1986) theory and are used to represent common sense knowledge in the Open Mind Common Sense no Brasil (OMCS-Br) project developed at LIA (Laboratório de Interação Avanc¸ada), partner of LaLiC (Laborat´orio de Lingu´ıstica Computacional), where this research was conducted, both in Universidade Federal de São Carlos (UFSCar). The first strategies for this task were based on searching textual patterns in texts, where a certain textual expression indicates that there is a specific relation between two terms in a sentence. This approach has high precision but low recall, which led to the research of methods that use machine learning as their main model, encompassing techniques such as probabilistic and statistical classifiers and also kernel methods, which currently figure among the state of the art. Therefore, this work investigates, implements and evaluates some of these techniques in order to determine how and to which extent they can be applied to the automatic extraction of binary semantic relations in Portuguese texts. In that way, this work is an important step in the advancement of the state of the art in information extraction for the Portuguese language, which still lacks resources in the semantic area, and also advances the Portuguese language NLP scenario as a whole. / A extração de informação (EI) é uma das muitas aplicações do Processamento de Língua Natural (PLN); seu foco é o processamento de textos com o objetivo de recuperar informações específicas sobre uma determinada entidade ou conceito. Uma de suas subtarefas é a extração automática de relações semânticas entre termos, que é muito útil na construção e melhoramento de recursos linguísticos como ontologias e bases lexicais. A esse contexto soma-se o fato de que há uma demanda crescente por conhecimento semântico, visto que diversos sistemas computacionais de PLN necessitam dessas informações em seu processamento. Aplicações como recuperação de informação em documentos web e tradução automática para outros idiomas podem se beneficiar desse tipo de conhecimento. No entanto, não há recursos humanos suficientes para produzir esse conhecimento na mesma velocidade que sua demanda. Com o objetivo de remediar essa escassez de dados semânticos, esta dissertação apresenta a investigação da extração automática de relações semânticas binárias a partir de textos escritos no português do Brasil. Tais relações se baseiam na teoria de Minsky (1986) e são usadas para representar conhecimento de senso comum no projeto Open Mind Common Sense no Brasil (OMCS-Br) desenvolvido no LIA (Laboratório de Interação Avançada), laboratório parceiro do LaLiC (Laboratório de Linguística Computacional) no qual esta pesquisa se desenvolveu, ambos da Universidade Federal de São Carlos (UFSCar). As primeiras estratégias para essa tarefa se basearam na busca de padrões textuais em textos, onde uma determinada expressão textual indica que há uma relação específica entre dois termos em uma sentença. Essa abordagem tem alta precisão mas baixa cobertura, o que levou ao estudo de métodos que utilizam aprendizado de máquina como modelo principal, englobando o uso de técnicas como classificadores probabilísticos e estatísticos, além de métodos de kernel, que atualmente figuram no estado da arte. Esta dissertação apresenta a investigação, implementação e avaliação de algumas dessas técnicas com o objetivo de determinar como e em que medida elas podem ser aplicadas para a extração automática de relações semânticas binárias em textos escritos em português. Desse modo, este trabalho é um importante passo no avanço do estado da arte em extração de informação com foco no idioma português, que ainda carece de recursos na área semântica, além de um avanço no cenário de PLN do português como um todo.
3

A terminologia dos equipamentos médicos utilizados nas Unidades de Terapia Intensiva (UTIs): uma proposta de estudo / The terminology of medical equipment used in Intensive Care Units (ICUs): a study proposal

Pâmela Teixeira Ribeiro 30 November 2015 (has links)
O objetivo geral do estudo proposto é analisar a terminologia presente em manuais de empresas fabricantes de equipamentos médicos utilizados nas Unidades de Terapia Intensiva UTIs, cujo tema foi definido em parceria com os especialistas do Grupo de Engenharia Biomédica da UNIFEI. Primeiramente, levantamos a lista dos equipamentos médicos utilizados em UTIs, com o auxílio dos especialistas, e formamos um corpus de estudo. Verificamos a existência de possíveis variantes denominativas no corpus constituído e, posteriormente, analisamos as relações semânticas estabelecidas entre os termos validados. A identificação e a extração dos termos presentes nos manuais foram realizadas por meio da plataforma Terminus, desenvolvida pelo Grupo IULATERM, do Institut Universitari de Lingüística Aplicada da Universitat Pompeu Fabra. A partir dos dados coletados, pudemos verificar a existência de muitas variantes e propusemos uma análise das relações semânticas existentes entre eles. Para esta pesquisa, adotamos a perspectiva teórica veiculada pela Teoria Comunicativa da Terminologia TCT, que considera que as unidades terminológicas são parte da língua geral e apresentam as mesmas características desta, comportando variações denominativas e outros fenômenos. / The overall goal of the proposed study is to analyze the terminology used in manuals of manufacturers of medical equipment used in Intensive Care Units ICUs, theme established in partnership with UNIFEI´s Group of Experts on Biomedical Engineering. First, with the support from experts, a list of medical devices used in ICUs was raised and a study corpus generated. We searched possible denominational variants in the constituted corpus and then analyzed the semantic relations between the validated terms. The identification and extraction of these terms from the manuals were made by the Terminus platform developed by IULATERM Group, Institute for Applied Linguistics at Universitat Pompeu Fabra. From the data collected, we could confirm the existence of many variants and, therefore, propose an analysis of the semantic relationships among them. For this research, we adopted the theoretical perspective conveyed by the Communicative Theory of Terminology, which considers that the terminological units are part of the general language and have the same characteristics, comprising denominational variations and other phenomena.
4

Conexões léxico-culturais sobre as minas goianas setecentistas no Livro para servir no registro do caminho novo de Parati / Lexical and cultural connections about the mines of Goiás in the eighteenth century in Livro para servir no registro do caminho novo de Parati

Xavier, Vanessa Regina Duarte 24 May 2012 (has links)
Esta tese tem como propósito ratificar que o estudo lexical de manuscritos pertencentes ao códice intitulado Livro para servir no registro do caminho novo de Parati Thomé Ignácio da Costa Mascarenhas (1724-1762) muito revela a respeito da formação sociocultural da então recém-criada Capitania de Goiás, durante o ciclo do ouro. Para tanto, realizou-se a edição semidiplomática de noventa e dois documentos escritos de 1751 a 1753 em Vila Boa de Goiás, uma vez que estes abordam aspectos variados da administração, economia, política, religião, cultura, assim como da estrutura jurídica e militar local. Conferiu-se rigor à aplicação dos critérios de edição, com vistas a assegurar a sua fidedignidade e, consequentemente, de toda a pesquisa. Foram inventariados os substantivos, adjetivos e verbos para a elaboração de um Índice de Frequência e de Ocorrências dos Itens Lexicais, à luz do produzido por Ferreira et al. (2005), a fim de se obter o vocabulário empregado no corpus e de mapear os principais assuntos abordados, correlacionando-os com a frequência de uso das lexias. Procedeu-se, então, à estruturação e análise dos campos lexicais mais representativos das temáticas do corpus, com base em aspectos histórico-sociais da Capitania goiana, tendo em vista que o léxico é o nível da língua que mais se conecta ao universo extralinguístico (BIDERMAN, 1981; SAPIR, 1961). A composição dos campos lexicais baseou-se nos princípios da semântica estrutural, especificamente em teóricos como Coseriu (1977), Geckeler (1976) e Vilela (1979), levando em conta as relações semânticas entre os itens lexicais e os arquilexemas dos campos, mais especificamente, a sinonímia, a antonímia, a meronímia e a hiponímia, identificando-se também os casos de homonímia e de polissemia. Os resultados dessa pesquisa apontam que o estudo dos campos lexicais a partir das associações semânticas entre seus membros não pode prescindir da consideração do universo discursivo, bem como do contexto sociocultural no qual se fundamentam, haja vista que os significados resultam do processamento cognitivo das experiências físicas, biológicas e sociais. / This thesis aims to ratify that lexical study of manuscripts belonging to the codex titled Livro para servir no registro do caminho novo de Parati Thomé Ignácio da Costa Mascarenhas (1724-1762) reveals much about the socio-cultural formation of the newly created Capitania de Goiás, during the cycle of the gold. To this end, did realized the semi-diplomatic edition of ninety-two documents written from 1751 to 1753 in Vila Boa de Goiás, since that approach different aspects of administration, economy, politics, religion, culture, and of the regional legal and military structure. Gave up rigorous application of criteria for editing, in order to ensure its reliability and, consequently, of all the research. Were inventoried the nouns, adjectives and verbs for the preparation of an Index of Frequency and Occurrences of Lexical Items, in the light of that produced by Ferreira et al. (2005), in order to get the vocabulary used in the corpus and mapping the main subjects approached, by correlating them with the frequency of use of the lexias. Proceeded, then, to structuring and analysis of lexical fields more representative of the themes of the corpus, based on historical and social aspects Capitania de Goiás, given that the lexicon is the level of language that connects more to the extralinguistic universe ( BIDERMAN, 1981; SAPIR, 1961). The composition of lexical fields was based on the principles of structural semantics, specifically in theoretical that Coseriu (1977), Geckeler (1976) and Vilela (1979), taking into account the semantic relationships between lexical items and arquilexemas of the fields, more specifically, the synonymy, the antonymy, the meronymy and the hyponymy, identifying the cases of homonymy and polysemy. The results of this study indicate that the study of lexical fields on semantic associations among its members cant escape of the consideration of the universe of discourse, and the sociocultural context in which they are based, given that the meanings result from cognitive processing of physical, biological and social experiences.
5

Conexões léxico-culturais sobre as minas goianas setecentistas no Livro para servir no registro do caminho novo de Parati / Lexical and cultural connections about the mines of Goiás in the eighteenth century in Livro para servir no registro do caminho novo de Parati

Vanessa Regina Duarte Xavier 24 May 2012 (has links)
Esta tese tem como propósito ratificar que o estudo lexical de manuscritos pertencentes ao códice intitulado Livro para servir no registro do caminho novo de Parati Thomé Ignácio da Costa Mascarenhas (1724-1762) muito revela a respeito da formação sociocultural da então recém-criada Capitania de Goiás, durante o ciclo do ouro. Para tanto, realizou-se a edição semidiplomática de noventa e dois documentos escritos de 1751 a 1753 em Vila Boa de Goiás, uma vez que estes abordam aspectos variados da administração, economia, política, religião, cultura, assim como da estrutura jurídica e militar local. Conferiu-se rigor à aplicação dos critérios de edição, com vistas a assegurar a sua fidedignidade e, consequentemente, de toda a pesquisa. Foram inventariados os substantivos, adjetivos e verbos para a elaboração de um Índice de Frequência e de Ocorrências dos Itens Lexicais, à luz do produzido por Ferreira et al. (2005), a fim de se obter o vocabulário empregado no corpus e de mapear os principais assuntos abordados, correlacionando-os com a frequência de uso das lexias. Procedeu-se, então, à estruturação e análise dos campos lexicais mais representativos das temáticas do corpus, com base em aspectos histórico-sociais da Capitania goiana, tendo em vista que o léxico é o nível da língua que mais se conecta ao universo extralinguístico (BIDERMAN, 1981; SAPIR, 1961). A composição dos campos lexicais baseou-se nos princípios da semântica estrutural, especificamente em teóricos como Coseriu (1977), Geckeler (1976) e Vilela (1979), levando em conta as relações semânticas entre os itens lexicais e os arquilexemas dos campos, mais especificamente, a sinonímia, a antonímia, a meronímia e a hiponímia, identificando-se também os casos de homonímia e de polissemia. Os resultados dessa pesquisa apontam que o estudo dos campos lexicais a partir das associações semânticas entre seus membros não pode prescindir da consideração do universo discursivo, bem como do contexto sociocultural no qual se fundamentam, haja vista que os significados resultam do processamento cognitivo das experiências físicas, biológicas e sociais. / This thesis aims to ratify that lexical study of manuscripts belonging to the codex titled Livro para servir no registro do caminho novo de Parati Thomé Ignácio da Costa Mascarenhas (1724-1762) reveals much about the socio-cultural formation of the newly created Capitania de Goiás, during the cycle of the gold. To this end, did realized the semi-diplomatic edition of ninety-two documents written from 1751 to 1753 in Vila Boa de Goiás, since that approach different aspects of administration, economy, politics, religion, culture, and of the regional legal and military structure. Gave up rigorous application of criteria for editing, in order to ensure its reliability and, consequently, of all the research. Were inventoried the nouns, adjectives and verbs for the preparation of an Index of Frequency and Occurrences of Lexical Items, in the light of that produced by Ferreira et al. (2005), in order to get the vocabulary used in the corpus and mapping the main subjects approached, by correlating them with the frequency of use of the lexias. Proceeded, then, to structuring and analysis of lexical fields more representative of the themes of the corpus, based on historical and social aspects Capitania de Goiás, given that the lexicon is the level of language that connects more to the extralinguistic universe ( BIDERMAN, 1981; SAPIR, 1961). The composition of lexical fields was based on the principles of structural semantics, specifically in theoretical that Coseriu (1977), Geckeler (1976) and Vilela (1979), taking into account the semantic relationships between lexical items and arquilexemas of the fields, more specifically, the synonymy, the antonymy, the meronymy and the hyponymy, identifying the cases of homonymy and polysemy. The results of this study indicate that the study of lexical fields on semantic associations among its members cant escape of the consideration of the universe of discourse, and the sociocultural context in which they are based, given that the meanings result from cognitive processing of physical, biological and social experiences.
6

Traços linguísticos e culturais de Goiás no século XVIII: vertentes lexicais no diário de viagem do barão de Mossâmedes / Linguistic and cultural trails of Goiás in the eighteenth century: lexical aspects in the travel diary of baron Mossâmedes

Assunção, Daniane da Silva 31 August 2016 (has links)
Submitted by Cássia Santos (cassia.bcufg@gmail.com) on 2017-06-22T11:59:12Z No. of bitstreams: 2 Dissertação - Daniane da Silva Assunção - 2016.pdf: 6581967 bytes, checksum: eb5e3c3b3ae47236372aab7a66cd7acc (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-07-10T13:45:39Z (GMT) No. of bitstreams: 2 Dissertação - Daniane da Silva Assunção - 2016.pdf: 6581967 bytes, checksum: eb5e3c3b3ae47236372aab7a66cd7acc (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-07-10T13:45:39Z (GMT). No. of bitstreams: 2 Dissertação - Daniane da Silva Assunção - 2016.pdf: 6581967 bytes, checksum: eb5e3c3b3ae47236372aab7a66cd7acc (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2016-08-31 / This study investigated and analyzed the lexical fields from the book Travel Diary of Baron Mossâmedes: 1771-1773, in relation to geographic, military, the descriptions of places, parties, religiosity and all of cultural aspects present in corpus, consisting of 63 folios. The book, edited and commented by Antonio César Caldas Pinheiro and Gustavo Neiva Coelho (2006), reports the two trips for the fourth governor of Mines of Goyazes, José de Almeida de Vasconcellos Soveral and Carvalho: the first trip departing from Rio de Janeiro to Vila Boa, then capital of Goyaz State and the second through the interior thereof. The inventory and analysis of lexias were performed according to the theory of lexical fields, developed by Eugenio Coseriu (1977) and Horst Geckeler (1971). Through this diary, you can know the history about culture in Goiás and analyze the most important lexical fields and characteristic of the people, the culture and the political and administrative organization of the Captaincy of Goyaz in that time. There was a study of the historical context about this period that can better describe the relationship between lexicon, culture and society. They were prepared the lexicographical records of lexias inventoried consulting the Bluteau dictionaries (1712-1728) and Silva (1813). Finally, it built up a glossary in order to get a better understanding of the history described in the Journal. / Este estudo investigou e analisou os campos lexicais a partir do livro Diário de Viagem do Barão de Mossâmedes: 1771-1773, em relação aos aspectos geográficos, militares, às descrições dos lugares, das festas, da religiosidade e de todos os aspectos culturais presentes no corpus, que é constituído por 63 fólios. O livro, editado e comentado por Antônio César Caldas Pinheiro e Gustavo Neiva Coelho (2006), relata as duas viagens realizadas pelo quarto governador das Minas dos Goyazes, José de Almeida de Vasconcellos Soveral e Carvalho: a primeira viagem partindo do Rio de Janeiro até Vila Boa, então capital da capitania de Goyaz; e a segunda pelo interior da mesma. A inventariação e a análise das lexias foram realizadas segundo a teoria dos campos lexicais, desenvolvida por Eugenio Coseriu (1977) e Horst Geckeler (1971). Através desse Diário, é possível conhecer a história da cultura goiana e analisar os campos lexicais mais importantes e característicos das pessoas, da cultura e da organização político-administrativa da Capitania de Goyaz na época referida. Fez-se um estudo do contexto histórico desse período para melhor descrever a relação entre léxico, cultura e sociedade. Foram elaboradas as fichas lexicográficas das lexias inventariadas consultando os dicionários Bluteau (1712-1728) e Silva (1813). Por fim, construiu-se um glossário com o intuito de se ter uma melhor compreensão da história descrita no Diário.
7

A coesão textual em narrativas de alunos do 7° ano do ensino fundamental

Matei, Maria Helena Corrêa da Silva 19 October 2012 (has links)
Made available in DSpace on 2016-04-28T19:33:37Z (GMT). No. of bitstreams: 1 Maria Helena Correa da Silva Matei.pdf: 3516642 bytes, checksum: 30c0fdf76699477b6904ae35602c0d0f (MD5) Previous issue date: 2012-10-19 / This dissertation is linked to a line of research Leitura, Escrita e Ensino of the Program of Post Graduation in the Portuguese Language of the Pontifícia Universidade Católica de São Paulo. Having in mind the Learning Expectations present in the Pedagogic Project of two public schools in the East Metropolitan Area of the city of São Paulo, at the first place, it has been checked the models used by the students to build up the semantic relations responsible for the cohesion of their texts. Immediately after that, it has been defined, in the production of the text of these students the resources that present inadequacies and to close, it has been checked whether the students of the 7th grade of the secondary school of these schools have established the cohesion in the adequate form in the school years that correspond to their age group (11-13 years old). For the examination, it has been opted for genre short stories, as it has been contemplated in the schools since the first grade. The choice has been based in the hypotheses that is easier to analyse the student s writing, when using textual outputs, which structure is or should be familiar to their authors. For that, it has been adopted the concept of text advocated by Beaugrande (1997): communicative event where the actions of linguist order, cognitive and socials, are related. From those actions, it has been highlighted the ones of linguist order and prioritization has been given to the concepts of cohesion proposed by Fávero (2010), who conceives cohesion in a level different from the one of the coherence. The analyse has shown us that the strategy of the cohesion are presented in the productions. However, the students from one school, as well as the students from the other one, have shown certain cohesive inabilities in relation to what is expected from them at the end of school years spent in the secondary school, considering that the Learning Expectation orient the teaching of the Portuguese language in the Municipal schools of the city of São Paulo / de Estudos Pós-Graduados em Língua Portuguesa da Pontifícia Universidade Católica de São Paulo. Tendo em vista as Expectativas de Aprendizagem presentes no Projeto Pedagógico de duas escolas públicas da Região Leste do Município de São Paulo, verificamos, em primeiro lugar, os modos pelos quais alguns alunos constroem as relações semânticas responsáveis pela coesão em seus textos. Em seguida, definimos, nas produções textuais desses alunos, os recursos que apresentam inadequações e, por fim, averiguamos se os alunos do 7º ano do Ensino Fundamental II dessas escolas estabelecem a coesão de forma adequada à língua escrita ensinada nos anos escolares que correspondem à sua faixa etária (entre 11 e 13 anos). Para o exame, optamos pelo gênero conto, pois este vem sendo contemplado desde o Ciclo I nas escolas. A escolha foi baseada na hipótese de que é mais fácil analisar a escrita discente quando partimos de produções textuais cuja estrutura é, ou deveria, ser familiar aos seus autores. Para tanto, adotamos o conceito de texto preconizado por Beaugrande (1997): evento comunicativo em que as ações de ordem linguística, cognitivas e sociais estão relacionadas. Dessas ações, destacamos as de ordem linguística e priorizamos os conceitos de coesão, propostos por Fávero (2010), que concebe a coesão em um nível distinto do da coerência. A análise mostrou-nos que as estratégias de coesão estão presentes nas produções. Porém, tanto alunos de uma das escolas como os de outra apresentam certas inabilidades coesivas em relação ao que deles é esperado ao final desses anos do Ciclo II, considerando que as Expectativas de Aprendizagem norteiam o ensino de Língua Portuguesa nas escolas municipais de São Paulo
8

Aprendizado automático de relações semânticas entre tags de folksonomias.

RÊGO, Alex Sandro da Cunha. 05 June 2018 (has links)
Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2018-06-05T14:49:44Z No. of bitstreams: 1 ALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdf: 1783053 bytes, checksum: 4ae3b5d42dde739cfd57afaa25fd7e63 (MD5) / Made available in DSpace on 2018-06-05T14:49:44Z (GMT). No. of bitstreams: 1 ALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdf: 1783053 bytes, checksum: 4ae3b5d42dde739cfd57afaa25fd7e63 (MD5) Previous issue date: 2016 / As folksonomias têm despontado como ferramentas úteis de gerenciamento online de conteúdo digital. A exemplo dos populares websites Delicious, Flickr e BibSonomy, diariamente os usuários utilizam esses sistemas para efetuar upload de recursos web (e.g., url, fotos, vídeos e referências bibliográficas) e categorizá-los por meio de tags. A ausência de relações semânticas do tipo sinonímia e hiperonímia/hiponímia no espaço de tags das folksonomias reduz a capacidade do usuário de encontrar recursos relevantes. Para mitigar esse problema, muitos trabalhos de pesquisa se apoiam na aplicação de medidas de similaridade para detecção de sinonímia e construção automática de hierarquias de tags por meio de algoritmos heurísticos. Nesta tese de doutorado, o problema de detecção de sinonímia e hiperonímia/hiponímia entre pares de tags é modelado como um problema de classificação em Aprendizado de Máquina. A partir da literatura, várias medidas de similaridade consideradas boas indicadoras de sinonímia e hiperonímia/hiponímia foram identificadas e empregadas como atributos de aprendizagem. A incidência de um severo desbalanceamento e sobreposição de classes motivou a investigação de técnicas de balanceamento para superar ambos os problemas. Resultados experimentais usando dados reais das folksonomias BibSonomy e Delicious mostraram que a abordagem proposta denominada CPDST supera em termos de acurácia o baseline de melhor desempenho nas tarefas de detecção de sinonímia e hiperonímia/hiponímia. Também, aplicou-se a abordagem CPDST no contexto de geração de listas de tags semanticamente relacionadas, com o intuito de prover acesso a recursos adicionais anotados com outros conceitos pertencentes ao domínio da busca. Além da abordagem CPDST, foram propostos dois algoritmos fundamentados no acesso ao WordNet e ConceptNet para sugestão de listas especializadas com tags sinônimas e hipônimas. O resultado de uma avaliação quantitativa demonstrou que a abordagem CPDST provê listas de tags relevantes em relação às listas providas pelos métodos comparados. / Folksonomies have emerged as useful tools for online management of digital content. Popular websites as Delicious, Flickr and BibSonomy are now widespread with thousands of users using them daily to upload digital content (e.g., webpages, photos, videos and bibliographic information) and tagging for later retrieval. The lack of semantic relations such as synonym and hypernym/hyponym in the tag space may diminish the ability of users in finding relevant resources. Many research works in the literature employ similarity measures to detect synonymy and to build hierarchies of tags automatically by means of heuristic algorithms. In this thesis, the problems of synonym and subsumption detection between pairs of tags are cast as a pairwise classification problem. From the literature, several similarity measures that are good indicators of synonymy and subsumption were identified, which are used as learning features. Under this setting, there is a severe class imbalance and class overlapping which motivated us to investigate and employ class imbalance techniques to overcome these problems. A comprehensive set of experiments were conducted on two large real-world datasets of BibSonomy and Delicious systems, showing that the proposed approach named CPDST outperforms the best performing heuristic-based baseline in the tasks of synonym and subsumption detection. CPDST is also applied in the context of tag list generation for providing access to additional resources annotated with other semantically related tags. Besides CPDST approach, two algorithms based on WordNet and ConceptNet accesses are proposed for capturing specifically synonyms and hyponyms. The outcome of an evaluative quantitative analysis showed that CPDST approach yields relevant tag lists in relation to the produced ones by the compared methods.
9

Uma linguagem de padrões semanticamente relacionados para o design de sistemas educacionais que permitam coautoria

Silva, Marcos Alexandre Rose 03 May 2014 (has links)
Made available in DSpace on 2016-06-02T19:03:58Z (GMT). No. of bitstreams: 1 5900.pdf: 5031941 bytes, checksum: c33a127070b11fb3923bc17ba9d98189 (MD5) Previous issue date: 2014-05-03 / Financiadora de Estudos e Projetos / The adequacy of educational content considering student´s culture, knowledge and values allow them to identify the relationship between what they are learning and their reality and, consequently they feel more interested and engaged at education. In contrast, in informatics at education, designing educational systems to allow adequacy is a challenge because of a lack of techniques to support the design and the difficulty to identify what and how allow this adequacy by users, because many users of these systems, as educators and students, do not have knowledge of designing. In this context, it is presented here a formalization of the design pattern with successful solutions for recurrent problems on designing co-authorship systems analyzed and/or experienced by the researcher of this dissertation during design and evaluations of these systems at Advanced Interaction Laboratory (LIA). These patterns intend to support designing of educational systems that allow users, as co-authors, adequate these systems, inserting the content to be displayed at them. Each pattern describes specific problem and solution. In order to support indentifying how these patterns are organized to each other, semantic relations defined by Minsky are adopted to organize them based on humans´ intellectual structure. Validations with different participants´ profiles, e.g., with or without knowledge about concepts related to design, software engineering, human-computer interaction, co-authorship, etc., were done to formalize, refine and observe the comprehension and/or application of these patterns to design co-authorship system prototypes, as well as, different participants from mathematic or pedagogy areas and teachers to validate the use these of these prototypes. The results shown that the pattern language is comprehensible and it supports designing to define what and how to display on interface to allow and help users insert content. / A adequação no conteúdo educacional de acordo com a cultura, o conhecimento e valores dos alunos permite aos mesmos identificarem relação entre o que estão aprendendo e suas realidades e, consequentemente se sentirem mais interessados e engajados no aprendizado. Contudo, no contexto da informática na educação, fazer o design de sistemas educacionais para permitir a adequação é um desafio, tanto pela falta de técnicas para apoiar o design, quanto pela dificuldade em identificar o que adequar, como permitir e facilitar essa adequação, pois muitos dos usuários desses sistemas, como educadores e alunos, não têm conhecimento e experiência com design de soluções computacionais. Nesse contexto, neste trabalho é apresentada a formalização de uma linguagem de padrões de design com soluções de sucesso para problemas recorrentes no design de sistemas de coautoria observadas e/ou experiência das pelo proponente deste trabalho, ao analisar esses sistemas e participar do processo de desenvolvimento e avaliação desses sistemas no Laboratório de Interação Avançada (LIA). Esses padrões têm como objetivo apoiar o design de sistemas educacionais que permitam aos usuários, como coautores, terem apoio para adequar os sistemas, inserindo o conteúdo que será exibido nos mesmos. Cada padrão de design se refere a um par problema-solução específico e, para apoiar a identificação e compreensão de como os padrões estão relacionados entre si, formando uma linguagem de padrões, são adotadas as relações semânticas definidas por Minsky para organizá-los e expressar o relacionamento entre eles de uma forma próxima a estrutura cognitiva humana. Validações com diferentes perfis de participantes, por exemplo, com e sem conhecimento sobre conceitos relacionados à Engenharia de Software, Interação Humano-Computador, Coautoria, etc., foram feitas para formalizar, refinar e observar a compreensão e/ou o uso dos padrões no design de protótipos de sistemas educacionais, bem como participantes das áreas de matemática ou pedagogia e educadores para validar o uso desses protótipos. Os resultados mostram que a linguagem de padrões de design semanticamente relacionados é compreendida e apoia o design para definir o que e como exibir nas interfaces dos sistemas para permitir e auxiliar os usuários na inserção do conteúdo.
10

Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX

Pereira, Juliana Wolf 01 July 2014 (has links)
Made available in DSpace on 2016-06-02T19:06:12Z (GMT). No. of bitstreams: 1 5898.pdf: 11774674 bytes, checksum: 3cc87530008d9b42c105781f8a1068a3 (MD5) Previous issue date: 2014-07-01 / Financiadora de Estudos e Projetos / This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation. / Esta dissertação apresenta uma abordagem de anotação semântica automática em documentos históricos do século XIX que discutem a constituição da língua pátria, a Língua Portuguesa no Brasil. O objetivo e gerar um conjunto de documentos semanticamente anotados em acordo com uma ontologia de domínio. Para prover essa ontologia de domínio, foi construída a Ontologia Instrumento Linguístico que apoiou o processo para a realização da anotação semântica automática. Os resultados obtidos com a anotação foram analisados em comparação com o Gold Standard e apresentaram alto grau de coincidência, entre 0.86 e 1.00 para a medida F1-Score. Além disso, foi possível localizar novos documentos sobre o domínio discutido em uma amostra das Revistas Brazileiras. Esses resultados comprovam a eficácia da abordagem de anotação semântica automática.

Page generated in 0.2472 seconds