• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 218
  • 7
  • 7
  • 7
  • 7
  • 6
  • 6
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 231
  • 87
  • 85
  • 48
  • 42
  • 39
  • 28
  • 25
  • 24
  • 23
  • 22
  • 21
  • 21
  • 21
  • 20
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
111

Organização e tratamento da informação nos arquivos: estudo crítico / Information organization in archives: a critical approach

Amaral, Cleia Marcia Gomes 05 April 2017 (has links)
A organização e tratamento da informação nos arquivos é um processo essencial na prática arquivística, que comporta um conjunto de atividades encadeadas para propiciar pesquisas e acesso aos documentos nela abrigados. O objetivo inicial da presente pesquisa foi compreender as teorias e métodos subjacentes a esse conjunto de processos. A hipótese inicial foi a de observar as teorias e práticas arquivísticas de organizar e tratar documentos e apontar suas interações com a Ciência da Informação. A pesquisa, de natureza qualitativa, utilizou o método hipotético dedutivo como ponto de partida, tendo como objeto empírico um corpus de artigos científicos da área da arquivística, do período de 2000-2015. Foi possível identificar nesse corpus as mudanças propostas para a realização de atividades de classificação, indexação, descrição arquivística, normalização e diplomática, ao longo desse período. Ao final, foi possível constatar que a arquivística é uma disciplina com fundamentos teóricos e práticos sedimentados, conta com um conjunto de métodos, procedimento e instrumentos específicos para organizar e tratar a informação. Foi possível identificar conceitos comuns entre a Ciência da Informação e a Arquivística, tais como classificação, análise de informação e indexação, entre outros. No entanto, não há ligação teórica ou prática explícita entre as duas áreas, visto que esses conceitos, na arquivística, são utilizados atrelados aos princípios arquivísticos da proveniência, da ordem original e do ciclo de vida dos documentos. Com base nesses princípios, a arquivística responde adequadamente, aos problemas contemporâneos relacionados ao complexo problema da autenticidade dos documentos digitais. Trata-se, portanto, de uma área em contínuo desenvolvimento, que constrói teorias, métodos e procedimentos próprios que respondem satisfatoriamente às demandas sociais de busca e acesso a informações para garantir os direitos dos cidadãos e a gestão de políticas públicas. / The organization and information processing in archives is an essential process in archival practices and includes a set of linked activities to facilitate the search and access to documents. The initial objective of this research was to understand the fundamental theories and methods that support this process. The initial hypothesis was to explore the relations of the archival practices of document processint and organization to point out their interactions with Information Science. This research has qualitative approach, used the hypothetical deductive method as a starting point and the content analysis of a corpus of scientific articles presented in serials dedicated to archival sciences, published in 2000-2015. It was possible to identify common concepts used in Archival science and Information Science, such as classification, analysis and indexing, but this does not denote an explicit theoretical and practical connection between the two domains, since these concepts are used in the archival science coupled with the archival principles of provenance, original order and the document life cycle. Based in these principles, the Archival Science present solutions, to the contemporary questions as the complex problems related to the authenticity of digital documents. It was possible to identify the changes that occurred in the activities of classification, indexing, archival description, normalization and diplomatics throughout this period. Archival Science is a domain that develops reflecting and constructing specific theories, methods and procedures to promote satisfactory responses to social demands of access to information to the citizens and to the management of public policies.
112

Vocabulário de termos livres e controlados para a coleção de teses e dissertações da Universidade Federal de Viçosa

Silva, Bruna 23 September 2015 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-23T18:18:16Z No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) / Approved for entry into archive by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-23T18:18:28Z (GMT) No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) / Approved for entry into archive by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-23T18:18:39Z (GMT) No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) / Made available in DSpace on 2018-04-23T18:18:48Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) Previous issue date: 2015-09-23 / O presente trabalho tem como objetivo a construção de um vocabulário controlado para a Pós-Graduação da Universidade Federal de Viçosa, com intuito de adequar a linguagem utilizada no processo de indexação à linguagem utilizada pelos pesquisadores, e assim, descrever com propriedade temática as teses e dissertações. Discorre sobre a Teoria Geral da Terminologia e Teoria do Conceito, Princípios para Validação de Termos, Catálogo On-line e Sistemas de Recuperação da Informação e Linguagens Documentárias. Apresenta como foco de estudo o vocabulário controlado e sua metodologia de construção. Destaca as etapas percorridas no planejamento, construção e manutenção. Pressupõe que com a construção do vocabulário controlado com os termos escolhidos pelos pesquisadores, atendendo às garantias de uso, literária, cultural e organizacional, o processo de recuperação da informação no catálogo on-line da biblioteca ocorra com mais precisão. / This research aims at the construction of a controlled vocabulary for Postgraduate of Universidade Federal de Viçosa, with the purpose to adapt the language used in the process of indexing with the language used by the researchers, and thus describe themed property the theses and dissertations. Talks about the General Theory of Terminology and Theory of Concept, Principles Terms Validation, Online Catalog and Information Retrieval System and Documentary Languages. It presents as a study focused on the controlled vocabulary and construction methodology, outlines the steps taken in the planning, construction and maintenance. Presupposes that the construction of controlled vocabulary with the terms chosen by the researchers, taking into account the warrant of use, literary, cultural and organizational, the information retrieval process in the library catalog to occur more accurately. / Não foi localizado o cpf do autor. O autor não apresentou título em inglês.
113

A indexação em catálogo on-line em bibliotecas universitárias na percepção de usuários integrantes de grupos de pesquisa : uma contribuição ao desenvolvimento de política de indexação na rede de biblioteca da UNESP /

Gonçalves, Maria Carolina. January 2008 (has links)
Orientador: Mariângela spotti Lopes Fujita / Banca: Helen de Castro Silva Casarim / Banca: Ariadne Chlöe Mary Furnival / Resumo: A indexação em catálogos on-line na percepção de usuários integrantes de grupos de pesquisa contribui no aprimoramento da recuperação por assunto conforme os seus interesses e necessidades informacioanais. No entanto, os usuários possuem dificuldades no momento de realizar as buscas por assunto, pois os termos que utilizam não coincidem com os atribuídos na indexação. Essa problemática do catálogo de assunto, muita vezes, é o reflexo da falta de estudos de usuários e de uma política de indexação que oriente a indexação. Com o objetivo de contribuir para a elaboração de política de indexação em bibliotecas universitárias realizou-se o estudo diagnóstico do contexto sociocognitivo de usuários integrantes de grupos de pesquisa nas áreas de Ciências Biológicas, Exatas e Humanas da UNESP, para obter sua percepção com relação à indexação. O desenvolvimento do estudo diagnóstico constou de fundamentação teórica sobre o processo de indexação no âmbito da política de indexação em ambientes institucionais; estudo de percepção de usuários para investigar metodologia de abordagem sociocognitiva mediante Protocolo Verbal; e análise da percepção do usuário de grupo de pesquisa acerca da indexação em bibliotecas universitárias para o desenvolvimento dos catálogos on-line. Os resultados demonstraram que alguns elementos de política de indexação fazem parte do processo da indexação, como por exemplo, exaustividade, especificidade e escolha da linguagem. Sobre a investigação de metodologia sociocognitva, o protocolo verbal em grupo revelou ser uma técnica que permite fazer um estudo da realidade do usuário e das variáveis que influenciam o seu contexto. A abordagem metodológica que permitiu obter a percepção do usuário caracteriza-se por indicadores de conhecimento, interesse e atitude...(Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The indexing in online catalogues in the perception of users who are members of research groups becomes crucial in an environment of university libraries so that the catalogue of subject, first restricted to the physical limits of the library and containing only bibliographic records of documents ordered in bookshelves, becomes virtual nowadays. However, users have difficulties when they do their search by subject, because the words they use do not coincide with the terms used by the librarian at the time of indexing. Consequently, the retrieval of information becomes silent and with noise. This issue of the catalogue of subject is often the reflection of a possible deficiency of the work done by librarians, since they do not study about users in order to know their interests and opinions concerning the treatment of the documents content. It is also a reflection of the lack of an indexing policy that guides the steps of indexing. Aiming to contribute to the development of an indexing policy in university libraries under the users' perspective, the proposal os this research was to do a study of the socio-cognitive context of users who are members of research groups in the areas of Biological and Exact Sciences and Humanities from UNESP, to get a diagnosis of their perception regarding the indexing context. The specific objectives were: developing a study on the indexing process under the indexing policy in institutional environments; investigating a method of a socio-cognitive approach by Verbal Protocol to study the users' perception; verifying the perception of the user who participates in a research group on indexing information in university libraries for the development of online catalogues. The results showed that the indexing process has some elements of policy, such as completeness, uniqueness and language choice. Both indexing and policy aim to answer the...(Complete abstract, click electronic access below) / Mestre
114

Operadores binários para consulta de similaridade em banco de dados multimídia / Binary operators in multimidia data base

Enzo Seraphim 18 January 2006 (has links)
Os atuais gerenciadores de banco de dados não são adequados para manipulação de dados complexos; e entre eles destacamos os dados multimídia que, para agilizar as consultas usam a operação de igualdade sobre as estruturas de indexação.Operações de igualdade são pouco utilizadas em operações que envolvem dados complexos, uma vez que, a existência de dois elementos extremamente iguais é rara. Uma classe de operadores que se adequa melhor para manipulação desses dados são os operadores por similaridade. Exemplo de operadores de seleção por similaridade são a consulta por abrangência (range queries) e consulta aos vizinhos mais próximos. Exemplificando, o operador de seleção aos vizinhos mais próximos responde a consultas como, ?selecione as cinco proteínas mais parecidas pelo alinhamento da proteína Sparc (responsável pelo câncer de pele)?. Existem muitos trabalhos desenvolvidos no sentido de prover operadores de seleção por similaridade envolvendo estruturas baseadas em árvores. Entretanto, poucos estudos têm sido realizados envolvendo a utilização de operadores diferentes da seleção, por exemplo, a junção. Um operador de junção compara pares de objetos de elementos pertencentes ao domínio dos dados, ao passo que um operador de seleção recebe uma constante para a comparação dos elementos. Podemos ter assim, três operadores de junção por similaridade: operadores de junção por abrangência, por vizinhos mais próximos e sobre os pares de vizinhos mais próximos. Exemplificando, uma consulta utilizando junção por abrangência responde a consultas do tipo: ?Selecione as proteínas contidas no vírus da Hepatite B que diferem em até duas unidades de alinhamento das contidas no vírus da Hepatite C?. Este trabalho apresenta um novo método de acesso métrico em extrema quantidade de dados bem como, formas de implementação das formas de junção em estruturas métricas / The present databases managers are not adequated for complex data manipulation and among them we point out the multimedia data that to speed up the query use the equality operation on the index structure. Equality operations are not much used in operations that involve complex data sence the presence of two elements extremely equal is rare. An operator class that better manipulates these data are the similarity operators. Selection operators by similarity are the range query and the nearest neighbors query. For example, the selection operator to the nearest neighbors answers the queries like: ?select five proteins more similar by the alignment of the Sparc protein (responsible for the skin cancer)?. There are many works developed to provide similarity by selection operators envvolving structures based in trees. However, few studies have been done involving the use of different operators selection, for example, the join. A join operator compares pairs of objects of the elements belonging to the domain of the data, whereas a selection operator receives a constant to make the comparison of the elements. We can have three similarity join operators: the range join operators, the nearest neighbor and the closest neighbors pair. For instance, a query using the range join answers these kind of queries: ?Select the proteins restrained in the Hepatitis B virus that differ up to two unities from the alignment of the protein found in the Heapatitis C virus?. This work presents a new metric access method with an extreme amount of data as well as implementations forms of the join in metric structures
115

A contribuição da indexação no processo de seleção de palavras-chave no Google Adwords / The contribution of indexing in the keyword selection process for Google Adwords

Araújo, Andréa Nunes de 25 September 2018 (has links)
Devido ao estabelecimento de negócios pela Internet, o Google alcançou notoriedade mundial, tornando-se atrativo às empresas como canal do Marketing Digital na utilização da ferramenta Google Adwords. Em vista disso, o presente estudo consistiu no levantamento bibliográfico do Marketing de Busca e da Biblioteconomia e Documentação, no qual o principal objetivo é contribuir através do uso de técnicas de Indexação, no processo de seleção de palavras-chave, e conduzi-las na ferramenta de anúncios do Google. Os métodos desta pesquisa foram estabelecidos pela Representação Documentária, com a finalidade de contribuir na diminuição de palavras-chave que oneram as campanhas no Adwords. A partir da coleta dos assuntos mais acessados no Google Trends, no período de quatro meses (jan-abr) de 2017, e a realização de testes em janeiro de 2018 no planejador de palavras-chave do Google, apresentamos a avaliação dos resultados comparativos entre os dados coletados e os dados da lista, com a finalidade de responder se o uso das técnicas de indexação podem ser ou não favoráveis nas criações de campanhas aos clientes brasileiros neste mecanismo de busca. Concluiu-se que a contribuição da Indexação é favorável as campanhas publicitárias no Google, e também requer a inclusão do bibliotecário, já que se trata do profissional com habilidades e competências necessárias na execução desta tarefa, que ficará atento as influências exercidas pelos algoritmos tanto nos valores de palavras-chave quanto na recuperação desses termos ao público de interesse no mecanismo de busca. / Due to the establishment of Internet business, Google has achieved world renown, becoming attractive to companies as a channel of Digital Marketing in the use of Google Adwords tool. Therefore, the present study consisted of a bibliographical survey of Search Marketing and Librarianship and Documentation, in which the main objective is to contribute using Indexing techniques, in the process of selection of keywords, and to conduct them in the Google Ad Tool. The methods of this research were established by the Documentary Representation, with the purpose of contributing to the reduction of keywords that affect the campaigns in Adwords. From the most commonly accessed subjects in Google Trends in the four-month period (Jan-Apr), 2017, and testing in January 2018 on Google\'s keyword planner, we present an assessment of the comparative results between the collected data and the data of the list, in order to answer if the use of the indexing techniques can be or not favorable in the creations of campaigns to the Brazilian clients in this search engine. It was concluded that the contribution of Indexation is favorable to advertising campaigns in Google, and also requires the inclusion of the librarian, since it is the professional with the necessary skills and competences in the execution of this task, which will be attentive to the influences exerted by the algorithms both in keyword values as well as the retrieval of those terms to the public of interest in the search engine.
116

Contributions for the automatic description of multimodal scenes

Teixeira, Luís Filipe Pinto de Almeida January 2009 (has links)
Tese de doutoramento. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2009
117

Sistema para indexação e visualização de depoimentos de história oral: o caso do Museu da Pessoa / System for indexing and visualizing oral history testimonials: the Museu da Pessoas case

Pedro Herzog 26 February 2014 (has links)
Esta dissertação apresenta a estruturação de um sistema para indexação e visualização de depoimentos de história oral em vídeo. A partir do levantamento de um referencial teórico referente à indexação, o sistema resultou em um protótipo funcional de alta fidelidade. O conteúdo para a realização deste foi obtido pela indexação de 12 depoimentos coletados pela equipe do Museu da Pessoa durante o projeto Memórias da Vila Madalena, em São Paulo (ago/2012). Acervos de História Oral como o Museu da Pessoa, o Museu da Imagem e do Som ou o Centro de Pesquisa e Documentação de História Contemporânea do Brasil / CPDOC da Fundação Getúlio Vargas, reúnem milhares de horas de depoimentos em áudio e vídeo. De uma forma geral, esses depoimentos são longas entrevistas individuais, onde diversos assuntos são abordados; o que dificulta sua análise, síntese e consequentemente, sua recuperação. A transcrição dos depoimentos permite a realização de buscas textuais para acessar assuntos específicos nas longas entrevistas. Por isso, podemos dizer que as transcrições são a principal fonte de consulta dos pesquisadores de história oral, deixando a fonte primária (o vídeo) para um eventual segundo momento da pesquisa. A presente proposta visa ampliar a recuperação das fontes primárias a partir da indexação de segmentos de vídeo, criando pontos de acesso imediato para trechos relevantes das entrevistas. Nessa abordagem, os indexadores (termos, tags ou anotações) não são associados ao vídeo completo, mas a pontos de entrada e saída (timecodes) que definem trechos específicos no vídeo. As tags combinadas com os timecodes criam novos desafios e possibilidades para indexação e navegação através de arquivos de vídeo. O sistema aqui estruturado integra conceitos e técnicas de áreas aparentemente desconectadas: metodologias de indexação, construção de taxonomias, folksonomias, visualização de dados e design de interação são integrados em um processo unificado que vai desde a coleta e indexação dos depoimentos até sua visualização e interação. / This work presents the construction of an interface for visualizing and navigating the many narratives of oral history testimonials. Collections such as those belonging to the CPDOC/FGV, the Museu da Imagem e do Som and the Museu da Pessoa, contain thousands of hours of audio and video interviews. Each one of them covers many subjects, which complicates its analysis, synthesis, indexing, and consequently its retrieval. This proposal aims to facilitate the retrieval of primary sources (audio and video) by indexing specific excerpts of testimonies. To accomplish this, technologies and methodologies from areas such as: tagging, content analysis, text mining, thesauri construction and data visualization will be applied. Hence the need for an approach that consolidates these various project phases into one unified process in which the interdependencies of each step are clear and transparent. As case study, we will use 12 testimonials collected in late 2012 by researchers from the Museu da Pessoa. By indexing these videos, we will create an interface for navigating the interview segments, now categorized by topics.
118

O tratamento temático da informação em abordagem sociocultural : diretrizes para definição de política de indexação em bibliotecas universitárias /

Dal'Evedove, Paula Regina. January 2014 (has links)
Orientador: Mariângela Spotti Lopes Fujita / Banca: Walter Moreira / Banca: Brigida Maria Nogueira Cervantes / Banca: Marisa Brascher Basílio Medeiros / Banca: Isidoro Gil Leiva / Resumo: Esta tese tem por objetivo de estudo o Tratamento Temático da Informação em abordagem sociocultural, contemplando os fundamentos teóricos e metodológicos da área de Organização e Representação do Conhecimento, as necessidades dos bibliotecários relativas ao cotidiano da profissão, bem como relativas à informação construída como prática social em contexto de bibliotecas universitárias. A proposta nesta pesquisa foi investigar as vertentes científica, profissional e de uso que compõe o Tratamento Temático da Informação em abordagem sociocultural, a fim de identificar os principais elementos cognitivos, culturais e sociais que devem respaldar a elaboração de uma política de indexação para bibliotecas universitárias. O objetivo geral foi contribuir com diretrizes para a definição de políticas de indexação para bibliotecas universitárias a partir: a) dos fundamentos teórics e metodológicos do corpo de docentes da área de Organização e Representação do Conhecimento; b) do contexto sociocognitivo do bibliotecário; e c) características e princípios culturais dos usuários. Para tanto... / Abstract: This thesis is to study the object Information Subject Treatment in sociocultural approach, considering the theoretical and methodological foundations of the field of Organization representations of knowledge, the needs of librarians regarding everyday work as well as information relating to the built as social practice in the context of university libraries. The purpose of this research was to investigate the scientific aspects, professional and use that compose the theme Information Subject Treatment on sociocultural approach in order to identify key cognitive, cultural and social elements that should support the development of indexing policy to university libraries. The overall objective was to... / El objeto de estudio es el tratamiento temático de la infomación desde uma perspectiva sociocultural, contemplando los fundamentos teóticos y metodológicos de la Organización y Representación del Conocimiento, las necesidades de los biblikotecarios sobre determinos procesos realizados, así como con respecto a la información elaborada como práctica social en el contexto de las bibliotecas universitarias. La propuesta en este estudio es investigar las vertientes científica, profesional y de uso del tratamiento temático de la información desde uma perspectiva sociocultural para ientificar sus principales elementos cognitivos, culturales y sociales que deben conducir ao desarollo la política de indización en las bibliotecas universitarias. El objetivo general fue contribuir con directrices para la definición... / Doutor
119

RISO - GCT - Determinação do contexto temporal de conceitos em textos. / RISO - GCT - Determination of the temporal context of concepts in texts.

ALVES, George Marcelo Rodrigues. 06 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-06T17:59:05Z No. of bitstreams: 1 GEORGE MARCELO RODRIGUES ALVES - DISSERTAÇÃO PPGCC 2016..pdf: 15556672 bytes, checksum: 0109aeaa0d0af858151c540948a9859d (MD5) / Made available in DSpace on 2018-08-06T17:59:05Z (GMT). No. of bitstreams: 1 GEORGE MARCELO RODRIGUES ALVES - DISSERTAÇÃO PPGCC 2016..pdf: 15556672 bytes, checksum: 0109aeaa0d0af858151c540948a9859d (MD5) Previous issue date: 2016-02-26 / Devido ao crescimento constante da quantidade de textos disponíveis na Web, existe uma necessidade de catalogar estas informações que surgem a cada instante. No entanto, trata-se de uma tarefa árdua e na qual seres humanos são incapazes de realizar esta tarefa de maneira manual, tendo em vista a quantidade incontável de dados que são disponibilizados a cada segundo. Inúmeras pesquisas têm sido realizadas no intuito de automatizar este processo de catalogação. Uma vertente de grande utilidade para as várias áreas do conhecimento humano é a indexação de documentos com base nos contextos temporais presentes nestes documentos. Esta não é uma tarefa trivial, pois envolve a análise de informações não estruturadas presentes em linguagem natural, disponíveis nos mais diversos idiomas, dentre outras dificuldades. 0 objetivo principal deste trabalho é criar uma abordagem capaz de permitir a indexação de documentos, determinando mapas de tópicos enriquecidos com conceitos e as respectivas informações temporais relacionadas. Tal abordagem deu origem ao RISO-GCT (Geração de Contextos Temporais), componente do Projeto RISO (Recuperação da Informação Semântica de Objetos Textuais), que tem como objetivo criar um ambiente de indexação e recuperação semântica de documentos possibilitando uma recuperação mais acurada. 0 RISO-GCT utilizou os resultados de um módulo preliminar, o RISO-TT (Temporal Tagger), responsável por etiquetar informações temporais presentes em documentos e realizar o processo de normalização das expressões temporais encontradas. Deste processo foi aperfeiçoada a abordagem responsável pela normalização de expressões temporais, para que estas possam ser manipuladas mais facilmente na determinação dos contextos temporais. Foram realizados experimentos para avaliar a eficácia da abordagem proposta nesta pesquisa. 0 primeiro, com o intuito de verificar se o Topic Map previamente criado pelo RISO-IC (Indexação Conceituai), foi enriquecido com as informações temporais relacionadas aos conceitos de maneira correta e o segundo, para analisar a eficácia da abordagem de normalização das expressões temporais extraídas de documentos. Os experimentos concluíram que tanto o RISO-GCT, quanto o RISO-TT incrementado obtiveram resultados superiores aos concorrentes. / Due to the constant growth of the number of texts available on the Web, there is a need to catalog that information which appear at every moment. However, it is an arduous task in which humans are unable to perform this task manually, given the increased amount of data available at every second. Numerous studies have been conducted in order to automate the cataloging process. A research line with utility for various áreas of human knowledge is the indexing of documents based on temporal contexts present in these documents. This is not a trivial task, as it involves the analysis of unstructured information present in natural language, available in several languages, among other difficulties. The main objective of this work is to create a model to allow indexing of documents, creating topic maps enriched with the concepts in text and their related temporal information. This approach led to the RISO-GCT (Temporal Contexts Generation), a part of RISO Project (Semantic Information Retrieval on Text Objects), which aims to create a semantic indexing environment and retrieval of documents, enabling a more accurate recovery. RISO-GCT uses the results of a preliminary module, the RISO-TT (Temporal Tagger) responsible the labeling temporal information contained in documents and carrying out the process of normalization of temporal expressions. Found. In this module the normalization of temporal expressions has been improved, in order allow a richer temporal context determination. Experiments were conducted to evaluate the effectiveness of the approach proposed a in this research. The first, in order to verify that the topic map previously created by RISO-IC has been correctly enriched with temporal information related to the concepts correctly, and the second, to analyze the effectiveness of the normalization of expressions extracted from documents. The experiments concluded that both the RISO-GCT, as the RISO-TT, which was evolved during this work, obtained better results than similar tools.
120

Recuperação de informação baseada em ontologia: uma proposta utilizando o modelo vetorial / Ontology based information retrieval: a proposal using the vector space model

Janaite Neto, Jorge [UNESP] 30 May 2018 (has links)
Submitted by Jorge Janaite Neto (janaite@gmail.com) on 2018-06-24T23:56:37Z No. of bitstreams: 1 janaite_neto_j_me_mar.pdf: 1649007 bytes, checksum: 66467a076d4f716197896c6dc3c5ee2b (MD5) / Approved for entry into archive by Satie Tagara (satie@marilia.unesp.br) on 2018-06-25T13:46:39Z (GMT) No. of bitstreams: 1 janaiteneto_j_me_mar.pdf: 1649007 bytes, checksum: 66467a076d4f716197896c6dc3c5ee2b (MD5) / Made available in DSpace on 2018-06-25T13:46:39Z (GMT). No. of bitstreams: 1 janaiteneto_j_me_mar.pdf: 1649007 bytes, checksum: 66467a076d4f716197896c6dc3c5ee2b (MD5) Previous issue date: 2018-05-30 / Não recebi financiamento / A recuperação de informação ocorre por meio da comparação entre as representações dos documentos de um acervo e a representação da necessidade de informação do usuário. Um documento é recuperado quando sua representação coincidir total ou parcialmente com a representação da necessidade de informação do usuário. O processo de recuperação de informação pode ser visto como um problema linguístico no qual o conteúdo informacional dos documentos e a necessidade de informação do usuário são representados por um conjunto de termos. A eficiência do processo de recuperação de informação depende da qualidade das representações dos documentos e dos termos empregados pelo usuário para representar sua necessidade de informação. Quanto mais compatíveis forem essas representações maior será a eficiência do processo de recuperação. A partir de uma pesquisa exploratória e descritiva fundamentada em bibliografia específica, este trabalho propõe a utilização de ontologias computacionais em sistemas de recuperação de informação baseados no Modelo Espaço Vetorial. As ontologias são empregadas como estrutura terminológica externa utilizadas tanto na expansão dos termos de indexação quanto na expansão dos termos que compõe a expressão de busca. A expansão dos termos de indexação é feita logo após a extração dos termos mais representativos do documento em análise durante o processo de indexação, consistindo na adição de novos termos conceitualmente relacionados a fim de enriquecer a representação do documento. A expansão da consulta é obtida a partir da adição de novos termos relacionados aos já existentes na expressão de busca com o objetivo de melhor contextualizá-los. Nesta proposta utiliza-se apenas a estrutura terminológica e hierárquica oferecida por uma ontologia computacional OWL, sem considerar os demais tipos de relações possíveis nem as restrições lógicas que podem ser descritas, podendo esses recursos serem utilizados em trabalhos futuros na tentativa de melhorar ainda mais a eficiência do processo de recuperação. A proposta apresentada neste estudo pode ser implementada e futuramente tornar-se um sistema de recuperação de informação totalmente operacional. / The information retrieval occurs by means of match between the representations of documents from a collection and the representation of user information’s needs. A document is retrieved when its representation matches totally or partially to the user information’s needs. The process of information retrieval can be seen as a linguistic issue in which the document information content and the user information need are represented by a set of terms. Its efficiency depends on the quality of the representations of the documents and the terms used to represent the user’s information need. The more compatible these representations were, the more efficient the retrieval process. Based on an exploratory and descriptive research substantiated in a specific bibliography, this paper offers to use computational ontologies in information retrieval systems based on the Vector Space Model. The ontologies are applied as external terminological structures used in the indexing terms expansion as well as in the expansion of the terms which compound the query expression. The indexing terms expansion is made as soon as the extraction of the more representative terms of the document in analysis during the indexing process, consisting on the adding of new conceptually related terms in order to improve the document representation. Query expansion is obtained from adding new related terms to the existent ones in the query expression to better contextualize them. In this propose, only the terminological and hierarchical structure offered by an OWL computational ontology was used, regardless other possible relations and logical restrictions that could be descripted, saving these resources to be used in further works in an attempt to improve the retrieval process efficiency. The shown proposition can be implemented and become a fully operational information retrieval system.

Page generated in 0.0514 seconds