• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 14
  • 2
  • 2
  • 1
  • 1
  • Tagged with
  • 22
  • 22
  • 12
  • 11
  • 10
  • 9
  • 9
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Sistema de indexa??o autom?tica de of?cios do Departamento de Computa??o da UFVJM

Costa, Aline Pereira da 30 September 2016 (has links)
Submitted by Jos? Henrique Henrique (jose.neves@ufvjm.edu.br) on 2017-05-04T19:38:16Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) aline_pereira_costa.pdf: 2041406 bytes, checksum: 9995d567446721eda6ae8ff6dbdbe60c (MD5) / Approved for entry into archive by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2017-05-16T16:59:24Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) aline_pereira_costa.pdf: 2041406 bytes, checksum: 9995d567446721eda6ae8ff6dbdbe60c (MD5) / Made available in DSpace on 2017-05-16T16:59:24Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) aline_pereira_costa.pdf: 2041406 bytes, checksum: 9995d567446721eda6ae8ff6dbdbe60c (MD5) Previous issue date: 2016 / Este projeto surgiu de uma defici?ncia do Departamento de Computa??o da UFVJM (Universidade Federal dos Vales do Jequitinhonha e Mucuri), em armazenar e recuperar seus of?cios. Tal Departamento possui dificuldades na organiza??o e armazenamento eficiente destes of?cios o que inviabiliza o acesso aos documentos e dispende muito tempo na localiza??o e recupera??o da informa??o. Diante disso, foi desenvolvido um Sistema de Indexa??o Autom?tica utilizando-se t?cnicas da biblioteconomia e t?cnicas computacionais que visa automatizar o processo de indexa??o de novos of?cios, otimizar a recupera??o e democratizar o acesso a informa??o. O banco de dados do Sistema foi constru?do baseado em um vocabul?rio controlado: o tesauro. O tesauro ? um tipo de vocabul?rio controlado, mais complexo, que trabalha com ambiguidade dos termos, sinon?mia, rela??es hier?rquicas e associativas e foi elaborado a partir de conceitos selecionados e seus termos relacionados presentes nos of?cios. O escopo inicial do projeto permeia o espa?o de 2011 a 2014, totalizando 239 of?cios. Para a alimenta??o do Sistema com os novos documentos que surgir?o prop?e-se a auto alimenta??o do tesauro que far? a an?lise de relev?ncia de novos termos nos novos of?cios atrav?s de um algoritmo em constru??o. O sistema estar? em ambiente virtual, para que o acesso seja democratizado e o processo de tratamento de novos of?cios seja automatizado. Sendo positiva a implementa??o do projeto, sugere-se que os demais departamentos da UFVJM utilizem o mesmo sistema para organiza??o dos seus documentos, ganhando agilidade nos processos e satisfa??o do usu?rio final na localiza??o do que procura. / Disserta??o (Mestrado Profissional) ? Programa de P?s-Gradua??o em Educa??o, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2016. / This project arose from an actual deficiency of the UFVJM's Department of Computer Science (Universidade Federal dos Vales do Jequitinhonha e Mucuri) to store and retrieve archives. This institution has been having to put up with problems to store documents efficiently. This difficulty prevents access to documents and imposes a heavy burden to the department's staff, in terms of time to locate and retrieve information. Therefore, we developed an system to index information efficiently. To this end, we have used techniques borrowed from various areas within information science. Such techniques allowed us to automate the process of indexing new archives, optimize their recovery and, as a result, we have been able to democratize the access to information. The proposed database was built based on a controlled vocabulary: the thesaurus. The thesaurus is a controlled type of vocabulary, more complex, working with ambiguity of terms, synonymy, hierarchical relationships and associativity. It was prepared from selected concepts and terms related to these concepts in the archives. The initial scope of the project covers a time period from 2011 to 2014, totaling 239 offices. To feed the system with new documents yet to emerge we propose to self feeding mechanism. This self-feeding process will lead to the relevant analysis of new terms in the new archives through an algorithm, currently under implementation. The system will be in a virtual environment, which ensures not only the democratic access to information, but also the automatic handling of new documents. In case this project obtains positive feedback, we shall suggest that other UFVJM departments use the same system for organizing documents; hence, decreasing their response time, and improving the experience of their end-users.
2

Ontologias no processo de indexação automática de documentos textuais / Ontologies in automatic indexing proccess of textual documents

Pansani Junior, Eder Antonio [UNESP] 06 May 2016 (has links)
Submitted by EDER ANTONIO PANSANI JUNIOR null (epansani@gmail.com) on 2016-06-03T12:24:33Z No. of bitstreams: 1 Dissertação_ME_Eder_Pansani-v15(Final).pdf: 3197217 bytes, checksum: 2e90e8854397255d61133c2c895baaca (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-06-06T18:47:42Z (GMT) No. of bitstreams: 1 pansanijunior_ea_me_mar.pdf: 3197217 bytes, checksum: 2e90e8854397255d61133c2c895baaca (MD5) / Made available in DSpace on 2016-06-06T18:47:42Z (GMT). No. of bitstreams: 1 pansanijunior_ea_me_mar.pdf: 3197217 bytes, checksum: 2e90e8854397255d61133c2c895baaca (MD5) Previous issue date: 2016-05-06 / Apesar dos avanços tecnológicos das últimas décadas, a busca por informações relevantes ainda é uma tarefa árdua. A recuperação de informação envolve, por um lado, um acervo documental que deve ser representado por expressões linguísticas que resumem seu conteúdo temático. Por outro lado, pessoas tentam descrever linguisticamente as suas necessidades de informação a fim de obterem documentos relevantes para satisfazer tais necessidades. Um sistema de recuperação de informação é, portanto, um elemento mediador entre um acervo documental e seus requisitantes. Um dos aspectos que interferem diretamente na sua eficiência é a forma como os documentos são representados. Sendo assim, pesquisas sobre indexação automática tomam importância, principalmente em ambiente de grande produção e disseminação de documentos, como é o caso da Web. A utilização de vocabulários controlados como elementos de normalização terminológica é um recurso utilizado para melhorar os resultados do processo de indexação. Este trabalho tem por objetivo propor, avaliar e desenvolver um método de utilização de ontologias no processo de indexação automática de documentos textuais, fazendo uso da estrutura lógica e conceitual das ontologias de domínio e implementado um método que permite aos sistemas de indexação automática a realização de inferências automáticas, favorecendo uma representação dos documentos mais semântica e abrangente. Conclui-se com o estudo que a utilização das ontologias como vocabulários controlados em sistemas de indexação automática pode oferecer resultados promissores, permitindo a descoberta automática de termos e a resolução de alguns problemas ligados à linguagem que permeia todo o processo de recuperação de informação. / Despite the technological advances of recent decades, the search for relevant information is still an arduous task. The information retrieval involves, on the one hand, a documentary collection that must be represented by linguistic expressions which summarize its thematic content. On the other hand, people try describing linguistically their information needs in order to obtain relevant documents to satisfy those needs. An information retrieval system is therefore a mediating element between a documentary collection and its requesters. One of the aspects that directly interferes in their efficiency is how documents are represented. Therefore, researches on automatic indexing take importance, particularly, in an environment of large production and dissemination of documents, as it’s the case of the Web. The use of controlled vocabularies as terminology standardization elements is a feature used to improve the results of the indexing process. This study aims to propose, evaluate and develop a method for using ontologies in the automatic indexing process of textual documents, making use of logical and conceptual structure of domain ontologies and implementing a method that enables automatic indexing systems, an execution of automatic inferences, favoring a semantic and comprehensive documents representation. The study conclusion is that the use of ontologies as controlled vocabularies in automatic indexing systems can offer promising results, allowing the automatic discovery of terms and the resolution of some language related problems that permeates the whole process of information retrieval.
3

Design and Development of a Mineral Exploration Ontology

Sevindik Mentes, Hilal 18 December 2012 (has links)
In this thesis, an ontology for the mineral exploration domain is designed and developed applying the Protégé ontology editor. The MinExOnt ontology includes a formal and explicit representation of the terms describing real objects, activities, and processes in mineral exploration. The stages used for these activities have various vocabularies, which are semantically modeled in this ontology with Web Ontology Language (OWL). The aim of the thesis is to show how ontologies can be designed and developed to help manage and represent geological knowledge. In addition to providing a general workflow for building the ontology, this thesis presents a simple user guide for the used software, including Protégé, used for ontology development, and Knoodl-OntVis, used for OWL visualization.
4

GESTÃO DO PATRIMÔNIO DOCUMENTAL: ELABORAÇÃO DO VOCABULÁRIO CONTROLADO PARA ORGANIZAR E ACESSAR INFORMAÇÕES ARQUIVÍSTICAS / DOCUMENTARY HERITAGE MANAGEMENT: CONTROLLED VOCABULARY PREPARATION TO ORGANIZE AND ACCESS ARCHIVAL INFORMATION

Ilha, Rita Medianeira 13 May 2013 (has links)
The study of the vocabulary used to name the Federal University of Santa Maria (UFSM) functions and activities is the one presented in this research aiming at controlling the vocabulary and, to build a controlled vocabulary as a means of standardization to improve the searching and access of documents. This is an applied research with a qualitative approach that seeks to develop the knowledge making it possible to understand and transform the reality regarding the presented topic. The work was structured considering the documents classification plan that already existed, which were used to survey the terms used to name classes, subclasses and document types. The survey made it possible to identify and analyze the terminological differences and, to apply the vocabulary control to both micro and macro vocabulary control procedures. The result was the development of a Controlled Vocabulary, disposed in alphabetical order, containing the adopted and not adopted terms, serving as a remitting. The purpose is to qualify the UFSM Archival System with regard to documents search and access. / O estudo do vocabulário utilizado para denominar as funções e atividades da Universidade Federal de Santa Maria é o que apresenta esta pesquisa, visando o controle do vocabulário e a construção do Vocabulário Controlado, como forma de padronização, para aprimorar a busca e o acesso aos documentos. Trata-se de uma pesquisa aplicada, de abordagem qualitativa que busca a elaboração de conhecimento que possibilite a compreensão e transformação da realidade em relação ao tema apresentado. O trabalho foi estruturado levando em conta os planos de classificação de documentos já elaborados, que serviram para realizar o levantamento dos termos usados para denominar as classes, subclasses e tipos documentais. O levantamento possibilitou identificar e analisar as divergências terminológicas e, com isso, aplicar o controle do vocabulário, no que se refere aos procedimentos micro e macro. O resultado foi a elaboração do Vocabulário Controlado, disposto através de lista alfabética, que dispõe tanto dos termos adotados como dos termos não adotados, servindo como remissiva. O propósito é qualificar o Sistema de Arquivos da UFSM no que se refere à busca e ao acesso aos documentos.
5

Využití vybraných medicínských tezaurů a klasifikací v portálech pro laickou veřejnost / Utilization of selected medical thesauri and classifications in patient information portals

Labský, Jan January 2019 (has links)
(in English) The thesis examines the use of medical thesauri and classifications in portals containing medical information for laymen. The thesis first describes the selected thesauri, classifications and individual portals. A survey was carried out exploring users' reasons for researching medical information. Subsequently, selected subjects were observed researching information on previously selected portals. The observation was complemented with semi- structured interviews with the subjects. The observed results were used to discern the key manifestations of the connection between portals and medical thesauri. The individual portals were further evaluated and their features most important to users were identified.
6

Analyse documentaire en milieu universitaire : deux approches générales comparées

Hébert, Francis 10 1900 (has links)
Ce mémoire porte sur l’analyse documentaire en milieu universitaire. Deux approches générales sont d’abord étudiées : l’approche centrée sur le document (premier chapitre), prédominante dans la tradition bibliothéconomique, et l’approche centrée sur l’usager (deuxième chapitre), influencée par le développement d’outils le plus souvent associés au Web 2.0. L’opposition entre ces deux démarches reflète une dichotomie qui se trouve au cœur de la notion de sujet, c’est-à-dire les dimensions objective et subjective du sujet. Ce mémoire prend par conséquent la forme d’une dissertation dont l’avantage principal est de considérer à la fois d’importants acquis qui appartiennent à la tradition bibliothéconomique, à la fois des développements plus récents ayant un impact important sur l’évolution de l’analyse documentaire en milieu universitaire. Notre hypothèse est que ces deux tendances générales doivent être mises en relief afin d’approfondir la problématique de l’appariement, laquelle définit la difficulté d’accorder le vocabulaire qu’utilise l’usager dans ses recherches documentaires avec celui issu de l’analyse documentaire (métadonnées sujet). Dans le troisième chapitre, nous examinons certaines particularités liées à l’utilisation de la documentation en milieu universitaire dans le but de repérer certaines possibilités et certaines exigences de l’analyse documentaire dans un tel milieu. À partir d’éléments basés sur l’analyse des domaines d’études et sur la démarche analytico-synthétique, il s’agit d’accentuer l’interaction potentielle entre usagers et analystes documentaires sur le plan du vocabulaire utilisé de part et d’autre. / The topic of this dissertation is subject analysis in a university environment. Two major approaches are studied at first: subject analysis centered on the document (first chapter), historically predominant in librarianship, and subject analysis centered on the user (second chapter), mostly influenced by the development of Web 2.0 technologies. The opposition between those two approaches reflects a dichotomy which is at the very heart of the notion of subject, meaning the objective and subjective aspects of the subject. The outline of the dissertation has the distinct advantage of presenting well established practices in the field of librarianship as well as recent developments that do have an impact on subject analysis in a university environment. Our hypothesis is that both major tendencies must be highlighted to study the question of mapping the terminology (subject metadata) that comes from subject analysis with the terminology that users tend to favor while searching for documents. In the third chapter, we examine more closely particularities of the university environment in an effort to look at distinct possibilities and requirements for subject analysis in such an environment. Reinforced by elements taken from domain and facet analysis, the goal is to accentuate the potential interaction between users and indexers on a terminological level.
7

Findability: elementos essenciais para as formas de encontro da informação em bibliotecas digitais

Landshoff, Renate 19 November 2011 (has links)
Made available in DSpace on 2016-04-29T14:23:04Z (GMT). No. of bitstreams: 1 Renate Landshoff.pdf: 3875996 bytes, checksum: a0da1263d095248a5d6973fb7cd4e325 (MD5) Previous issue date: 2011-11-19 / This study aims to recommend key elements which impact the ways to find information in digital library environments, including features found in Web 2.0. The theory is based on the concept of Findability, coined by Morville, on the significant contribution of Manovich, on Santaella‟s study about cognitive profiles of readers and Internet users, and on Weinberg and Cunha‟s view on the mission of digital libraries. The development of this work is based on the method of qualitative case studies, highlighting positive and negative aspects of search interfaces from elements considered relevant to digital library projects and identified with the contribution of concepts brought from Library and Information Science. The study emphasizes the contribution of digital libraries for Web search, without however fail to point to their weaknesses and need for evolution. The processing of information at the time of data entry, the development of more intelligent search interfaces, the different cognitive profiles of users, the participation of multidisciplinary teams and constant monitoring of the digital environment elements must be considered and pursued over the existence of a design of this profile. The study points out finally the changes that must occur in searching from the Semantic Web and the development of artificial intelligence, impacting the way we are used to seek information, continually increasing its "findability." / Este estudo tem por objetivo recomendar elementos essenciais que impactam as formas de encontro da informação em ambientes de bibliotecas digitais, incluindo as funcionalidades encontradas na Web 2.0. A fundamentação teórica está baseada no conceito de Findability, cunhado por Morville, na contribuição expressiva de Manovich, no estudo de Santaella sobre os perfis cognitivos de leitores e internautas e na visão de Weinberg e Cunha sobre a missão de bibliotecas digitais. O desenvolvimento deste trabalho está baseado no método de estudos de casos qualitativos, ressaltando aspectos positivos e negativos de interfaces de busca a partir de elementos considerados relevantes para projetos de bibliotecas digitais e identificados com a contribuição de conceitos trazidos da área de Biblioteconomia e Ciência da Informação. O estudo destaca a contribuição das bibliotecas digitais para a pesquisa na Web, sem no entanto deixar de apontar para as suas fragilidades e necessidade de evolução. O tratamento da informação no momento da entrada de dados, o desenvolvimento de interfaces de busca mais inteligentes, os diversos perfis cognitivos de usuários, a participação de equipes multidisciplinares e o monitoramento constante do ambiente digital devem ser elementos considerados e perseguidos ao longo da existência de um projeto deste perfil. O estudo destaca por fim, as mudanças que devem ocorrer com a busca a partir da Web Semântica e o desenvolvimento da inteligência artificial, impactando na forma como estamos acostumados a buscar a informação, aumentando cada vez mais a sua encontrabilidade
8

Arquivos pessoais, arquivos de memória e o processo de indexação

Oliveira, Isabel Cristina Borges de 27 March 2009 (has links)
Submitted by Suemi Higuchi (suemi.higuchi@fgv.br) on 2009-07-31T15:19:56Z No. of bitstreams: 1 CPDOC2009IsabelCristinaBorgesdeOliveira.pdf: 2771599 bytes, checksum: fa47cb7d1597fd799e2c7c6c54877a93 (MD5) / Made available in DSpace on 2009-07-31T15:20:05Z (GMT). No. of bitstreams: 1 CPDOC2009IsabelCristinaBorgesdeOliveira.pdf: 2771599 bytes, checksum: fa47cb7d1597fd799e2c7c6c54877a93 (MD5) / This dissertation seek to discuss the personal archives indexing by analyzing the personal archive of Ubaldino do Amaral Fontoura index. Besides, the archival theoretical questions like normalization, standardization and controlled vocabulary construction in order to improve the answer to the user. The research also examines personal archives as memory archives and how the access point definition interferes in the issue of environment and erasing the memory / A presente dissertação busca discutir a questão da indexação em arquivos pessoais, tendo como campo de análise o arquivo pessoal de Ubaldino do Amaral Fontoura, além dos aspectos teóricos arquivísticos que devem ser considerados durante a normalização, padronização e construção de vocabulário controlado, a fim de melhor atender ao usuário. A pesquisa também analisa os arquivos pessoais enquanto arquivos de memória e como a definição dos pontos de acesso interfere na questão do enquadramento e apagamento da memória.
9

Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)

Narukawa, Cristina Miyuki [UNESP] 22 June 2011 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:44Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-06-22Bitstream added on 2014-06-13T19:13:58Z : No. of bitstreams: 1 narukawa_cm_me_mar.pdf: 1418357 bytes, checksum: 7e98e9c87bc1140142e22bd52dcd3e05 (MD5) / A indexação automática é um processo complexo e delegar a atividade de atribuição de termos aos sistemas automáticos requer análise, tanto dos métodos, quanto das características dos instrumentos de indexação. Desse modo, propomos investigar a atuação de vocabulário controlado neste processo a partir da análise dos resultados de aplicação do vocabulário ThesAgro no Sistema de Indización SemiAutomatica (SISA), com objetivos de identificar as características que definem e distinguem os tipos de vocabulários; analisar propostas metodológicas e sistemas de indexação; aplicar o ThesAgro no sistema SISA em análise comparativa com a indexação manual da Biblioteca Nacional de Agricultura (BINAGRI), e analisar os fatores intervenientes que apontam os problemas ocasionados à indexação automática. De modo geral, buscamos contribuir com o desenvolvimento do tema ao levantar subsídios para adaptação de vocabulários controlados. Realizamos uma revisão teórica sobre sistemas de indexação automática e um experimento aplicando o ThesAgro no sistema SISA com 100 artigos da área agrícola, especificamente sobre fruticultura. Utilizamos, como parâmetro de avaliação, a indexação manual realizada pela BINAGRI e análise comparativa com os resultados de pesquisa anterior em que se avaliou o desempenho do vocabulário Descritores em Ciências da Saúde (DeCS) no referido sistema. A partir da análise dos resultados constatamos que o vocabulário condiciona os resultados do processo de indexação automática e, portanto, é necessário compreendê-lo, considerando os métodos de identificação das unidades representativas da informação, aplicação de tratamento linguístico, características da área do conhecimento, relações semânticas, idioma, atualização, uso de vocabulários... / Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below)
10

Estudo de vocabulário controlado na indexação automática : aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA) /

Narukawa, Cristina Miyuki. January 2011 (has links)
Resumo: A indexação automática é um processo complexo e delegar a atividade de atribuição de termos aos sistemas automáticos requer análise, tanto dos métodos, quanto das características dos instrumentos de indexação. Desse modo, propomos investigar a atuação de vocabulário controlado neste processo a partir da análise dos resultados de aplicação do vocabulário ThesAgro no Sistema de Indización SemiAutomatica (SISA), com objetivos de identificar as características que definem e distinguem os tipos de vocabulários; analisar propostas metodológicas e sistemas de indexação; aplicar o ThesAgro no sistema SISA em análise comparativa com a indexação manual da Biblioteca Nacional de Agricultura (BINAGRI), e analisar os fatores intervenientes que apontam os problemas ocasionados à indexação automática. De modo geral, buscamos contribuir com o desenvolvimento do tema ao levantar subsídios para adaptação de vocabulários controlados. Realizamos uma revisão teórica sobre sistemas de indexação automática e um experimento aplicando o ThesAgro no sistema SISA com 100 artigos da área agrícola, especificamente sobre fruticultura. Utilizamos, como parâmetro de avaliação, a indexação manual realizada pela BINAGRI e análise comparativa com os resultados de pesquisa anterior em que se avaliou o desempenho do vocabulário Descritores em Ciências da Saúde (DeCS) no referido sistema. A partir da análise dos resultados constatamos que o vocabulário condiciona os resultados do processo de indexação automática e, portanto, é necessário compreendê-lo, considerando os métodos de identificação das unidades representativas da informação, aplicação de tratamento linguístico, características da área do conhecimento, relações semânticas, idioma, atualização, uso de vocabulários... (Resumo completo, clicara acesso eletrônico abaixo) / Abstract: Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below) / Orientador: Mariângela Spotti Lopes Fujita / Coorientador: Isidoro Gil Leiva / Banca: Renato Rocha Souza / Banca: José Augusto Chaves Guimarães / Mestre

Page generated in 0.4674 seconds