Spelling suggestions: "subject:"forminformation retrieval systems"" "subject:"forminformation etrieval systems""
21 |
Hyper Friburgo: um sistema hyper texto baseado em agentes inteligentes para informações turísticas / Hyper Friburgo: a hyper text system based on intelligent agents for touristic informationsGeraldo Luiz Kern Martins 04 March 1999 (has links)
Nova Friburgo é uma cidade turística brasileira, a qual atrai diversos tipos de visitantes. Esta dissertação descreve um sistema inteligente que ficará instalado em um centro de informações turísticas para auxílio daqueles que necessitam localizar as principais atrações da cidade. Atualmente, existe uma aplicação multimídia comum de suporte ao turismo, mas esta sendo expandida para incluir uma base de conhecimento com perfis de turistas. Dependendo dos caminhos percorridos pelo usuário durante sua consulta, o sistema seleciona um perfil, que reflete o melhor possível às opções escolhidas. De acordo com o perfil
selecionado, o sistema poderá sugerir vários roteiros e destinos baseados nos possíveis interesses do turista, fornecendo inclusive, informações sobre hotéis e restaurantes do seu interesse. A base de conhecimento, que fornece este tipo de inferência, esta desenvolvida em Visual C++. / Nova Friburgo is a Brazilian tourist city, which attracts different types of visitors. This dissertation describes an intelligent system to be installed at a tourist information center for assisting those who need directions to this citys major attractions. Currently, there is an ordinary multimedia application for tourism support but such system is being expanded to include a knowledge base of profiles of tourists. On the base of the tracks or paths a user has already performed during his/her consultation, the system selects the profile, which most closely reflects the options taken. According to this selected profile, the system is expected to suggest various routes and destinations based on the tourists possible interests, in addition to provide information on hotels and restaurants he/she will likely be interested in. The knowledge base, which provides this type of inference, is being developed
in Visual C++.
|
22 |
Parâmetros sociocognitivos de construção de instrumento de representação temática da informação de áreas técnicocientíficas / Socio-cognitives parameters for construction of tool for thematic representation of information techno-scientific areasOliveira, Greissi Gomes 18 February 2013 (has links)
Made available in DSpace on 2016-06-02T19:16:36Z (GMT). No. of bitstreams: 1
5000.pdf: 2828821 bytes, checksum: 085b98bac2f728cd163a1abb8d9d9385 (MD5)
Previous issue date: 2013-02-18 / Information retrieval systems for information retrieval can occur through the search by author name, title of the work, by text words and through the theme or subject of a work. For accuracy in information search by subject, it becomes essential to use structured languages, called indexing languages, which are instruments with a view to enabling represent the contents of the collection. Thus, the theme of our research is to identify construction parameters of an instrument subject representation for information retrieval by subject in units of scientific and technical information (USTI). In this study, the units of scientific and technical information correspond to the libraries of the Federal Institute of Education, Science and Technology of São Paulo. Our research problem is characterized by the absence of social cognitive parameters for the construction of an instrument of representation of thematic information of technical and scientific areas. Identify proposed construction parameters of an instrument of thematic representation of information on the technical and scientific literature in the area of Knowledge Representation and Organization in the context of social cognitive librarian and user and the prospect of the units of scientific and technical information feds. Our overall objective was to present parameters for the construction of social cognitive instrument thematic representation of information techno-scientific areas. The specific objectives were: 1. identify the interdisciplinary Science, Technology and Society, Information Science, with emphasis on the Organization of Knowledge and Cognitive Science, to establish a collaborative dialogue in building a tool for thematic representation of information 2. present on the documentary languages, viewed as representation language for subject areas of technical and scientific information retrieval systems; 3. identify methods of construction of alphabetical indexing languages, given the technical and scientific literature in the area of Knowledge Representation and Organization in Information Science, 4. describe the context of social cognitive librarian and user units of scientific and technical information feds 5. the views of librarians and users of information units on federal technical-scientific parameters in the collaborative construction of an instrument subject representation in Science, Technology and Education, from the application of verbal protocol viewed as a qualitative methodology with sociocognitive approach. Our research is justified by the need for an indexing language for representation and retrieval of information in units of scientific and technical information to enable the correct representation of information by librarians in indexing activity and access to information for users seeking quality and specificity in recovery the information. As methodology we conducted bibliographic research on thematic Science, Technology, Society, Information Science, Cognitive Science, Knowledge Organization, Documentary Languages, Intelligence Units, Thesaurus, Federal Institute of Education. Subsequently, we apply the Protocol Verbal Group (PVG), knowing opinions of librarians and users on indicators for the construction of the instrument. The results were analyzed from grants acquired by literature accompanied by statements of participants and enabled PVG Eleven parameters indicate the collaborative construction of an instrument subject representation: 1. characterization of the user profile (target) that will make use of language learners and teachers of upper-level courses and medium 2. terms must serve the needs of representation and retrieval of information (guarantees and literary usage) 3. terms must originate in natural language and specialty (fair usage and literary) 4. terms should represent the vocabulary usage of the organization (organizational guarantee) 5. language must have both generic and specific terms; 6. language should promote control of synonyms; 7. language must identify the homonymous accordance with the use of qualifiers 8. establishment of logical-semantic relationships between terms of orders hierarchical, associative and equivalency; 9. inclusion of terms of scope notes when needed; 10. assignment of terms must be contemplating the balance between comprehensiveness and specificity achieved by the information retrieval system; 11. identification / building information retrieval system (catalog) that includes also factors such as being available online, offering reservation services online and renewal; allow viewing of information such as: cover, table of contents, introduction and full text materials contained in the collection of USTI; possess and to enable a feature suggestion terms, the timing of the search, both to fix the search expression as for the storage of subjects / search terms. This feature is important in terms of collection, aimed at updating process of language also from the user's perspective; provide and ensure accessibility of the language so that the librarian can realize the representation of information with it and from it, and allow available the accessibility of the language so that the user can perform a search by subject, for recovering useful information with it and from it. We believe that the diversity of the public pointed verbal protocols with respect to factors such as age, level of education (knowledge) and different areas of expertise, which makes us think and recommend to the IFSP USTI the construction and use of an indexing language with vocabulary arising from natural language and specialty (as in a thesaurus) but with the logical structure semantics between terms / headers from a list of subject headings, covering scope also notes that become necessary. / A recuperação da informação em sistemas de recuperação da informação pode dar-se através da busca por nome do autor, por título da obra, por palavras do texto e através do tema ou assunto de uma obra. Para a precisão na busca da informação por assunto, torna-se fundamental o uso de linguagens estruturadas, denominadas linguagens documentárias, que são instrumentos com vistas a permitir representar os conteúdos do acervo de uma unidade de informação. Dessa forma, o tema de nossa pesquisa é a identificação de parâmetros de construção de um instrumento de representação temática para recuperação de informação por assunto em unidades de informação técnico-científicas (UITC). Nesta pesquisa, as unidades de informação técnico-científicas correspondem às bibliotecas do Instituto Federal de Educação, Ciência e Tecnologia de São Paulo. Nosso problema de pesquisa caracteriza-se pela ausência de parâmetros sociocognitivos para a construção de instrumento de representação temática da informação de áreas técnico-científicas. Propusemos identificar parâmetros de construção de um instrumento de representação temática da informação, diante das literaturas técnica e científica na área de Organização e Representação do Conhecimento, no contexto sociocognitivo do bibliotecário e do usuário e pela perspectiva das unidades de informação técnico-científicas federais. Nosso objetivo geral foi apresentar parâmetros sociocognitivos para a construção de instrumento de representação temática da informação de áreas técnico-científicas. Os objetivos específicos foram: 1. identificar a interdisciplinaridade entre a Ciência, Tecnologia e Sociedade, Ciência da Informação, com destaque para a Organização do Conhecimento e Ciência Cognitiva, visando estabelecer um diálogo colaborativo na construção de um instrumento de representação temática da informação; 2. apresentar sobre as linguagens documentárias, vistas como linguagem de representação por assunto de áreas técnico-científicas e de sistemas de recuperação da informação; 3. identificar os métodos de construção de linguagens documentárias alfabéticas, diante das literaturas técnica e científica na área de Organização e Representação do Conhecimento em Ciência da Informação; 4. descrever o contexto sociocognitivo do bibliotecário e do usuário de unidades de informação técnico-científicas federais; 5. conhecer as opiniões de bibliotecários e usuários de unidades de informação técnico-científicas federais sobre parâmetros colaborativos na construção de um instrumento de representação temática em Ciência, Tecnologia e Educação, a partir da aplicação do protocolo verbal visto como uma metodologia qualitativa com abordagem sociocognitiva. Nossa pesquisa justificou-se pela necessidade de uma linguagem documentária para representação e recuperação da informação em unidades de informação técnico-científicas que permitam a correta representação da informação por bibliotecários na atividade de indexação e o acesso a informação por usuários que buscam especificidade e qualidade na recuperação da informação. Como metodologia realizamos pesquisa bibliográfica sobre temáticas Ciência, Tecnologia, Sociedade, Ciência da Informação, Ciência Cognitiva, Organização do Conhecimento, Linguagens Documentárias, Unidades de Informação, Tesauros, Instituto Federal de Educação. Posteriormente, aplicamos o Protocolo Verbal em Grupo (PVG), conhecendo opiniões de bibliotecários e usuários acerca dos indicadores para a construção do instrumento. Os resultados foram analisados a partir dos subsídios adquiridos pela literatura acompanhados das declarações dos participantes do PVG e possibilitaram indicar onze parâmetros colaborativos na construção de um instrumento de representação temática: 1. caracterização do perfil do usuário (público alvo) que fará uso da linguagem: discentes e docentes de cursos de nível superior e médio; 2. termos devem atender as necessidades de representação e recuperação da informação (garantias literária e de uso); 3. termos devem ter origem na linguagem natural e de especialidade (garantias de uso e literária); 4. termos devem representar o vocabulário de uso da organização (garantia organizacional); 5. a linguagem deve possuir tanto termos genéricos quanto específicos; 6. a linguagem deve promover o controle de sinônimos; 7. a linguagem deve identificar a homonímia com o uso de termos qualificadores; 8. estabelecimento de relações lógicosemânticas entre os termos de ordens hierárquica, equivalência e associativa; 9. inclusão de notas de escopo dos termos, quando necessário; 10. atribuição de termos deve ser contemplar o equilíbrio entre a exaustividade e a especificidade alcançada pelo sistema de recuperação da informação; 11. identificação/construção de sistema de recuperação da informação (catálogo) que contemple, também, fatores, tais como: estar disponíveis online; oferecer os serviços de reservas e renovação online; permitir a visualização de informações como: capa, sumário, introdução e texto completo de materiais constantes do acervo das UITCs; possuir e ativar um recurso para sugestão de termos, na momento de realização da busca, tanto para correção da expressão de busca quanto para o armazenamento dos assuntos/termos procurados. Tal recurso é importante na coleta de termos, visando o processo de atualização da linguagem a partir também da perspectiva do usuário; disponibilizar e permitir a acessibilidade da linguagem para que o bibliotecário possa realizar a representação da informação com ela e a partir dela; disponibilizar e permitir a acessibilidade da linguagem para que o usuário possa realizar a busca por assunto, para a recuperação de informações úteis, com ela e a partir dela. Consideramos que a diversidade de públicos apontada nos protocolos verbais diz respeito a fatores como idade, níveis de escolaridade (conhecimento) e áreas de especialidades distintas, o que nos faz refletir e recomendar às UITCs do IFSP a construção e uso de uma linguagem documentária com vocabulários advindos da linguagem natural e de especialidade (como ocorre em um tesauro), porém com a estrutura lógico-semântica entre os termos/cabeçalhos de uma lista de cabeçalhos de assunto, contemplando também as notas de escopo que se fizerem necessárias
|
23 |
Hyper Friburgo: um sistema hyper texto baseado em agentes inteligentes para informações turísticas / Hyper Friburgo: a hyper text system based on intelligent agents for touristic informationsGeraldo Luiz Kern Martins 04 March 1999 (has links)
Nova Friburgo é uma cidade turística brasileira, a qual atrai diversos tipos de visitantes. Esta dissertação descreve um sistema inteligente que ficará instalado em um centro de informações turísticas para auxílio daqueles que necessitam localizar as principais atrações da cidade. Atualmente, existe uma aplicação multimídia comum de suporte ao turismo, mas esta sendo expandida para incluir uma base de conhecimento com perfis de turistas. Dependendo dos caminhos percorridos pelo usuário durante sua consulta, o sistema seleciona um perfil, que reflete o melhor possível às opções escolhidas. De acordo com o perfil
selecionado, o sistema poderá sugerir vários roteiros e destinos baseados nos possíveis interesses do turista, fornecendo inclusive, informações sobre hotéis e restaurantes do seu interesse. A base de conhecimento, que fornece este tipo de inferência, esta desenvolvida em Visual C++. / Nova Friburgo is a Brazilian tourist city, which attracts different types of visitors. This dissertation describes an intelligent system to be installed at a tourist information center for assisting those who need directions to this citys major attractions. Currently, there is an ordinary multimedia application for tourism support but such system is being expanded to include a knowledge base of profiles of tourists. On the base of the tracks or paths a user has already performed during his/her consultation, the system selects the profile, which most closely reflects the options taken. According to this selected profile, the system is expected to suggest various routes and destinations based on the tourists possible interests, in addition to provide information on hotels and restaurants he/she will likely be interested in. The knowledge base, which provides this type of inference, is being developed
in Visual C++.
|
24 |
Contribution à l'analyse et à la recherche d'information en texte intégral : application de la transformée en ondelettes pour la recherche et l'analyse de textes / Contribution in analysis and information retrieval in text : application of wavelets transforms in information retrievalSmail, Nabila 27 January 2009 (has links)
L’objet des systèmes de recherche d’informations est de faciliter l’accès à un ensemble de documents, afin de permettre à l’utilisateur de retrouver ceux qui sont pertinents, c'est-à-dire ceux dont le contenu correspond le mieux à son besoin en information. La qualité des résultats de la recherche se mesure en comparant les réponses du système avec les réponses idéales que l'utilisateur espère recevoir. Plus les réponses du système correspondent à celles que l'utilisateur espère, plus le système est jugé performant. Les premiers systèmes permettaient d’effectuer des recherches booléennes, c’est à dire, des recherches ou seule la présence ou l’absence d’un terme de la requête dans un texte permet de le sélectionner. Il a fallu attendre la fin des années 60, pour que l’on applique le modèle vectoriel aux problématiques de la recherche d’information. Dans ces deux modèles, seule la présence, l’absence, ou la fréquence des mots dans le texte est porteuse d’information. D’autres systèmes de recherche d’information adoptent cette approche dans la modélisation des données textuelles et dans le calcul de la similarité entre documents ou par rapport à une requête. SMART (System for the Mechanical Analysis and Retrieval of Text) [4] est l’un des premiers systèmes de recherche à avoir adopté cette approche. Plusieurs améliorations des systèmes de recherche d’information utilisent les relations sémantiques qui existent entre les termes dans un document. LSI (Latent Semantic Indexing) [5], par exemple réalise ceci à travers des méthodes d’analyse qui mesurent la cooccurrence entre deux termes dans un même contexte, tandis que Hearst et Morris [6] utilisent des thésaurus en ligne pour créer des liens sémantiques entre les termes dans un processus de chaines lexicales. Dans ces travaux nous développons un nouveau système de recherche qui permet de représenter les données textuelles par des signaux. Cette nouvelle forme de représentation nous permettra par la suite d’appliquer de nombreux outils mathématiques de la théorie du signal, tel que les Transformées en ondelettes et jusqu’a aujourd’hui inconnue dans le domaine de la recherche d’information textuelle / The object of information retrieval systems is to make easy the access to documents and to allow a user to find those that are appropriate. The quality of the results of research is measured by comparing the answers of the system with the ideal answers that the user hopes to find. The system is competitive when its answers correspond to those that the user hopes. The first retrieval systems performing Boolean researches, in other words, researches in which only the presence or the absence of a term of a request in a text allow choosing it. It was necessary to wait for the end of the sixties to apply the vector model in information retrieval. In these two models, alone presence, absence, or frequency of words in the text is holder of information. Several Information Retrieval Systems adopt a flat approach in the modeling of data and in the counting of similarity between documents or in comparison with a request. We call this approach ‘bag of words ’. These systems consider only presence, absence or frequency of appearance of terms in a document for the counting of its pertinence, while Hearst and Morris [6] uses online thesaurus to create semantic links between terms in a process of lexical chains. In this thesis we develop a new retrieval system which allows representing textual data by signals. This new form of presentation will allow us, later, to apply numerous mathematical tools from the theory of the signal such as Wavelets Transforms, well-unknown nowadays in the field of the textual information retrieval
|
25 |
Managing resource sharing in selected Seventh-day Adventist tertiary institutions in Sub-Saharan Africa: problems and prospectsAdeogun, Margaret Olufunke 30 November 2004 (has links)
Universities in the new millennium find themselves in a knowledge-driven economy that is challenging them to produce a qualified and adaptable work force if they are to contribute to societal development. Owing to the structural change in the economy, entrepreneurs require high level scientists, professionals and technicians who not only have the capability to create and support innovations by adapting knowledge to local use but also people with managerial and lifelong learning skills. Such are they who can accelerate changes and make organizations more productive and efficient in the services they render. Consequently, universities in Sub-Saharan Africa are challenged to transform learning so as to produce graduates who have both knowledge and competencies. Such a system will create a balance between university education and the changing labour market. Satisfying these new educational demands are only possible through research and unhindered access to global information resources. Paradoxically, some private university libraries, because of limited funding, find themselves fiscally constrained in the provision of unhindered access to global stores of information particularly at a time of exponential growth both in number and cost of information resources. This had led libraries to re-examine resource sharing as a viable option to meeting the new demands placed on universities.
It is for the reasons above that this study examines the practice, problems and prospects of resource-sharing in selected Seventh-day Adventist university libraries in Sub-Saharan Africa. It examines scientifically the causes of poor sharing practices that are unique to each library, the situational and environmental factors that can enhance resource sharing. It provides also research-based information that will help to determine the best ways by which each library can have greater access to information resources. There are proposals for resolving the problems, and there are recommendations for dealing with the matter on a more permanent basis. The study advances resource-sharing model called Consortium of Adventist University Libraries in Africa (CAULA) as a resource sharing network for Seventh-day Adventist libraries in Africa. The organizational structure for CAULA are outlined and discussed. The proposed cooperation is not only sustainable but also structured to provide efficiency and greater regional cooperation of SDA libraries in Sub-Saharan Africa. / Information Science / DLITT ET PHIL (INF SCIENCE)
|
26 |
Sistemas de recuperação da informação e linguagens documentárias : contribuições dos estudos da linguagemAraujo, Vera Maria Araujo Pigozzi de January 2013 (has links)
Esta pesquisa teve como objetivo gerar uma reflexão no campo dos Estudos da Linguagem e da Ciência da Informação com o propósito de investigar a natureza e o funcionamento das Linguagens Documentárias. Foi na Linguística da Enunciação e nos Estudos de Terminologia que se buscou referencial para esta investigação. Os principais teóricos desta pesquisa são: Benveniste, Martins, Cabré, Hoffmann e Ciapuscio. Fundamentado neste referencial foi possível apresentar duas propostas: sugerir um modelo de comunicação capaz de representar a relação que se estabelece entre Sistemas de Recuperação da Informação e usuários a partir de parâmetros enunciativos, e propor a geração de vocabulários controlados especializados sob o referencial enunciativo e terminológico. Estas propostas são fundamentadas nos seguintes conceitos e noções: enunciação, linguagem, língua, estrutura, sentido, significado, referência, contexto, subjetividade, intersubjetividade, locutor e categorias de pessoa, espaço e tempo, no quadro teórico da Teoria da Enunciação; 2) comunicação especializada, linguagem especializada, texto especializado, unidade terminológica, unidade fraseológica especializada e variação terminológica conceitual e denominativa, no domínio dos estudos terminológicos; 3) organização do conhecimento e representação da informação, linguagens documentárias, sistema nocional, vocabulários controlados, análise documentária, tesauros, ontologias, Sistemas de Recuperação da Informação e comunicação documentária. Concluiu-se ser possível estabelecer uma interface produtiva entre os Estudos da Linguagem e Ciência da Informação, com benefício para ambos. / The aim of this research is to generate a reflection in the field of Language Studies and Information Science in order to investigate the nature and the functioning of Documentary Languages. The referencial for this investigation comes from Linguistics of Enunciation and from Terminological Studies, mainly of Benveniste, Martins, Cabré, Hoffmann and Ciaspuscio. Based on this referential it was possible to present two proposals: to suggest a communication model able to represent the relationship established between Information Retrieval Systems and users through its enunciative parameters, and propose the generation of domain-specific controlled vocabularies under the enunciative and terminological referential. These proposals are based on the concepts and notions: 1) enunciation, language, langue, structure, meaning, significance, reference, context, subjectivity, intersubjectivity, speaker and categories of person, space and time, in the theoretical framework of the Theory of Enunciation; 2) specialized communication, specialized language, specialized text, terminological unit, specialized phraseological unit, terminological variation conceptual and denominative, in the area of terminological studies; 3) knowledge organization and representation of information, documentary languages, system notional, controlled vocabularies, documentary analysis, thesauri, ontologies, Information Retrieval Systems and documentary communication. It was concluded to be possible to establish a productive interface between Language Studies and Information Science, with benefit to both.
|
27 |
Managing resource sharing in selected Seventh-day Adventist tertiary institutions in Sub-Saharan Africa: problems and prospectsAdeogun, Margaret Olufunke 30 November 2004 (has links)
Universities in the new millennium find themselves in a knowledge-driven economy that is challenging them to produce a qualified and adaptable work force if they are to contribute to societal development. Owing to the structural change in the economy, entrepreneurs require high level scientists, professionals and technicians who not only have the capability to create and support innovations by adapting knowledge to local use but also people with managerial and lifelong learning skills. Such are they who can accelerate changes and make organizations more productive and efficient in the services they render. Consequently, universities in Sub-Saharan Africa are challenged to transform learning so as to produce graduates who have both knowledge and competencies. Such a system will create a balance between university education and the changing labour market. Satisfying these new educational demands are only possible through research and unhindered access to global information resources. Paradoxically, some private university libraries, because of limited funding, find themselves fiscally constrained in the provision of unhindered access to global stores of information particularly at a time of exponential growth both in number and cost of information resources. This had led libraries to re-examine resource sharing as a viable option to meeting the new demands placed on universities.
It is for the reasons above that this study examines the practice, problems and prospects of resource-sharing in selected Seventh-day Adventist university libraries in Sub-Saharan Africa. It examines scientifically the causes of poor sharing practices that are unique to each library, the situational and environmental factors that can enhance resource sharing. It provides also research-based information that will help to determine the best ways by which each library can have greater access to information resources. There are proposals for resolving the problems, and there are recommendations for dealing with the matter on a more permanent basis. The study advances resource-sharing model called Consortium of Adventist University Libraries in Africa (CAULA) as a resource sharing network for Seventh-day Adventist libraries in Africa. The organizational structure for CAULA are outlined and discussed. The proposed cooperation is not only sustainable but also structured to provide efficiency and greater regional cooperation of SDA libraries in Sub-Saharan Africa. / Information Science / DLITT ET PHIL (INF SCIENCE)
|
28 |
RISO - GCT - Determinação do contexto temporal de conceitos em textos. / RISO - GCT - Determination of the temporal context of concepts in texts.ALVES, George Marcelo Rodrigues. 06 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-06T17:59:05Z
No. of bitstreams: 1
GEORGE MARCELO RODRIGUES ALVES - DISSERTAÇÃO PPGCC 2016..pdf: 15556672 bytes, checksum: 0109aeaa0d0af858151c540948a9859d (MD5) / Made available in DSpace on 2018-08-06T17:59:05Z (GMT). No. of bitstreams: 1
GEORGE MARCELO RODRIGUES ALVES - DISSERTAÇÃO PPGCC 2016..pdf: 15556672 bytes, checksum: 0109aeaa0d0af858151c540948a9859d (MD5)
Previous issue date: 2016-02-26 / Devido ao crescimento constante da quantidade de textos disponíveis na Web, existe uma necessidade de catalogar estas informações que surgem a cada instante. No entanto, trata-se de uma tarefa árdua e na qual seres humanos são incapazes de realizar esta tarefa de maneira manual, tendo em vista a quantidade incontável de dados que são disponibilizados a cada segundo. Inúmeras pesquisas têm sido realizadas no intuito de automatizar este processo de catalogação. Uma vertente de grande utilidade para as várias áreas do conhecimento humano é a indexação de documentos com base nos contextos temporais presentes nestes documentos. Esta não é uma tarefa trivial, pois envolve a análise de informações não estruturadas presentes em linguagem natural, disponíveis nos mais diversos idiomas, dentre outras dificuldades. 0 objetivo principal deste trabalho é criar uma abordagem capaz de permitir a indexação de documentos, determinando mapas de tópicos enriquecidos com conceitos e as respectivas
informações temporais relacionadas. Tal abordagem deu origem ao RISO-GCT (Geração de Contextos Temporais), componente do Projeto RISO (Recuperação da Informação Semântica de Objetos Textuais), que tem como objetivo criar um ambiente de indexação e recuperação semântica de documentos possibilitando uma recuperação mais acurada. 0 RISO-GCT utilizou os resultados de um módulo preliminar, o RISO-TT (Temporal Tagger), responsável por etiquetar informações temporais presentes em documentos e realizar
o processo de normalização das expressões temporais encontradas. Deste processo foi aperfeiçoada a abordagem responsável pela normalização de expressões temporais, para que estas possam ser manipuladas mais facilmente na determinação dos contextos temporais. Foram realizados experimentos para avaliar a eficácia da abordagem proposta nesta pesquisa. 0 primeiro, com o intuito de verificar se o Topic Map previamente criado pelo RISO-IC (Indexação Conceituai), foi enriquecido com as informações temporais relacionadas aos conceitos de maneira correta e o segundo, para analisar a eficácia da abordagem de normalização das expressões temporais extraídas de documentos. Os experimentos concluíram que tanto o RISO-GCT, quanto o RISO-TT incrementado obtiveram resultados superiores aos concorrentes. / Due to the constant growth of the number of texts available on the Web, there is a need to catalog that information which appear at every moment. However, it is an arduous task in which humans are unable to perform this task manually, given the increased amount of data available at every second. Numerous studies have been conducted in order to automate the cataloging process. A research line with utility for various áreas of human knowledge is the indexing of documents based on temporal contexts present in these documents. This is not a trivial task, as it involves the analysis of unstructured information present in natural language, available in several languages, among other difficulties. The main objective of this work is to create a model to allow indexing of documents, creating topic maps enriched with the concepts in text and their related temporal information.
This approach led to the RISO-GCT (Temporal Contexts Generation), a part of RISO Project (Semantic Information Retrieval on Text Objects), which aims to create a semantic indexing environment and retrieval of documents, enabling a more accurate recovery. RISO-GCT uses the results of a preliminary module, the RISO-TT (Temporal Tagger)
responsible the labeling temporal information contained in documents and carrying out the process of normalization of temporal expressions. Found. In this module the normalization of temporal expressions has been improved, in order allow a richer temporal context determination. Experiments were conducted to evaluate the effectiveness of the approach proposed a in this research. The first, in order to verify that the topic map previously created by RISO-IC has been correctly enriched with temporal information related to the concepts correctly, and the second, to analyze the effectiveness of the normalization of expressions extracted from documents. The experiments concluded that both the RISO-GCT, as the RISO-TT, which was evolved during this work, obtained better results than similar tools.
|
29 |
Sistemas de recuperação da informação e linguagens documentárias : contribuições dos estudos da linguagemAraujo, Vera Maria Araujo Pigozzi de January 2013 (has links)
Esta pesquisa teve como objetivo gerar uma reflexão no campo dos Estudos da Linguagem e da Ciência da Informação com o propósito de investigar a natureza e o funcionamento das Linguagens Documentárias. Foi na Linguística da Enunciação e nos Estudos de Terminologia que se buscou referencial para esta investigação. Os principais teóricos desta pesquisa são: Benveniste, Martins, Cabré, Hoffmann e Ciapuscio. Fundamentado neste referencial foi possível apresentar duas propostas: sugerir um modelo de comunicação capaz de representar a relação que se estabelece entre Sistemas de Recuperação da Informação e usuários a partir de parâmetros enunciativos, e propor a geração de vocabulários controlados especializados sob o referencial enunciativo e terminológico. Estas propostas são fundamentadas nos seguintes conceitos e noções: enunciação, linguagem, língua, estrutura, sentido, significado, referência, contexto, subjetividade, intersubjetividade, locutor e categorias de pessoa, espaço e tempo, no quadro teórico da Teoria da Enunciação; 2) comunicação especializada, linguagem especializada, texto especializado, unidade terminológica, unidade fraseológica especializada e variação terminológica conceitual e denominativa, no domínio dos estudos terminológicos; 3) organização do conhecimento e representação da informação, linguagens documentárias, sistema nocional, vocabulários controlados, análise documentária, tesauros, ontologias, Sistemas de Recuperação da Informação e comunicação documentária. Concluiu-se ser possível estabelecer uma interface produtiva entre os Estudos da Linguagem e Ciência da Informação, com benefício para ambos. / The aim of this research is to generate a reflection in the field of Language Studies and Information Science in order to investigate the nature and the functioning of Documentary Languages. The referencial for this investigation comes from Linguistics of Enunciation and from Terminological Studies, mainly of Benveniste, Martins, Cabré, Hoffmann and Ciaspuscio. Based on this referential it was possible to present two proposals: to suggest a communication model able to represent the relationship established between Information Retrieval Systems and users through its enunciative parameters, and propose the generation of domain-specific controlled vocabularies under the enunciative and terminological referential. These proposals are based on the concepts and notions: 1) enunciation, language, langue, structure, meaning, significance, reference, context, subjectivity, intersubjectivity, speaker and categories of person, space and time, in the theoretical framework of the Theory of Enunciation; 2) specialized communication, specialized language, specialized text, terminological unit, specialized phraseological unit, terminological variation conceptual and denominative, in the area of terminological studies; 3) knowledge organization and representation of information, documentary languages, system notional, controlled vocabularies, documentary analysis, thesauri, ontologies, Information Retrieval Systems and documentary communication. It was concluded to be possible to establish a productive interface between Language Studies and Information Science, with benefit to both.
|
30 |
Sistemas de recuperação da informação e linguagens documentárias : contribuições dos estudos da linguagemAraujo, Vera Maria Araujo Pigozzi de January 2013 (has links)
Esta pesquisa teve como objetivo gerar uma reflexão no campo dos Estudos da Linguagem e da Ciência da Informação com o propósito de investigar a natureza e o funcionamento das Linguagens Documentárias. Foi na Linguística da Enunciação e nos Estudos de Terminologia que se buscou referencial para esta investigação. Os principais teóricos desta pesquisa são: Benveniste, Martins, Cabré, Hoffmann e Ciapuscio. Fundamentado neste referencial foi possível apresentar duas propostas: sugerir um modelo de comunicação capaz de representar a relação que se estabelece entre Sistemas de Recuperação da Informação e usuários a partir de parâmetros enunciativos, e propor a geração de vocabulários controlados especializados sob o referencial enunciativo e terminológico. Estas propostas são fundamentadas nos seguintes conceitos e noções: enunciação, linguagem, língua, estrutura, sentido, significado, referência, contexto, subjetividade, intersubjetividade, locutor e categorias de pessoa, espaço e tempo, no quadro teórico da Teoria da Enunciação; 2) comunicação especializada, linguagem especializada, texto especializado, unidade terminológica, unidade fraseológica especializada e variação terminológica conceitual e denominativa, no domínio dos estudos terminológicos; 3) organização do conhecimento e representação da informação, linguagens documentárias, sistema nocional, vocabulários controlados, análise documentária, tesauros, ontologias, Sistemas de Recuperação da Informação e comunicação documentária. Concluiu-se ser possível estabelecer uma interface produtiva entre os Estudos da Linguagem e Ciência da Informação, com benefício para ambos. / The aim of this research is to generate a reflection in the field of Language Studies and Information Science in order to investigate the nature and the functioning of Documentary Languages. The referencial for this investigation comes from Linguistics of Enunciation and from Terminological Studies, mainly of Benveniste, Martins, Cabré, Hoffmann and Ciaspuscio. Based on this referential it was possible to present two proposals: to suggest a communication model able to represent the relationship established between Information Retrieval Systems and users through its enunciative parameters, and propose the generation of domain-specific controlled vocabularies under the enunciative and terminological referential. These proposals are based on the concepts and notions: 1) enunciation, language, langue, structure, meaning, significance, reference, context, subjectivity, intersubjectivity, speaker and categories of person, space and time, in the theoretical framework of the Theory of Enunciation; 2) specialized communication, specialized language, specialized text, terminological unit, specialized phraseological unit, terminological variation conceptual and denominative, in the area of terminological studies; 3) knowledge organization and representation of information, documentary languages, system notional, controlled vocabularies, documentary analysis, thesauri, ontologies, Information Retrieval Systems and documentary communication. It was concluded to be possible to establish a productive interface between Language Studies and Information Science, with benefit to both.
|
Page generated in 0.1209 seconds