Spelling suggestions: "subject:"e recuperação dda In"" "subject:"e recuperação daa In""
101 |
Recomendação de tags para mídia social colaborativa: da generalização à personalizaçãoZiesemer, Angelina de Carvalho A. January 2012 (has links)
Made available in DSpace on 2013-08-07T18:42:45Z (GMT). No. of bitstreams: 1
000438773-Texto+Completo-0.pdf: 3581155 bytes, checksum: 8bd17c869fd04adc206bbbcd32f4b1dd (MD5)
Previous issue date: 2012 / Social media systems such as Flickr, Youtube and Picasa have become very popular as they provide a collaborative environment to share photos and videos supporting tags, ratings and comments. This kind of interaction includes a lot of content provided by users, which may bring meaningful information to recommendation systems. The aggregation of tags is also a way to cluster items and provide tag-based search content. We investigate how to support tag recommendation by ranking the co-occurrence, popularity and relevance of commonly-used tags in similar items and by similar users. We developed a tag recommendation system to recommend of possibly relevant tags. We use Flickr’s dataset to analyze our algorithm’s behavior and present the results provide by the experiment. A new model using personalized recommendation was developed using the experiment results and the behavior of each user. / Sistemas de mídia social como Flickr, Youtube e Picasa tornaram-se muito populares devido ao seu ambiente para compartilhamento de imagens, vídeos e suporte à atribuição de tags, avaliações e comentários. Sistemas colaborativos possuem grandes quantidades de conteúdo provido pelos usuários, os quais fornecem informações relevantes para engines de recomendação. O uso de tags também permite a clusterização e busca de conteúdo baseado em palavras-chaves. Neste trabalho foi investigado um mecanismo para recomendar tags, desenvolvendo medidas de co-ocorrência, popularidade e relevância de tags comumente usadas em itens similares e por usuários similares. Foi desenvolvido um sistema para recomendar possíveis tags relevantes baseadas na similaridade contextual de outras tags providas pelos usuários. Para o desenvolvimento do experimento, foi utilizado um dataset do Flickr para gerar recomendações e analisar o comportamento do algoritmo e as atribuições efetuadas pelos usuários participantes. Os resultados obtidos demonstraram padrões de atribuição e desempenho de acordo com o conteúdo/contexto da imagem. Utilizando a frequência de atribuição baseada no histórico de cada perfil é sugerido um novo modelo personalizado para recomendação de tags.
|
102 |
Extração automática de conceitos a partir de textos em língua portuguesaLopes, Lucelene January 2012 (has links)
Made available in DSpace on 2013-08-07T18:43:26Z (GMT). No. of bitstreams: 1
000439085-Texto+Completo-0.pdf: 7508888 bytes, checksum: c69f67a5ec361212f83a17a4407866ce (MD5)
Previous issue date: 2012 / This thesis describes a process to extract concepts from texts in portuguese language. The proposed process starts with linguistic annotated corpora from specific domains, and it generates lists of concepts for each corpus. The proposal of a linguistic oriented extraction procedure based on noun phrase detection, and a set of heuristics to improve the overall quality of concept candidate extraction is made. The improvement in precision and recall of extracted term list is from approximatively from 10% to more more than 60%. A new index (tf-dcf) based on contrastive corpora is proposed to sort the concept candidate terms according to the their relevance to their respective domain. The precision results achieved by this new index are superior to to the results achieved by indices proposed in similar works. Cut-off points are proposed in order to identify, among extracted concept candidate terms sorted according to their relevance, which of them will be considered concepts. A hybrid approach to choose cut-off points delivers reasonable F-measure values, and it brings quality to the concept identification process. Additionally, four applications are proposed in order to facilitate the comprehension, handling, and visualization of extracted terms and concepts. Such applications enlarge this thesis contributions available to a broader community of researchers and users of Natural Language Processing area. The proposed process is described in detail, and experiments empirically evaluate each process step. Besides the scientific contribution made with the process proposal, this thesis also delivers extracted concept lists for five different domain corpora, and the prototype of a software tool (EχATOLP) implementing all steps of the proposed process. / Essa tese descreve um processo para extrair conceitos de textos em língua portuguesa. O processo proposto inicia com corpora de domínio linguisticamente anotados, e gera listas de conceitos dos domínios de cada corpus. Utiliza-se uma abordagem linguística, que baseia-se na identificação de sintagmas nominais e um conjunto de heurísticas que melhoram a qualidade da extração de candidatos a conceitos. Essa melhora é expressa por incrementos aproximadamente de 10% para mais de 60% nos valores de precisão e abrangência das listas de termos extraídas. Propõe-se um novo índice (tf-dcf) baseado na comparação com corpora contrastantes, para ordenar os termos candidatos a conceito extraídos de acordo com suas relevâncias para o corpus de domínio. Os resultados obtidos com esse novo índice são superiores aos resultados obtidos com índices propostos em trabalhos similares. Aplicam-se pontos de corte para identificar, dentre os termos candidatos classificados segundo sua relevância, quais serão considerados conceitos. O uso de uma abordagem híbrida para escolha de pontos de corte fornece valores adequados de medida F, trazendo qualidade ao processo de identificação de conceitos. Adicionalmente. propõem-se quatro aplicações para facilitar a compreensão, manipulação e visualização dos termos e conceitos extraídos. Essas aplicações tornam as contribuições dessa tese acessíveis a um maior número de pesquisadores e usuários da área de Processamento de Linguagem Natural. Todo o processo proposto é descrito em detalhe, e experimentos avaliam empiricamente cada passo. Além das contribuições científicas feitas com a proposta do processo, essa tese também apresenta listas de conceitos extraídos para cinco diferentes corpora de domínio, e o protótipo de numa ferramenta de software (EXATOLP) que implementa todos os passos propostos.
|
103 |
Caracterização dos fatores de relevância do usuário no processo de recuperação de informação : estudo em ambiente de pesquisa em pós-graduaçãoPitangueira, Antônio Maurício da Silva January 2004 (has links)
Com o desenvolvimento e crescimento das tecnologias de informação e, em especial, a Internet, encontrar informação relevante e útil tornou-se uma tarefa complexa que envolve os aspectos computacionais dos Sistemas de Recuperação de Informação (SRIs) e os aspectos situacionais, psicológicos e cognitivos dos usuários. No entanto, há um desequilíbrio neste cenário pois o enfoque das pesquisas de recuperação de informação (RI) está extremamente voltado para a abordagem computacional. Decorrente deste viés, o aspecto central da recuperação de informação – o julgamento de relevância – tornou-se muito limitado e acarretou em baixo desempenho dos SRIs. Notando esta problemática, esta pesquisa teve como objetivo caracterizar os fatores de relevância empregados pelos usuários durante o processo de RI com o intuito de contribuir para a especificação de requisitos e avaliação daqueles sistemas. Assim, a pesquisa foi composta por duas etapas de avaliação denominadas ex ante e ex post para verificar a mudança de percepção em torno dos julgamentos de relevância. Para tanto, foi criado um instrumento de pesquisa para verificar os julgamentos de relevância que foram avaliados por 49 respondentes, obtendo um total de 238 objetos informacionais avaliados no momento ex ante e destes, 224 foram retornados (ex post). Os resultados encontrados mostraram que existe uma significativa mudança de percepção dos usuários nas duas medições, e demonstraram que os fatores de relevância obedecem a um processo decisório bem definido. Observou-se também que a utilidade e os aspectos cognitivos são as manifestações de relevância consideradas mais importantes pelos usuários e as demais servem para ter a noção de rejeição ou não do objeto informacional.
|
104 |
Biblioteca virtual de imagens em medicina(BVIM) / Virtual imagens library in medicine(VILM)Carrare, Ana Paula Galvão Damasceno [UNIFESP] January 2005 (has links) (PDF)
Made available in DSpace on 2015-12-06T23:06:30Z (GMT). No. of bitstreams: 0
Previous issue date: 2005 / Na área da saúde as imagens são muito utilizadas, tanto na prática
profissional quanto na educação. Como conseqüência, há uma constante procura de formas para armazená-las, organizá-las e recuperá-las. Ao longo do tempo e muito em função da forma como, habitualmente, são arquivadas, as imagens sofrem danos que
podem inutilizá-las. Há também problemas quanto ao compartilhamento destas, visto que, normalmente, estão concentradas em áreas ou grupos específicos, o que dificulta
a consulta. O presente trabalho teve como objetivo desenvolver um ambiente de
organização e recuperação de imagens na área da saúde com foco na educação e, paralelamente, permitir aos profissionais organizá-las e compartilhá-las com os outros membros da comunidade. Para tanto, foi escolhido o formato digital, com interface Web, no qual as imagens foram catalogadas com protocolo específico, indexadas a partir do texto descritivo e classificadas com o vocabulário controlado DeCs da
Bireme. A consulta foi implementada baseando-se no modelo booleano, no uso de metadados e na pesquisa hierárquica. O resultado da busca foi ordenado pela relevância de cada imagem. O produto final do trabalho foi a Biblioteca Virtual de Imagens em Medicina (BVIM), que dispõe de áreas de acesso público e restrito, esta última utilizada como interface de administração e meio de alimentação do acervo pelos colaboradores. A biblioteca, pela sua área pública, permite fácil acesso às coleções adquiridas no exercício das várias profissões da área da saúde. Por outro lado, também proporciona aos profissionais colaboradores o gerenciamento das próprias imagens e, ao mesmo tempo, sua contribuição para o acervo, ajudando na disseminação e democratização do conhecimento. / In the health areas images are very much used, both in the professional practice as in education. As a consequence, there is a constant search on ways to store, organize and retrieve them. With the passing of time and much because of the way they are usually filed, the images suffer damages that can render them useless. There are also problems with sharing them, since they are normally concentrated on specific areas and groups which makes it difficult to consult them. This work has as objective to develop an environment of organization and retrieval images in the health area with a focus on education and also to allow professionals to organize and share said images with other colleagues. For that purpose the digital format with WEB interface was chosen, in which the images were cataloged with a specific protocol, indexed based on the descriptive text and classified with Bireme’s DeCs®
controlled vocabulary. Consultation was implemented based on the Boolean method, on the use of metadata and hierarchic research. The research result was ordered
according to the significance of each image. The final work product was the Virtual
Images Library in Medicine (VILM), which provides for public and restrict access areas,
the latter used as management interface and means for the collaborators to supply the
assets. The library, through its public area, allows for easy access to the collections
acquired in the exercise of the several professions within the health industry. On the
other hand, it also allows that the collaborator professionals may manage their own
images and at the same time contribute to the pool of assets, helping in the spreading
and democratization of knowledge. / BV UNIFESP: Teses e dissertações
|
105 |
Recuperação de informação em campos de texto livre de prontuario eletrônicos do paciente baseada em semelhança semântica e ortográfica / Information retrieval from free text of eletronic patient records based on semantic similarity and approximate string matchingMartha, Amilton Souza [UNIFESP] January 2005 (has links) (PDF)
Made available in DSpace on 2015-12-06T23:44:25Z (GMT). No. of bitstreams: 0
Previous issue date: 2005 / A Recuperação de Informações é a ciência que estuda a criação de algoritmos para recuperar informações, principalmente provenientes de textos livres, que constituem a maior parte da informação em forma digital disponível nos dias atuais, sobretudo após a Internet. É evidente a necessidade de técnicas para recuperar informações dessa grande massa. Mecanismos de busca como Google®, Altavista®, Yahoo® e outros são indispensáveis para encontrar informações espalhadas na Internet em páginas da Web (arquivos PDF, TXT, HTML e outros) nos dias atuais. Na área da saúde, muitas informações também se encontram na forma de textos livres como os artigos científicos em bases de dados específicas da saúde como o Medline que possuem ferramentas de busca como Pubmed. Prontuários Eletrônicos do Paciente (PEP) também possuem informações em textos livres como o histórico ou evolução do paciente. Os profissionais da saúde que inserem informações podem utilizar termos sinônimos, jargões médicos, abreviaturas ou mesmo terem erros de ortografia. Para esses casos, a recuperação de informações com essas variações pode ser algo não trivial. Foram utilizadas duas bases de dados de PEP´s de clínicas distintas, sendo a primeira com 6732 histórias clínicas e a segunda com 26072 histórias. Foi desenvolvido um software chamado SIRIMED (Sistema de Indexação e Recuperação de Informações Médicas) que permitiu mostrar que a recuperação de informações baseada em semelhança semântica com um thesaurus médico (DeCS – Descritores em Ciências da Saúde) e semelhança ortográfica, baseada em um algoritmo de stemming, juntamente com edit distance, pode melhorar a quantidade de termos recuperados numa busca, em média de 30% comparada com a busca tradicional direta, que faz somente a busca do termo exato. A média de falsos positivos encontrados é menor que 0,5% nas duas bases de dados, o que não compromete o resultado do aumento de recuperação conseguido. / Information retrieval is a science that investigates models and techniques to recover information, mainly from free texts, that are the majority digital information after the internet advent. The necessity of techniques to recover information from this great mass of data is evident. Search engines like Google®, Altavista®, Yahoo® and others are indispensable to find information at Internet in PDF, TXT or HTML files. In the health context, a lot of information is registered as free texts like scientific articles into specific health databases like Medline which has specific search engines (Pubmed). Electronic Record Patient (ERP) has also free text information to describe patient’s history or evolution. The health professional who inserts information can use synonymous or medical terms, abbreviations or even make orthography mistake. In these cases, the recovery of the information with these variations could be not trivial. Two ERP databases from distinct clinics had been used. The first one had 6732 clinical histories and second had 26072 histories. A software called SIRIMED (Sistema de Indexação e Recuperação de Informações Médicas) was developed to show that recovery of the information based in both similarity semantics with a medical thesaurus (DeCS – Descritores em Ciências da Saúde) and approximate string matching (based on stemming and edit distance algorithm) can improve approximately 30% the amount of terms recovered if compared to traditional method, which searches only the exact string matching. The false positives average is less than 0.5% for both databases and, therefore, it doesn’t prejudice the obtained results. / BV UNIFESP: Teses e dissertações
|
106 |
Um modelo de arquitetura de sistemas de informação para o setor públicoTait, Tania Fatima Calvi January 2000 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico. / Made available in DSpace on 2012-10-17T20:08:11Z (GMT). No. of bitstreams: 1
172952.pdf: 718377 bytes, checksum: 80ce57f154ac3d9490324562dbf97260 (MD5) / O setor público, a despeito do decantado atraso tecnológico, apresenta, na atualidade, a necessidade de disponibilizar a informação aos cidadãos e ao nível governamental para a tomada de decisão, buscando novas tecnologias que propiciem o atendimento a estas necessidades. Novos modelos para tratar a informação têm sido propostos, sem, no entanto, considerar a estrutura particular do setor público, como a escassez de recursos financeiros e de pessoal; a mudança de governo e a conseqüente volatilização da estratégia administrativa, entre outros. Muitos destes modelos também são centrados unicamente na questão tecnológica, ignorando outras questões intrínsecas ao desenvolvimento e uso dos sistemas de informação (SI) (e.g., participação dos usuários; cultura organizacional, entre outros). Assim, esta tese propõe um modelo de Arquitetura de Sistemas de Informação (ASI) que considera as questões peculiares do setor público, as características do uso e desenvolvimento de SI neste setor, a partir da literatura e de estudos realizados em empresas públicas estaduais prestadoras de serviços de informática. O modelo proposto é baseado na linha da integração entre SI, Tecnologia de Informação e Negócios e foi estruturado segundo cinco componentes: (a) estrutura governamental (missão e cultura organizacional, planejamento e plataforma de governo); (b) serviços públicos (considerado os "negócios" da estrutura pública, com a disponibilidade de informações aos cidadãos, aos tomadores de decisão e aos técnicos administrativos do governo); (c) sistemas de informação (incluindo os sistemas transacionais ou legados e os sistemas de atendimento a secretários e ao governador); (d) tecnologia de informação (centrada na política de investimentos e nas plataformas computacionais de governos - ex: relação micro-computador e mainframe); e (e) usuários (centrado nas necessidades voltadas ao atendimento ao público - treinamento, adequação e uso dos SI). O modelo de ASI proposto foi submetido à validação por parte de empresas estaduais prestadoras de serviços de informática. Os resultados indicam a relevância da visão integrada de seus componentes, a confirmação da inadequação dos modelos existentes para a realidade pública e permitiram estabelecer estratégias de implantação do modelo de ASI, de forma a contemplar as especificidades do setor público.
|
107 |
Análise comparativa dos modelos e sistemas probabilísticos em recuperação de informação em bases textuaisTakao, Eduardo Liquio January 2001 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Computação. / Made available in DSpace on 2012-10-18T03:38:36Z (GMT). No. of bitstreams: 1
181763.pdf: 381856 bytes, checksum: 6ae6fa6215bf679b2b4db31f88690a8d (MD5) / A dificuldade de encontrar uma informação específica, é um dos grandes problemas encontrados hoje em dia. A Recuperação de Informação (IR) é uma área da computação que estuda o desenvolvimento de técnicas para permitir o acesso rápido a uma grande quantidade de informações. Estas informações podem ser: texto, vídeo ou áudio. Dentre os modelos clássicos de IR destacam-se três: Booleano, Vetor Espacial e Probabilístico. Neste trabalho estudar-se-ão os modelos clássicos, em especial os probabilísticos alternativos em IR. Os modelos probabilísticos são baseados no Princípio da Classificação da Probabilidade. Muitos modelos probabilísticos estão sendo estudados, mais um dos grandes problemas é trazer somente o conjunto de informações realmente importantes para a necessidade do usuário. Este trabalho descreve os modelos e sistemas probabilísticos em recuperação de informação textual, com o objetivo de analisar suas características, limitações e resultados, a fim de prover melhorias e contribuir para o aperfeiçoamento dos modelos e sistemas propostos.
|
108 |
Sistema de informação para a administração municipal : o caso da AMAVI - Associação dos Municipios do Alto Vale do ItajaiCosta, Marilia Maria Roslindo Damiani January 1993 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina. Centro Socio-Economico. Inclui anexo / Made available in DSpace on 2012-10-16T05:33:42Z (GMT). No. of bitstreams: 0Bitstream added on 2016-01-08T18:10:52Z : No. of bitstreams: 1
90998.pdf: 4113017 bytes, checksum: 7461bc3cbab42cbb79b0cb77f60ab74f (MD5) / O propósito desta pesquisa foi verificar até que ponto a Associação dos Municípios do Alto Vale do Itajaí - AMAVI, conta com um sistema de informação estruturado, que propicie informações para o desenvolvimento das atividades de seus dirigentes e dos Prefeitos dos municípios associados. Como objetivos específicos, procurou-se: levantar as atividades desenvolvidas pelos dirigentes da AMAVI e pelos Prefeitos dos municípios associados, no período 1989-1992; identificar as informações necessárias ao desenvolvimento das atividades dos dirigentes da AMAVI e dos Prefeitos dos municípios associados, no período 1989-1992; verificar a disponibilidade informaciconal no sistema de informação da AMAVI; diagnosticar a adequação da estrutura do sistema de informação da AMAVI para atender a estas necessidades informacionais. Face aos resultados, concluiu-se que: a AMAVI não conta com um sistema de informação estruturado que propicie informações para o desenvolvimento das atividades de seus dirigentes e dos Prefeitos dos municípios associados; sugere-se, então, uma série de ações com vistas a estruturar um sistema de informação em rede, para atender às especificidades da AMAVI e de seus associados.
|
109 |
A busca de informação em equipes multidisciplinaresMoura, Victor Hugo Vieira January 1997 (has links)
Dissertação (mestrado) - Universidade Federal de Minas Gerais, Programa de Pós-Graduação em Ciências da Informação. / Made available in DSpace on 2012-10-17T00:36:01Z (GMT). No. of bitstreams: 0
|
110 |
Metadados : a recuperação de imagens digitais baseada em conteúdo /Santos, Júllia Mendes Pestana dos. January 2018 (has links)
Orientadora: Telma Campanha de Carvalho Mádio / Banca: Ana Cristina de Albuquerque / Banca: Edberto Ferneda / Resumo: A questão da indexação e recuperação de imagens tem atraído a atenção de novos interessados, tanto os preocupados com o conteúdo informacional, quanto os interessados em desenvolver formas automatizadas de descrição e acesso ao conteúdo imagético. No contexto das imagens digitais, para que elas se tornem recursos disponíveis, recuperáveis e acessíveis é necessário um desenvolvimento de processos para construção de representações. Um impulso na revolução das imagens digitais foi dado pela expansão da utilização dos computadores, onde surgiram técnicas para captura, armazenamento, processamento e transmissão das mesmas. Neste sentido, o objetivo do trabalho foi discutir o processo de indexação e recuperação de imagens no contexto de sistemas informáticos. Abordamos tanto a indexação quanto a recuperação de imagens fotográficas, visando melhorar a precisão de recuperação desses documentos em sistemas de informação. O uso de metadados neste contexto é significativo, pois o funcionamento da web está ligado à facilidade de recuperação de dados. E assim, os sistemas de Recuperação da Imagem Baseado em Conteúdo (CBIR) evidenciam a necessidade da introdução de novos atributos/características, como a utilização de cor, formas, texturas. Mas somente essas propriedades não solucionam o problema da organização e recuperação de conteúdo imagético e, portanto nesse contexto a criação de metadados aos elementos básicos da linguagem visual: ponto, linha, forma, direção, tom, cor, textura, esc... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The issue of indexing and retrieval of images has attracted the attention of new stakeholders, both those concerned with the information content of the images and those interested in developing automated forms of description and access to images. In the context of digital images, for them to become available, retrievable and accessible resources, a process development is necessary for the construction of representations. An impulse in the digital imaging revolution was the expansion of computer use, where techniques for capturing, storing, processing and transmitting images emerged. In this sense, the objective of the work is the process of indexing and retrieving images in the context of computer systems. We address both indexing and retrieval of photographic images, aiming to improve the accuracy of image retrieval in information systems. The use of metadata in this context will be significant, as the operation of the web is linked to the ease of data recovery. Thus, Content Based Image Retrieval (CBIR) systems highlight the need to introduce new attributes / characteristics, such as the use of color, shapes, textures. But only these properties do not solve the problem of image organization and retrieval, and in this context, the creation of metadata to the basic elements of visual language: point, line, shape, direction, tone, color, texture, scale, dimension and motion for construction and image recovery will be the proposal and analysis of this research. And the results show that the software Sepiades, because it is a free software, although it is for image description, it becomes more accessible and compatible and its elements are susceptible of miscegenation, being a good solution. It is concluded that a significant participation of indexers in the development of software for organization and ... (Complete abstract click electronic access below) / Mestre
|
Page generated in 0.07 seconds