Spelling suggestions: "subject:"recuperação dde informação"" "subject:"recuperação dde enformação""
351 |
Modelo social de relevância para opiniões. / S.O.R.M.: Social Opinion Relevance Model.Allan Diego Silva Lima 02 October 2014 (has links)
Esta tese apresenta um modelo de relevância de opinião genérico e independente de domínio para usuários de Redes Sociais. O Social Opinion Relevance Model (SORM) é capaz de estimar a relevância de uma opinião com base em doze parâmetros distintos. Comparado com outros modelos, a principal característica que distingue o SORM é a sua capacidade para fornecer resultados personalizados de relevância de uma opinião, de acordo com o perfil da pessoa para a qual ela está sendo estimada. Devido à falta de corpus de relevância de opiniões capazes de testar corretamente o SORM, fez-se necessária a criação de um novo corpus chamado Social Opinion Relevance Corpus (SORC). Usando o SORC, foram realizados experimentos no domínio de jogos eletrônicos que ilustram a importância da personalização da relevância para alcançar melhores resultados, baseados em métricas típicas de Recuperação de Informação. Também foi realizado um teste de significância estatística que reforça e confirma as vantagens que o SORM oferece. / This thesis presents a generic and domain independent opinion relevance model for Social Network users. The Social Opinion Relevance Model (SORM) is able to estimate an opinions relevance based on twelve different parameters. Compared to other models, SORMs main distinction is its ability to provide customized results, according to whom the opinion relevance is being estimated for. Due to the lack of opinion relevance corpora that are able to properly test our model, we have created a new one called Social Opinion Relevance Corpus (SORC). Using SORC, we carried out some experiments on the Electronic Games domain that illustrate the importance of customizing opinion relevance in order to achieve better results, based on typical Information Retrieval metrics, such as NDCG, QMeasure and MAP. We also performed a statistical significance test that reinforces and corroborates the advantages that SORM offers.
|
352 |
Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca. / Term-oriented relevance feedback: a novel ranking method for search engines.Fernando Hattori 23 May 2016 (has links)
O modelo de recuperação de informação mais amplamente utilizado no contexto de acervos digitais é o Vector Space Model. Algoritmos implementados para este modelo que aproveitam informações sobre relevância obtidas dos usuários (chamados feedbacks) na tentativa de melhorar os resultados da busca. Porém, estes algoritmos de feedback de relevância não possuem uma estratégia global e permanente, as informações obtidas desses feedbacks são descartadas para cada nova sessão de usuário (são perenes) ou não modificam os documentos como um todo (são alterações locais). Este trabalho apresenta um método de feedbacks de relevância denominado orientado a termos, permitindo que as modificações realizadas por influência dos feedbacks dos usuários sejam globais e permanentes. Foram realizados experimentos utilizando o dataset ClueWeb09 que dão evidências de que este método melhora a qualidade dos resultados da busca em relação ao modelo tradicional Vector Space Model. / The Vector Space Model is the most widely used information retrieval model within digital libraries\' systems. Algorithms developed to be used with this model use relevance information obtained from users (called feedbacks) to improve the search results. However, the relevance feedback algorithms developed are not global nor permanent, the feedbacks are discarded in users new sessions and do not affect every document. This paper presents a method that uses of relevance feedback named terms oriented. In this method, users\' feedbacks lead to modifications in the terms\' vectors representations. These modifications are global and permanent, influencing further searches. An experiment was conducted using the ClueWeb09 dataset, giving evidence that this method improves the quality of search results when compared with Vector Space Model.
|
353 |
Análise de métodos para programação de contextualização. / Analysis of methods for programming of page context classification.Sílvio Luís Marangon 26 October 2006 (has links)
A localização de páginas relevantes na Internet em atividades como clipping de notícias, detecção de uso indevido de marcas ou em serviços anti-phishing torna-se cada vez mais complexa devido a vários fatores como a quantidade cada vez maior de páginas na Web e a grande quantidade de páginas irrelevantes retornadas por mecanismos de busca. Em muitos casos as técnicas tradicionais utilizadas em mecanismos de busca na Internet, isto é, localização de termos em páginas e ordenação por relevância, não são suficientes para resolver o problema de localização de páginas específicas em atividades como as citadas anteriormente. A contextualização das páginas, ou seja, a classificação de páginas segundo um contexto definido pelo usuário baseando-se nas necessidades de uma atividade específica deve permitir uma busca mais eficiente por páginas na Internet. Neste trabalho é estudada a utilização de métodos de mineração na Web para a composição de métodos de contextualização de páginas, que permitam definir contextos mais sofisticados como seu assunto ou alguma forma de relacionamento. A contextualização de páginas deve permitir a solução de vários problemas na busca de páginas na Internet pela composição de métodos, que permitam a localização de páginas através de um conjunto de suas características, diferentemente de mecanismos de busca tradicionais que apenas localizam páginas que possuam um ou mais termos especificados. / Internet services as news clipping service, anti-phising, anti-plagiarism service and other that require intensive searching in Internet have a difficult work, because of huge number of existing pages. Search Engines try driver this problem, but search engines methods retrieve a lot of irrelevant pages, some times thousands of pages and more powerful methods are necessary to drive this problem. Page content, subject, hyperlinks or location can be used to define page context and create a more powerful method that can retrieve more relevant pages, improving precision. Classification of page context is defined as classification of a page by a set of its feature. This report presents a study about Web Mining, Search Engines and application of web mining technologies to classify page context. Page context classification applied to search engines must solve the problem of irrelevant pages flood by allowing search engines retrieve pages of a context.
|
354 |
Geração automática de metadados: uma contribuição para a Web semântica. / Automatic metadata generation: a contribution to the semantic Web.Eveline Cruz Hora Gomes Ferreira 05 April 2006 (has links)
Esta Tese oferece uma contribuição na área de Web Semântica, no âmbito da representação e indexação de documentos, definindo um Modelo de geração automática de metadados baseado em contexto, a partir de documentos textuais na língua portuguesa, em formato não estruturado (txt). Um conjunto teórico amplo de assuntos ligados à criação de ambientes digitais semântico também é apresentado. Conforme recomendado em SemanticWeb.org, os documentos textuais aqui estudados foram automaticamente convertidos em páginas Web anotadas semanticamente, utilizando o Dublin Core como padrão para definição dos elementos de metadados, e o padrão RDF/XML para representação dos documentos e descrição dos elementos de metadados. Dentre os quinze elementos de metadados Dublin Core, nove foram gerados automaticamente pelo Modelo, e seis foram gerados de forma semi-automática. Os metadados Description e Subject foram os que necessitaram de algoritmos mais complexos, sendo obtidos através de técnicas estatísticas, de mineração de textos e de processamento de linguagem natural. A finalidade principal da avaliação do Modelo foi verificar o comportamento dos documentos convertidos para o formato RDF/XML, quando estes foram submetidos a um processo de recuperação de informação. Os elementos de metadados Description e Subject foram exaustivamente avaliados, uma vez que estes são os principais responsáveis por apreender a semântica de documentos textuais. A diversidade de contextos, a complexidade dos problemas relativos à língua portuguesa, e os novos conceitos introduzidos pelos padrões e tecnologias da Web Semântica, foram alguns dos fortes desafios enfrentados na construção do Modelo aqui proposto. Apesar de se ter utilizado técnicas não muito novas para a exploração dos conteúdos dos documentos, não se pode ignorar que os elementos inovadores introduzidos pela Web Semântica ofereceram avanços que possibilitaram a obtenção de resultados importantes nesta Tese. Como demonstrado aqui, a junção dessas técnicas com os padrões e tecnologias recomendados pela Web Semântica pode minimizar um dos maiores problemas da Web atual, e uma das fortes razões para a implementação da Web Semântica: a tendência dos mecanismos de busca de inundarem os usuários com resultados irrelevantes, por não levarem em consideração o contexto específico desejado pelo usuário. Dessa forma, é importante que se dê continuidade aos estudos e pesquisas em todas as áreas relacionadas à implementação da Web Semântica, dando abertura para que sistemas de informação mais funcionais sejam projetados / This Thesis offers a contribution to the Semantic Web area, in the scope of the representation and indexing of documents, defining an Automatic metadata generation model based on context, starting from textual documents not structured in the Portuguese language. A wide theoretical set of subjects related to the creation of semantic digital environments is also presented. As recommended in SemanticWeb.org, the textual documents studied here were automatically converted to Web pages written in semantic format, using Dublin Core as standard for definition of metadata elements, and the standard RDF/XML for representation of documents and description of the metadata elements. Among the fifteen Dublin Core metadata elements, nine were automatically generated by the Model, and six were generated in a semiautomatic manner. The metadata Description and Subject were the ones that required more complex algorithms, being obtained through statistical techniques, text mining techniques and natural language processing. The main purpose of the evaluation of the Model was to verify the behavior of the documents converted to the format RDF/XML, when these were submitted to an information retrieval process. The metadata elements Description and Subject were exhaustively evaluated, since these are the main ones responsible for learning the semantics of textual documents. The diversity of contexts, the complexity of the problems related to the Portuguese language, and the new concepts introduced by the standards and technologies of the Semantic Web, were some of the great challenges faced in the construction of the Model here proposed. In spite of having used techniques which are not very new for the exploration and exploitation of the contents of the documents, we cannot ignore that the innovative elements introduced by the Web Semantic have offered improvements that made possible the obtention of important results in this Thesis. As demonstrated here, the joining of those techniques with the standards and technologies recommended by the Semantic Web can minimize one of the largest problems of the current Web, and one of the strong reasons for the implementation of the Semantic Web: the tendency of the search mechanisms to flood the users with irrelevant results, because they do not take into account the specific context desired by the user. Therefore, it is important that the studies and research be continued in all of the areas related to the Semantic Web?s implementation, opening the door for more functional systems of information to be designed.
|
355 |
Aumentando a acurácia de predição de avaliação de sistemas de recomendação de vídeo com o uso de pontos de interesse / Enhancing the Predictions accuracy of POI video recommender systemsDias, Alessandro da Silveira January 2013 (has links)
A cada dia aumenta o número de vídeos disponíveis no mundo. Por exemplo, há uma vasta quantidade de sites de vídeos disponíveis na Web e serviços de Vídeo Sob Demanda além de dispositivos que fazem a gravação de vídeos automaticamente, conhecidos como Personal Video Recorders, 24 horas por dia. Isso pode ocasionar um problema ao usuário: a sobrecarga de conteúdo em formato de vídeo. Uma das maneiras de se tratar tal problema consiste no uso de sistemas de recomendação, os quais filtram o conteúdo com o objetivo de entregar o que for mais interessante ao usuário. A abordagem típica utilizada pelos sistemas atuais consiste em um sistema de recomendação híbrido, i.e., que utiliza tanto filtragem baseada em conteúdo quanto filtragem colaborativa, minimizando os problemas que tais abordagens possuem individualmente. Adicionalmente, com o objetivo de melhorar a recomendação ou de criar novas formas de recomendação, têm sido apresentadas novas abordagens, tais como sistemas de recomendação utilizando dados de redes sociais, computação afetiva, tags, entre outros. Este trabalho tem como objetivo apresentar uma abordagem inovadora, a qual utiliza pontos de interesse em vídeo de usuários (ou seja, os segmentos dos vídeos que eles mais gostam ou que mais se interessam) para melhorar a acurácia de predição de sistemas de recomendação de vídeo que utilizam filtragem colaborativa baseados na abordagem usuário-usuário. Na abordagem proposta, os usuários participam de forma mais ativa e mais interativa ao marcarem seus pontos de interesse. Para avaliação de tal abordagem proposta foi realizada uma avaliação experimental em termos de acurácia de predição de avaliação; pela qual constatou-se que houve melhora na predição de avaliação do sistema de recomendação. Tal melhora está diretamente relacionada com o nível de participação das pessoas na marcação de pontos de interesse. / Every day the number of videos available in the world increases. For example, there is a vast amount of video sites available on the Web, Video On Demand services, as well as devices that records videos automatically, known as Personal Video Recorders, 24 hours a day. It may create a problem for the user: the overload of content in video format. One of the ways to treat such problem is the use of recommender systems, which filter the content in order to deliver what is most interesting to the user. The typical approach is to present a hybrid recommender system, i.e., that uses both contentbased filtering and collaborative filtering, minimizing the problems that these approaches have individually. Additionally, in order to improve the recommendation or to create new approaches of recommendation, has been given new approaches such as systems using data from social networks, affective computing, tags, etc. This paper aims to present an innovative approach, which uses points of interest (POI) in video of users (i.e., video segments best liked or most interested by them) to augment the prediction accuracy of video recommender systems with collaborative filtering based in the useruser approach. In the proposed approach, users participate more actively and more interactively to mark their points of interest. To evaluate this proposed approach an experimental evaluation was performed in terms of accuracy of ratings predictions; in which it was verified that there was an improvement in ratings prediction accuracy of the recommendation system. This improvement is directly related to the level of participation of people in marking points of interest.
|
356 |
A contribuição da indexação no processo de seleção de palavras-chave no Google Adwords / The contribution of indexing in the keyword selection process for Google AdwordsAraújo, Andréa Nunes de 25 September 2018 (has links)
Devido ao estabelecimento de negócios pela Internet, o Google alcançou notoriedade mundial, tornando-se atrativo às empresas como canal do Marketing Digital na utilização da ferramenta Google Adwords. Em vista disso, o presente estudo consistiu no levantamento bibliográfico do Marketing de Busca e da Biblioteconomia e Documentação, no qual o principal objetivo é contribuir através do uso de técnicas de Indexação, no processo de seleção de palavras-chave, e conduzi-las na ferramenta de anúncios do Google. Os métodos desta pesquisa foram estabelecidos pela Representação Documentária, com a finalidade de contribuir na diminuição de palavras-chave que oneram as campanhas no Adwords. A partir da coleta dos assuntos mais acessados no Google Trends, no período de quatro meses (jan-abr) de 2017, e a realização de testes em janeiro de 2018 no planejador de palavras-chave do Google, apresentamos a avaliação dos resultados comparativos entre os dados coletados e os dados da lista, com a finalidade de responder se o uso das técnicas de indexação podem ser ou não favoráveis nas criações de campanhas aos clientes brasileiros neste mecanismo de busca. Concluiu-se que a contribuição da Indexação é favorável as campanhas publicitárias no Google, e também requer a inclusão do bibliotecário, já que se trata do profissional com habilidades e competências necessárias na execução desta tarefa, que ficará atento as influências exercidas pelos algoritmos tanto nos valores de palavras-chave quanto na recuperação desses termos ao público de interesse no mecanismo de busca. / Due to the establishment of Internet business, Google has achieved world renown, becoming attractive to companies as a channel of Digital Marketing in the use of Google Adwords tool. Therefore, the present study consisted of a bibliographical survey of Search Marketing and Librarianship and Documentation, in which the main objective is to contribute using Indexing techniques, in the process of selection of keywords, and to conduct them in the Google Ad Tool. The methods of this research were established by the Documentary Representation, with the purpose of contributing to the reduction of keywords that affect the campaigns in Adwords. From the most commonly accessed subjects in Google Trends in the four-month period (Jan-Apr), 2017, and testing in January 2018 on Google\'s keyword planner, we present an assessment of the comparative results between the collected data and the data of the list, in order to answer if the use of the indexing techniques can be or not favorable in the creations of campaigns to the Brazilian clients in this search engine. It was concluded that the contribution of Indexation is favorable to advertising campaigns in Google, and also requires the inclusion of the librarian, since it is the professional with the necessary skills and competences in the execution of this task, which will be attentive to the influences exerted by the algorithms both in keyword values as well as the retrieval of those terms to the public of interest in the search engine.
|
357 |
Normalização de meta : Informação para arquivos multimédiaSousa, Hugo Manuel Lima de January 2004 (has links)
Dissertação apresentada para obtenção do grau de Mestre em Gestão de Informação
|
358 |
Interface de busca e recuperação de informação : um modelo baseado nos princípios da hermenêutica e na utilização de ontologias /Reis, Márcia Cristina dos. January 2019 (has links)
Orientador: Edberto Ferneda / Banca: Carlos Cândido de Almeida / Banca: Walter Moreira / Banca: Licínio Gomes Roque / Banca: Luciana Maria Vieira Pöttker / Resumo: As interfaces de busca disponíveis no contexto da Web e dos repositórios digitais, apesar da importância que possuem em função da necessidade cada vez maior de recuperação de informação relevante e útil, tiveram mudanças pouco significativas nos últimos anos em relação à forma de interação com o usuário. Além disso, apresentam inúmeros problemas relacionados principalmente à dependência de conhecimento em relação ao assunto investigado, às dificuldades em expressar uma necessidade de informação por meio de palavras-chave, à ambiguidade da linguagem e à composição inadequada de termos de busca. Com base neste panorama, o estudo desenvolvido nesta tese teve como objetivo agregar os recursos oferecidos pelas ontologias e pela hermenêutica às interfaces de busca, na tentativa de sugerir melhorias que pudessem minimizar os problemas observados. Neste sentido, foi possível propor um modelo de interface de busca e recuperação de informação baseado nos princípios da hermenêutica e na utilização de ontologias, com funcionalidades projetadas para proporcionar uma melhor interação do usuário com o sistema e facilitar a análise da similaridade existente entre os documentos e a interpretação de um corpus documental. A metodologia adotada para alcançar os objetivos propostos contou com pesquisa exploratória e aplicada, que ofereceu o aporte teórico necessário para a fundamentar o estudo e desenvolver o modelo proposto. Os resultados da avaliação de usabilidade realizada por meio dos protót... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Searching interfaces available in the context of the Web and digital repositories, despite their importance due to the increasing need to retrieve relevant and useful information, have had few significant changes in the last years regarding mainly the interaction mode with the user. In addition, they present numerous issues related mainly to the dependence of knowledge on the subject investigated, the difficulties in expressing a need of information through keywords, the language ambiguity and the search terms inappropriate composition. Based on this scenario, the study developed in this thesis aimed to aggregate the resources offered by the ontologies and the hermeneutics to the search interfaces, in an attempt to suggest improvements that could minimize the observed faults. In this regard, it was possible to propose a search and retrieval interface model based on the principles of hermeneutics and use of ontologies, with functionalities designed to provide more excellent user interaction with the system and facilitate the analysis of the similarity between documents and interpretation of a documentary corpus. The methodology adopted to achieve the proposed objectives counted on exploratory and applied research, which offered the theoretical contribution necessary to base the study and develop the proposed model. The usability evaluation results performed using the low fidelity prototypes indicated the viability of its implementation, as well as the projected functionalities... (Complete abstract click electronic access below) / Doutor
|
359 |
Aplicação de técnicas de visualização de informações em uma ferramenta de descoberta de conhecimentoRosas, Daniel Henrique Perucelli 09 July 2013 (has links)
Capes / Ferramentas de descoberta de conhecimento que usam a mineração de dados para extração de informações geram relatórios que são analisados e podem servir de base para a tomada de decisão. Mas, a percepção do conhecimento obtido pode ser comprometida caso os resultados fornecidos pelas ferramentas utilizem termos técnicos, linguagem de máquina ou o formato de exibição das informações seja inteligível. Por isso, técnicas que utilizam recursos gráficos para expor informações passam a ser importantes na descoberta de conhecimento podendo ser aplicadas aos resultados de modo a facilitar a compreensão da informação exposta. Este trabalho correlaciona o conhecimento fornecido pelas técnicas de mineração de dados com as características gráficas das técnicas de visualização de informações de modo que auxiliem na compreensão dos resultados fornecidos pelas ferramentas de descoberta de conhecimento. Apresenta também as técnicas de visualização de informações mais apropriadas para transmitir o conhecimento obtido além de exibir os protótipos das representações gráficas dos resultados gerados por técnicas e algoritmos de mineração da ferramenta Weka. A aplicação de recursos visuais visa simplificar a interpretação do conhecimento extraído e fortalecer a base de informações para tomada de decisão das organizações. / Tools for knowledge discovery using data mining to extract information generate reports that are reviewed and may serve as a basis for decision making. But the perception of knowledge gained can be compromised if the results provided by the tools using technical terms, machine language or the display format of the information to be intelligible. Therefore, techniques that use information to display graphics resources become important in knowledge discovery can be applied to the results in order to facilitate the understanding of the information displayed. This work correlates the knowledge provided by the techniques of data mining with graphic features of information visualization techniques in order to assist in the understanding of the results provided by the tools of knowledge discovery. It also presents information visualization techniques most appropriate to convey the knowledge gained in addition to displaying prototypes of graphical representations of the results generated by techniques and algorithms mining tool Weka. The use of visuals to simplify the interpretation of the extracted knowledge and strengthen the information base for decision-making organizations.
|
360 |
Padrão de comportamento na busca de informação em mecanismo de busca : um enfoque com a tecnologia de eye tracking /Rodas, Cecilio Merlotti. January 2017 (has links)
Orientador: Silvana Aparecida Borsetti Gregorio Vidotti / Banca: Beatriz Valadares cendrón / Banca: Silvana Drumond Monteiro / Banca: Fernando Luiz Vechiato / Banca: José Eduardo Santarém Segundo / Resumo: A quantidade de páginas disponibilizadas na Web atingiu um tamanho tão volumoso que se tornou mais difícil recuperar informações manualmente, necessitando-se de mecanismos que possam ajudar nesse processo. Nesse contexto, os mecanismos de busca se tornaram indispensáveis, sendo considerados um importante objeto de estudo, especialmente para a área da Ciência da Informação, porque diz respeito à organização e recuperação do conhecimento nesse ambiente. Tendo em vista a utilização do Google como um dos mecanismos de busca mais utilizados, tendo em vista ainda que, de acordo com estudos da Experiência do Usuário e da Semiótica, o ser humano é sensível às informações que lhe são apresentadas, propomos uma pesquisa a fim de investigar como e porque os novos elementos informacionais enriquecidos visualmente e apresentados nas páginas de resultados de mecanismos como o Google, por exemplo, poderiam influenciar o padrão de comportamento dos usuários ao realizar uma busca de informação. Esse estudo inova na área da Ciência da Informação no Brasil ao incorporar a Tecnologia de Eye Tracking a qual permite o rastreamento do olhar em testes com usuários. A investigação foi conduzida a partir do método quadripolar, o qual possibilitou trazer um certo dinamismo à pesquisa, o que foi relevante no desenvolvimento de nosso trabalho. A tecnologia de Eye Tracking registra os dois principais movimentos realizados pelos olhos, sendo eles as fixações e as sacadas, os quais podem criar condições par... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The number of pages available on the Web has reached such a massive size that it has become more difficult to retrieve information manually, and mechanisms are needed to help in this process. In this context, search engines have become indispensable, being considered an important object of study, especially for the area of Information Science, because they concerns the organization and retrieval of knowledge in this environment. Considering the use of Google as one of the most used search engines, and also considering that, according to studies of the User Experience and Semiotics, human being is sensitive to the information presented, we propose a research in order to investigate how and why the new informational elements enriched visually and presented in the result pages of mechanisms such as Google could influence the behavior pattern of users when performing an information search. This study innovates in the area of Information Science in Brazil by incorporating the Eye Tracking Technology, which allows the tracking of the look in tests with users. The research was conducted from the quadripolar method, which brought dynamism to the research and was relevant in the development of our work. The Eye Tracking technology records the two main movements performed by the eyes, the fixations and the saccades, which can create the conditions to find patterns of behavior. This technology enables a much more accurately data collection when compared to the traditional techniques used in User Experience studies, such as verbalization or direct or indirect observation. This advantage is due to the fact that a person's gaze happens naturally, without interference, and can reach the user's point of forgetting that his movements are being observed and recorded. Our results show that the visually enriched elements presented in ... (Complete abstract click electronic access below) / Doutor
|
Page generated in 0.0927 seconds