Global ETD Search

341	Impacto do fator emocional quando da recuperação de informação da home page do Departamento de Doenças Sexualmente Transmissíveis, AIDS e Hepatites Virais da Secretaria de Vigilância em Saúde do Ministério da Saúde/ Souza, Flavia Moreno Alves de 15 February 2016 (has links) Dissertação (mestrado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2016. / Discute a relevância do fator emocional na recuperação de informação. Discorre sobre a necessidade de disponibilização de informações com valor agregado que atendam às necessidades informacionais do usuário e satisfaçam as suas expectativas. Objetiva identificar o impacto do fator emocional no usuário quando da recuperação de informação da home page do Departamento de Doenças Sexualmente Transmissíveis, Aids e Hepatites Virais da Secretaria de Vigilância em Saúde do Ministério da Saúde. Trata-se de pesquisa qualitativa e exploratória, cujo método utiliza estudo de caso. A análise dos dados mostra que diante da interface, o estado emocional de 56,92% é negativo e de 43,08% positivo; para 85,71% o estado emocional interfere na busca e recuperação da informação; para 14,28% não interfere. Conclui que a dimensão emocional é fator decisivo na recuperação de informação de saúde dos usuários desta home page e há necessidade de aprimoramento da interface, baseado nos princípios do design emocional centrado no usuário para que esta desperte sensações positivas, pois esta é uma das principais ferramentas de orientação na prevenção e no tratamento da epidemia de Aids no país. / Discusses the importance of the emotional factor in information retrieval. Discusses the need of providing value-added information that meet user information needs and meet their expectations. Aims to identify the impact of the emotional factor in the user when retrieving information from the home page of the Department of Sexually Transmitted Diseases, AIDS and Viral Hepatitis Surveillance Secretariat of Health Ministry of Health. It is a qualitative and exploratory research, whose method uses case study. Data analysis shows that on the interface, the emotional state of 56.92% of users is negative and 43.08% positive. For 85.71% of the users, the emotional state interferes in the search and retrieval of information; to 14.28% it does not interfere. It concludes that the emotional dimension is a key factor in the health information retrieval from users of this web page and that there is a need for improving the design of the interface, based on the principles of emotional user-centered design to arouse positive feelings as this one of the main orientation tool, in the prevention and treatment of AIDS epidemic in the country. Recuperação da informação Estudo de usuários Interação homem-máquina Informação em saúde Doenças sexualmente transmissíveis HIV (Vírus)
342	Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes Araújo, Charles Henrique de January 2016 (has links) A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq. / Information retrieval in large databases need increasingly more efficient ways for accomplishing this task. There are many problems, like spelling, language, synonym, acronyms, lack of standardization of terms, both in the search arguments, as in the indexing of documents. They directly interfere in the results. Thus, this study aimed to evaluate the impact of the addition of structured vocabularies of Health Sciences area in Lattes Database, in the recovery of similar profiles of researchers that work in Biological Sciences and Health Sciences, using Query Expansion, Data Mining procedures, Vector Models and Trigram Phrase Matching algorithm. Crosschecking keywords of articles registered in Lattes Database and Medical Subject Headings (MeSH) and Health Sciences Descriptors (DeCS) terms, as well as comparisons between the results of queries using the original keywords and adding them to query expansion terms. The results show that the methodology used in this study can qualitatively increase the set of recovered profiles, contributing to the improvement of CNPq Information Systems. Vocabulário controlado Sistemas de recomendação Recuperação da informação Ciências da saúde Query expansion Data mining Recommendation systems
343	Vocabulário de termos livres e controlados para a coleção de teses e dissertações da Universidade Federal de Viçosa Silva, Bruna 23 September 2015 (has links) Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-23T18:18:16Z No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) / Approved for entry into archive by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-23T18:18:28Z (GMT) No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) / Approved for entry into archive by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-23T18:18:39Z (GMT) No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) / Made available in DSpace on 2018-04-23T18:18:48Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1781710 bytes, checksum: 9b5110b09543b769de1303f4e280f17b (MD5) Previous issue date: 2015-09-23 / O presente trabalho tem como objetivo a construção de um vocabulário controlado para a Pós-Graduação da Universidade Federal de Viçosa, com intuito de adequar a linguagem utilizada no processo de indexação à linguagem utilizada pelos pesquisadores, e assim, descrever com propriedade temática as teses e dissertações. Discorre sobre a Teoria Geral da Terminologia e Teoria do Conceito, Princípios para Validação de Termos, Catálogo On-line e Sistemas de Recuperação da Informação e Linguagens Documentárias. Apresenta como foco de estudo o vocabulário controlado e sua metodologia de construção. Destaca as etapas percorridas no planejamento, construção e manutenção. Pressupõe que com a construção do vocabulário controlado com os termos escolhidos pelos pesquisadores, atendendo às garantias de uso, literária, cultural e organizacional, o processo de recuperação da informação no catálogo on-line da biblioteca ocorra com mais precisão. / This research aims at the construction of a controlled vocabulary for Postgraduate of Universidade Federal de Viçosa, with the purpose to adapt the language used in the process of indexing with the language used by the researchers, and thus describe themed property the theses and dissertations. Talks about the General Theory of Terminology and Theory of Concept, Principles Terms Validation, Online Catalog and Information Retrieval System and Documentary Languages. It presents as a study focused on the controlled vocabulary and construction methodology, outlines the steps taken in the planning, construction and maintenance. Presupposes that the construction of controlled vocabulary with the terms chosen by the researchers, taking into account the warrant of use, literary, cultural and organizational, the information retrieval process in the library catalog to occur more accurately. / Não foi localizado o cpf do autor. O autor não apresentou título em inglês. Tesauros Universidade Federal de Viçosa Indexação Ciências Sociais Aplicadas
344	Análise da representação da informação das teses e dissertações dos programas de pós-graduação em zootecnia das Universidades Federais do Estado de Minas Gerais Alves, Renata de Fátima 17 February 2017 (has links) Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-24T13:22:51Z No. of bitstreams: 1 texto completo.pdf: 4741539 bytes, checksum: 89d91ec18700de20ee804794bd263054 (MD5) / Approved for entry into archive by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-24T13:23:03Z (GMT) No. of bitstreams: 1 texto completo.pdf: 4741539 bytes, checksum: 89d91ec18700de20ee804794bd263054 (MD5) / Approved for entry into archive by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-24T13:23:13Z (GMT) No. of bitstreams: 1 texto completo.pdf: 4741539 bytes, checksum: 89d91ec18700de20ee804794bd263054 (MD5) / Made available in DSpace on 2018-04-24T13:23:22Z (GMT). No. of bitstreams: 1 texto completo.pdf: 4741539 bytes, checksum: 89d91ec18700de20ee804794bd263054 (MD5) Previous issue date: 2017-02-17 / Analisa a representação para a recuperação da informação de 351 teses e dissertações dos anos de 2014, 2013 e 2012 depositadas nas Bibliotecas Digitais de Teses e Dissertações dos Programas de Pós-Graduação em Zootecnia das Universidades Federais de Minas Gerais (UFMG), Viçosa (UFV) e Lavras (UFLA). Trata-se de um estudo exploratório e descritivo. Os objetivos constituíram-se em identificar os termos de maior ocorrência atribuídos às teses e dissertações, analisar se os termos utilizados para a representação da informação das teses e dissertações seguiram o uso padrão de alguma linguagem documentária e verificar a relevância na recuperação da informação nas bibliotecas digitais. Utilizou-se como linguagem documentária o Thesagro, tesauro especializado em literatura agrícola. Apresenta-se e descreve-se o funcionamento dos mecanismos de busca das bibliotecas digitais, que utilizam o software DSpace. Foram coletados 1258 termos no total. Desses 1258, 711 são termos não duplicados. Os termos semelhantes aos do Thesagro tiveram um total de 46% na UFLA, 47% na UFMG e 39% na UFV. Por meio da análise realizada, verificou-se que a atribuição de termos para a representação da informação nas bibliotecas digitais não segue o uso padrão de linguagem documentária. O desempenho na recuperação da informação da linguagem documentária e da linguagem livre obteve os seguintes resultados, respectivamente: UFLA 82% e 68%, UFMG 54% e 86%, UFV 82% e 56%. Conclui-se que não se pode descartar totalmente o uso concomitante da linguagem documentária e da linguagem livre, uma vez que ambas tiveram um desempenho satisfatório, alcançando mais de 50% de recuperação nas três bibliotecas avaliadas. Sendo assim, este estudo procurou refletir sobre a melhoria da organização e representação da informação para a recuperação dos documentos depositados nas Bibliotecas Digitais de Teses e Dissertações, visando contribuir para uma maior eficiência na recuperação da informação. / Analyzes the representation for the information retrieval of 351 theses and dissertations from the years 2014, 2013 and 2012 deposited in the Digital Libraries of Theses and Dissertations of the Graduate Programs in Zootechnics of the Federal Universities of Minas Gerais (UFMG), Viçosa (UFV) And Lavras (UFLA). This is an exploratory and descriptive study. The objectives were to identify the terms of greatest occurrence attributed to theses and dissertations, to analyze if the terms used to represent the information of theses and dissertations followed the standard use of some documentary language and verify the relevance in the retrieval of information in libraries Digital images. Thesagro, a thesaurus specialized in agricultural literature, was used as documentary language. It presents and describes the operation of the search engines of digital libraries, which use DSpace software. A total of 1258 terms were collected. Of these 1258, 711 are terms not duplicates. The terms similar to those of Thesagro had a total of 46% in UFLA, 47% in UFMG and 39% in UFV. Through the analysis, it was verified that the assignment of terms for the representation of information in digital libraries does not follow the standard use of documentary language. The performance in the retrieval of information from the documentary language and the free language obtained the following results, respectively: UFLA 82% and 68%, UFMG 54% and 86%, UFV 82% and 56%. It is concluded that the concomitant use of documentary language and free language cannot be completely ruled out, since both had a satisfactory performance, reaching more than 50% of recovery in the three libraries evaluated. Thus, this study sought to reflect on the improvement of the organization and representation of information for the retrieval of documents deposited in the Digital Libraries of Theses and Dissertations, aiming to contribute to a greater efficiency in the information retrieval. / Não foi localizado o cpf do autor. O autor não apresentou título em inglês. Representação da informação Recuperação da informação Bibliotecas Digitais Repositórios institucionais Ciências Sociais Aplicadas
345	Contribuição para a terminologia do processo de inteligência competitiva : estudo teórico e metodologico / Cervantes, Brígida Maria Nogueira. January 2004 (has links) Resumo: Apresenta estudo teórico e metodológico da Linguagem documentária e de sua interface com a terminologia. Explicita as etapas necessárias para o desenvolvimento da pesquisa terminológica temática. Considera a aplicabilidade da metodologia de protocolo verbal "pensar alto" como instrumento, que pode ser usado no processo de confirmação de termos de uma área especializada. Considera para esse estudo o levantamento de termos, diretamente, coletados na teoria científica e técnica. Utiliza para o trabalho terminológico os textos científicos e técnicos que tratam do subdomínio: Processo de inteligência competitiva,, publicados em artigos de periódicos e de eventos entre os anos de 1999 e 2002. Formula, por meio de estudo de caso com três sujeitos: o indexador de um sistema de informação, o pesquisador e o profissional do subdomínio, uma proposta de metodologia para a construção de linguagem documentária, no que tange aos processos de identificação e confirmação de termos, que atue como instrumento de mediação entre o sistema de informação e o usuário. / Abstract: It presents a theoretical and methodological study on documentary language and its interface with terminology. Exposes the stages that are necessary for developing a thematic terminological research. It considers the applicability of the verbal protocol"think aloud" methodology as instrument that can be used in the prodess of confirmationof terms of a specialized area. This study considered terms collected directly in the scientific and technicalliterature. The terminological work used scientific and technical texts (papers) on the sub domain of competitive intelligence process, published in journals and proceedings among the years of 1999-2002. Using a case study methodology with three individuals: the information system indexer, the researcher and the professional of thesub domain, it proposes a methodology for the documentary language construction, focussing the process ofidentification and confirmation of terms, in order to serve as a mediation instrument between the information system and the user. / Orientador: João Batista Ernesto de Moraes / Coorientador: Mariângela Spotti Lopes Fujita / Banca: Marilda Lopes Ginez de Lara / Banca: Maria Lígia Pomim Valentim / Mestre Linguagem documentária. Tesauros. Documentary language. eng Terminology. eng Terminological research. eng
346	Arquitetura da informação para biblioteca digital personalizável / Camargo, Liriane Soares de Araújo de. January 2004 (has links) Orientador: Silvana Aparecida Borsetti Gregorio Vidotti / Banca: Plácida Leopoldina Ventura Amorin da Costa Santos / Banca: Edberto Ferneda / Resumo: A recuperação e disseminação de informações no ambiente Web são dificuldades que existem atualmente, pois podem estar de forma desestruturada e desorganizada segundo um padrão aceito na área de organização, armazenamento e recuperação da informação. Alguns recursos que podem minimizar essas dificuldades são tanto bibliotecas digitais, que possuem acesso simultâneo e remoto às informações de forma eficiente, quanto serviço de personalização, que permite ao usuário uma interação personalizada baseada no seu perfil. O problema de prover esses recursos se encontra na onerosidade e dificuldade do processo de desenvolvimento desse tipo de biblioteca devido à grande quantidade de processos e elementos envolvidos em sua construção. Nesse contexto é proposta uma arquitetura da informação para bibliotecas digitais personalizáveis, que visa tratar dos seguintes problemas: escassez de literatura especializada sobre arquitetura da informação para bibliotecas digitais; falta de elementos tecnológicos e informacionais que possibilitem um acesso rápido e preciso à informação requerida; e pouca utilização de serviços de personalização de conteúdo e de interface para diversos tipos de usuários. Essa arquitetura é constituída de processos e elementos oriundos da área de Ciência da Informação e Ciência da Computação que são compartilhados pela maioria das bibliotecas digitais. Além disso, essa arquitetura contém elementos genéricos, que permitem flexibilidade para serem adaptados e modificados de acordo com as características de cada biblioteca digital. O objetivo da arquitetura proposta é auxiliar o desenvolvedor/projetista na construção de WebSites, principalmente em bibliotecas digitais personalizáveis de forma a satisfazer as necessidades dos usuários. Foi realizada uma análise dos processos e elementos que são mais utilizados e comuns a esse...(Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The recovery and dissemination of unstructured information of the Web environment are difficulties existing nowadays. Some resources which can minimize these difficulties are as digital libraries, which can have simultaneous and remote access to information in an efficient way, as personalization services, which provide a user personalized interaction based on its profile. The problem in providing such resources is the difficulty in developing digital libraries because of the number of elements and processes involved in its building. In this context, is proposed a information architecture for customizable digital libraries, which aims deals with the following problems: lack of specialized literature on information architectures for digital libraries; lack of technological elements and elements of information which allow a fast and accurate access to required information; and the lack of personalization services of content and interface for different kinds of users. This architecture is composed by processes and elements, from Information Science and Computer Science fields, that are share by most of digital libraries. Besides, this architecture contains generic elements, which allow flexibility to be adapted and modified according to the characteristics of each digital library. The aim of the proposed architecture is to help the developer in building Web sites and customizable digital libraries as well. To supplement the project, it was performed an evaluation of the processes and elements more used and common in this type of information unit, in this case: digital libraries. The results of this evaluation showed that the majority of the elements are used by digital libraries and are relevant to its build. This study is a descriptive research with theoretical and methodological approach of the Information Science field, performed by means of a study of bibliographical data... (Complete abstract, access undermentioned eletronic address) / Mestre Tecnologia da informação. Redes de informação. Bibliotecas digitais. Information Architecture. eng Digital Library. eng
347	Usabilidade na recuperação da informação : um enfoque no catálogo Athena / Banhos, Vângela Tatiana Madalena. January 2008 (has links) Orientador: Edberto Ferneda / Banca: Silvana Aparecida Borsetti Gregório Vidotti / Banca: Guilherme Ataíde Dias / Resumo: A pesquisa realiza um estudo acerca de um catálogo específico, o Athena, considerado um sistema de recuperação de informação estruturado e organizado. Nesse ambiente se tem como objetivo avaliar um conjunto de diretrizes de usabilidade e aplicá-las em sistemas de recuperação de informação na Web, levando em consideração aspectos relativos não só à usabilidade de sua interface, mas também à sua eficiência no processo de recuperação. O estudo se caracteriza como exploratório e descritivo-analítico. Para tanto, procurou-se inicialmente revisar a literatura nacional e internacional sobre recuperação de informação e usabilidade, em várias fontes informacionais, impressas e eletrônicas, como embasamento teórico do trabalho. Em segunda etapa, foi realizada uma análise heurística, e por último foram realizados testes de usabilidade com usuários em que se aplicaram dois procedimentos: um questionário semi-estruturado e um instrumento de observação. Após as análises quantitativa e qualitativa dos dados, o teste com os usuários possibilitou verificar o modo como eles interagem com a interface do Catálogo Athena e as formas de busca que costumam realizar em outras ferramentas disponíveis na Web. Também foi possível validar alguns apontamentos feitos na análise heurística, pois a maioria dos participantes da pesquisa revelou não ter qualquer experiência na utilização do Catálogo Athena. Verifica-se, nesta pesquisa, a importância de se aplicar os testes com usuários em ambientes de recuperação de informação, considerando-os como parte fundamental no desenvolvimento de qualquer sistema. / Abstract: The research conducts a study about a specific catalog, the Athena, considered a system of retrieval of information structured and organized. In this environment you have to evaluate a set of guidelines for usability and apply them in systems for retrieval of information on the Web, taking into account aspects relating not only to the usability of its interface, but also its efficiency in the recovery process. The study is characterized as exploratory and descriptive and analytical. Thus, it was initially to review the national and international literature on recovery of information and usability in various informational sources, printed and electronic, as the theoretical work. In the second stage, was a heuristic analysis, and finally usability tests were carried out with users that were applied in two procedures: a semi-structured questionnaire and an instrument of observation. After the analysis of quantitative and qualitative data, the test allows users to determine how they interact with the interface of the Athena Catalog and the forms of search that usually take place in other tools available on the Web was also possible to validate some notes made in heuristic analysis, because the majority of the research has shown to have no experience in the use of Athena Catalog. This research shows the importance of applying the tests with users in environments of retrieval of information, considering them a vital part in the development of any system. / Mestre Recuperação da informação. Catálogos de bibliotecas online. Tecnologia da informação. Usability Guidelines. eng Information retrieval. eng Athena Catalog. eng
348	Análise de métodos de produção de interfaces visuais para recuperação da informação / Xavier, Raphael Figueiredo. January 2009 (has links) Orientador: Edberto Ferneda / Banca: Guilherme de Ataíde Dias / Banca: Silvana Aparecida Borseti Gregório Vidotti / Resumo: O advento da Web e o conseqüente aumento no volume de informações eletrônicas acarretaram muitos problemas em relação ao acesso, busca, localização e recuperação de informação em grandes volumes de dados. O presente trabalho realiza uma revisão dos diferentes modelos, métodos e algoritmos existentes para a geração de Interfaces Visuais para Recuperação da Informação, classificados segundo ao seu processo de produção: Análise e Transformação dos Dados, Aplicação de Algoritmos de Classificação e Distribuição Visual e Aplicação de Técnicas de Transformação Visual. Os resultados pretendem servir a outros investigadores como ferramenta para a eleição de uma ou outra combinação metodológica no desenvolvimento de propostas específicas de Interfaces Visuais para Recuperação da Informação, além de sugerir a necessidade de maiores investigações sobre novas técnicas de transformação visual. / Abstract: The advent of the Web and the consequent increase in the volume of electronic information had caused many problems about access, search, location and retrieval of information in large volumes of data. This work is a revision of the different models, methods and algorithms to create interfaces for Visual Information Retrieval, classified according to their production process: Analysis and Data Processing, Implementation of algorithms for classification and distribution of Visual and Application Processing Techniques of Visual. The results of other researchers want to serve as a tool for the election of one or another combination methodology in the development of specific proposals for visual interfaces for information retrieval, and suggest the need for more research into new techniques for processing visual. / Mestre Recuperação da informação. Interfaces (Computadores) Information Retrieval. eng Information Visualization. eng
349	Learning to rank para busca em Comércio Eletrônico Fonseca, Roberto Cidade, (095)991366353 28 August 2018 (has links) Submitted by Roberto Fonseca (rcf2@icomp.ufam.edu.br) on 2018-11-18T00:36:14Z No. of bitstreams: 2 rcidadef-final-dissertacao-mestrado.pdf: 998750 bytes, checksum: 1738deb5326e881be7192f444ccedb86 (MD5) 315 ATA de Defesa - Roberto Cidade (Assinada).pdf: 531920 bytes, checksum: 51157459356b7ee8be9be278b4579378 (MD5) / Approved for entry into archive by Secretaria PPGI (secretariappgi@icomp.ufam.edu.br) on 2018-11-19T17:31:42Z (GMT) No. of bitstreams: 2 rcidadef-final-dissertacao-mestrado.pdf: 998750 bytes, checksum: 1738deb5326e881be7192f444ccedb86 (MD5) 315 ATA de Defesa - Roberto Cidade (Assinada).pdf: 531920 bytes, checksum: 51157459356b7ee8be9be278b4579378 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-11-19T19:46:24Z (GMT) No. of bitstreams: 2 rcidadef-final-dissertacao-mestrado.pdf: 998750 bytes, checksum: 1738deb5326e881be7192f444ccedb86 (MD5) 315 ATA de Defesa - Roberto Cidade (Assinada).pdf: 531920 bytes, checksum: 51157459356b7ee8be9be278b4579378 (MD5) / Made available in DSpace on 2018-11-19T19:46:24Z (GMT). No. of bitstreams: 2 rcidadef-final-dissertacao-mestrado.pdf: 998750 bytes, checksum: 1738deb5326e881be7192f444ccedb86 (MD5) 315 ATA de Defesa - Roberto Cidade (Assinada).pdf: 531920 bytes, checksum: 51157459356b7ee8be9be278b4579378 (MD5) Previous issue date: 2018-08-28 / Machine learning (ML) based ranking functions generating methods have been broadly used on web search systems, such as the utilized by Google and Bing. Nonetheless, such methods have not been employed or studied in other contexts. It is the case, to cite an example, of electronic commerce (e-commerce), on which the user interaction with virtual stores produces data as: when an user landed on a page for the first time, queries submitted, products clicked and what she bought. In this work, we propose to leverage ML to learn ranking functions for the e-commerce context. We studied alternatives to estimate the relevance of a result for a given query and deployed experiments using data mined from e-commerce shops. We ran experiments in setups we denominated offline, where a dataset was created the traditional way by separating it in three subsets of training, validation and test, as well as in setups we denominated online, where distinct versions of the system were deployed to shops facing users in a real purchase situation. We present in the study our conclusions regarding the performed experiments. / Métodos que geram funções de ordenação de resultados baseadas em aprendizagem de máquina têm sido amplamente utilizados em sistemas de busca para a web, como as utilizadas em motores de busca como o Google e Bing. No entanto, esses recursos não têm sido muito empregados ou estudados em outros contextos. É o caso, por exemplo, do comércio eletrônico, no qual, a interação de usuários com lojas virtuais produz dados como: quando um usuário acessou a página de uma loja pela primeira vez, que consultas realizou, quais produtos clicou, e o que comprou. Neste trabalho, propomos a utilização de métodos de aprendizagem de máquina para aprender funções de ordenação de resultados no contexto de comércio eletrônico. Estudamos formas alternativas de estimar a relevância de um resultado para uma dada consulta e realizamos experimentos utilizando dados extraídos de lojas de comércio eletrônico. Realizamos experimentos tanto com ambientes que denominamos offline, onde uma base de dados é montada com a abordagem tradicional de separa-la em treino, validação e teste, quanto em ambientes que denominamos online, onde pusemos versões distintas dos sistemas para funcionar em lojas com usuários em situações reais de compra. Apresentamos no estudo nossas conclusões a respeito dos experimentos realizados. / Formulário longo, com várias fases e páginas. Learning to Rank Machine Learning Recuperação de Informação Comércio Eletrônico Teste A/B CIÊNCIAS EXATAS E DA TERRA
350	Recuperação de documentos e pessoas em ambientes empresariais através de árvores de decisão. / Documents and people retrieval in enterprises using decision tree. Fabrício Jailson Barth 29 May 2009 (has links) Este trabalho avalia o desempenho do uso de árvores de decisão como função de ordenação para documentos e pessoas em ambientes empresariais. Para tanto, identificouse atributos relevantes das entidades a serem recuperadas a partir da análise de: (i) dinâmica de produção e consumo de informações em um ambiente empresarial; (ii) algoritmos existentes na literatura para a recuperação de documentos e pessoas; e (iii) conceitos utilizados em funções de ordenação para domínios genéricos. Montou-se um ambiente de avaliação, utilizando a coleção de referência CERC, para avaliar a aplicabilidade do algoritmo C4.5 na obtenção de funções de ordenação para o domínio empresarial. O uso do algoritmo C4.5 para a construção de funções de ordenação mostrou-se parcialmente efetivo. Para a tarefa de recuperação de documentos não trouxe resultados bons. Porém, constatou-se que é possível controlar a forma de construção da função de ordenação a fim de otimizar a precisão nas primeiras posições do ranking ou otimizar a média das precisões (MAP). Para a tarefa de recuperação de pessoas o algoritmo C4.5 obteve uma árvore de decisão que consegue resultados melhores que todas as outras funções de ordenação avaliadas. OMAP obtido pela árvore de decisão foi 0, 83, enquanto que a média do MAP das outras funções de ordenação foi de 0, 74. Percebeu-se que a árvore de decisão utilizada para representar a função de ordenação contribui para a compreensão da composição dos diversos atributos utilizados na caracterização dos documentos e pessoas. A partir da análise da árvore de decisão utilizada como função de ordenação para pessoas foi possível entender que uma pessoa é considerada especialista em algum tópico se ela aparecer em muitos documentos, aparecer muitas vezes nos documentos e os documentos onde aparece têm uma relevância alta para a consulta. / This work evaluates the performance of using decision trees as ranking functions for documents and people in enterprises. It was identified relevant attributes of the entities to be retrieved from the analysis of: (i) the production and consumption of information behavior in an enterprise, (ii) algorithms for documents and people retrieval at literature, and (iii) the concepts used in ranking functions for generic domains. It was set up an evaluation environment, using the CERC collection, to evaluate the applicability of the C4.5 algorithm to obtain a ranking function for the enterprise domain. The use of C4.5 algorithm for the construction of ranking function was proved to be partially effective. In the case of documents retrieval the C4.5 has not found good results. However, it was found that is possible to control the way of building the ranking function in order to optimize the precision in the first positions of the ranking or optimize the mean average precision (MAP). For the task of people retrieval the C4.5 algorithm developed a ranking function that obtain better results than all other ranking functions assessed. The value of MAP obtained by decision tree was 0, 83, while the average MAP of other ranking functions was 0, 74. The decision tree used to represent the ranking function contributes to understanding the attributes composition used in the characterization of documents and people. Through the analysis of the decision tree used as ranking function for people, we could realise that a person is considered expert in any topic if he/she appear in many documents, appear many times in same documents and documents where he/she appears have a high relevance to the query. Aprendizado computacional Gestão da informação Recuperação da informação Information management Information retrieval Learning to rank Machine learning

Search results