Atualmente, as redes sociais estão ganhando cada vez mais destaque no dia-a-dia das pessoas. Nessas redes são estabelecidos diferentes relacionamentos entre entidades que compartilham alguma característica ou objetivo em comum. Diversas informações sobre a produção científica nacional podem ser encontradas na Plataforma Lattes, que é um sistema utilizado para o registro dos currículos dos pesquisadores no Brasil. A partir dessas informações é possível construir uma rede social acadêmica, na qual as relações entre os pesquisadores representam uma parceria na produção de uma publicação (coautoria) - um link. Na análise de redes sociais existe uma linha de pesquisa conhecida como predição de link ou de relacionamentos, que tem como objetivo identificar relacionamentos futuros. Essa tarefa pode favorecer a comunicação entre os usuários e otimizar o processo de produção científica identificando possíveis colaboradores. Este projeto analisou a influência de diferentes atributos encontrados na literatura e filtros de dados para prever relações de coautoria nas redes sociais acadêmicas. Foi abordado dois tipos de problemas na predição de relacionamentos, o problema geral que analisa todos os possíveis relacionamentos de coautoria e o problema de novas coautoria que refere-se aos relacionamentos de coautorias inéditas na rede. Os resultados dos experimentos foram promissores para o problema geral de predição com a combinação de atributos e filtros utilizados. Contudo, para o problema de novas coautorias, devido à sua maior complexidade, os resultados não foram tão bons. Os experimentos apresentados avaliaram diferentes estratégias e analisaram o custo e benefício de cada uma. Conclui-se que para lidar com o problema de predição de coautorias em redes sociais acadêmicas é necessário analisar as vantagens e desvantagens entre as estratégias, encontrando um equilíbrio entre a revocação da classe positiva e a acurácia geral / Nowadays, social networks are gaining prominence in the day-to-day lives. In these networks, different relationships are established between entities that share some characteristic or common goal. A huge amount of information about the Brazilian national scientific production can be found in the Lattes Platform, which is a system used to record the curricula of researchers in Brazil. From this information, it is possible to build an academic social network, where relations between researchers represent a partnership in the production of a publication - a link. In social network analysis there is a research area known as link prediction, which aims to identify future relationships. This task may facilitate communication among researchers and optimize the scientific production process identifying possible collaborators. This project analyzed the influence of different attributes found in the literature and data filters to predict co-authorship relationships in academic social networks. Was approached two types of problems in predicting relationships, the general problem that analyzes all possible co-authoring relationships and the problem of new co-authoring that relates to novel co-authorships relationships in the network. The experimental results were promising to the prediction general problem, combining attributes and using filters. However, for the new co-authorships problem the results were not as good. The experiments evaluated different strategies and analyzed the costs and benefits of each. We concluded that to deal with the co-authorships prediction problem in academic social networking it is necessary to analyze the advantages and disadvantages among the strategies, finding a balance between the recall of the positive class and the overall accuracy
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-07052016-232625 |
Date | 28 March 2016 |
Creators | Maruyama, William Takahiro |
Contributors | Digiampietri, Luciano Antonio |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | English |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0028 seconds