A identificação de especialistas consiste na análise automática de informações sobre um conjunto de indivíduos para a localização daqueles com maior conhecimento em determinado tópico. Seus conhecimentos podem ser aplicados para a melhoria da produtividade em projetos de trabalho ou pesquisa e na localização de pesquisadores capacitados para avaliarem trabalhos de pesquisa ou para compor bancas de mestrado e doutorado. Para isso é interessante uma boa fonte de informações sobre os candidatos, de forma a otimizar o processo de identificação. No Brasil existe uma base de currículos que centraliza as informações sobre os pesquisadores brasileiros, a Plataforma Lattes. Os dados dessa plataforma são utilizados nesse trabalho para a realização da identificação de especialistas de acordo com suas áreas de atuação. São coletados dados da Plataforma e realizadas três etapas para compor uma lista ordenada dos principais especialistas de determinada área identificados pelo algoritmo proposto. A primeira etapa é a utilização da métrica TF-IDF, de modo que seus resultados são combinados com os estratos Qualis das publicações de cada autor, para finalmente ser aplicado um algoritmo de propagação para a geração da lista de especialistas. Após uma extensiva otimização dos parâmetros envolvidos no algoritmo, os resultados foram comparados com outra técnica existente que foi utilizada como base para esse projeto. Os resultados foram validados a partir de três conjuntos de pesquisadores coletados para esse projeto. O primeiro deles envolveu os pesquisadores contemplados com a Bolsa Produtividade em Pesquisa CNPq. Os resultados de dois questionários envolvendo pesquisadores das áreas de Inteligência Artificial e Nanotecnologia também foram utilizados. A partir dos resultados obtidos, foi possível notar que a técnica proposta aprimora significativamente os resultados do conjunto de Bolsistas Produtividade. Por outro lado, os resultados obtidos para os conjuntos de pesquisadores de Inteligência Artificial e Nanotecnologia foram ligeiramente melhores para a abordagem base. Os dados, algoritmos e resultados obtidos nesse trabalho poderão ser utilizados futuramente para aprimorar a identificação de especialistas / Expert finding consists in the automatic analysis of informations about a set of people with the objective of finding those with greater knowledge on a particular topic. His knowledge can be applied to improve the productivity in research and work projects and to locate researchers who are capable of evaluating research papers or for masters and doctoral degrees. For this objective it\'s interesting a good source of information about the candidates, in order to optimize the process of identification. In Brazil there\'s a curriculum base that centralizes the information about Brazilian researchers, the Lattes Plataform. It\'s data is used in this work to perform the expert finding according to the candidate\'s areas of activity. Data are collected from the Platform and three steps performed to generate a ordered list of the main specialists of a given area identified by the proposed algorithm. The first step is to use the TF-IDF metric, so that its results are combined with the Qualis strata from the publications of each author, to finally be applied a propagation algorithm for the generation of the specialists list. After an extensive optimization of the parameters involved in the algorithm, the results were compared with another technique that was used as the basis for this project. The results were validated from three sets of researchers collected for this project. The first one involved the researchers contemplated with the CNPq Productivity Grant. The results of two questionnaires involving researchers from the areas of Artificial Intelligence and Nanotechnology were also used. From the results obtained, it was noticeable that the proposed technique significantly improves the results of the Productivity Grant set. On the other hand, the results obtained for the Artificial Intelligence and Nanotechnology research groups were slightly better for the base approach. The data, algorithms and results obtained in this work may be used in the future to improve the expert finding
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-01112017-111709 |
Date | 12 September 2017 |
Creators | Lima, Jamison José da Silva |
Contributors | Digiampietri, Luciano Antonio |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | English |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.002 seconds