Spelling suggestions: "subject:"similaridade dde conteúdo"" "subject:"similaridade dde conteúdos""
1 |
ConPredict: Predição de Links em Redes de Coautoria Baseada em ConteúdoANTUNES, Jamilson Batista 18 June 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-11T12:26:42Z
No. of bitstreams: 2
DISSERTAÇAO JAMILSON ANTUNES.pdf: 1825865 bytes, checksum: 48aaec0f076229795f6ad7e8e7c46878 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T12:59:16Z (GMT) No. of bitstreams: 2
DISSERTAÇAO JAMILSON ANTUNES.pdf: 1825865 bytes, checksum: 48aaec0f076229795f6ad7e8e7c46878 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T12:59:16Z (GMT). No. of bitstreams: 2
DISSERTAÇAO JAMILSON ANTUNES.pdf: 1825865 bytes, checksum: 48aaec0f076229795f6ad7e8e7c46878 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-06-18 / A predição de relacionamentos (Link Prediction) é uma subárea da Mineração
de Links e uma das tarefas associadas à Análise de Redes Sociais. Seu objetivo é predizer
o surgimento de relacionamentos futuros entre os nós em uma rede social.
Este trabalho tem como foco a análise de redes de coautoria, que são um tipo
particular de rede de relacionamentos. Já foram propostos muitos métodos para lidar
com problemas de predição de links em redes de coautoria. A maioria deles consiste na
análise da estrutura da rede através do uso de alguma métrica. Assim, esses trabalhos
limitam-se a analisar a rede levando em consideração apenas sua topologia, sem
considerar a similaridade do conteúdo dos nós.
Este trabalho propõe a utilização de uma abordagem híbrida (baseada na
topologia da rede e a baseada em conteúdo) para predição de links em redes de
coautoria. O método proposto inicialmente analisa a estrutura da rede atual, e propõe
uma lista de links futuros (pares de autores candidatos a colaborarem no futuro) com
base na distância entre os nós da rede atual (análise baseada em padrões estruturais da
rede). Apenas nós com distância máxima de dois farão parte dessa lista. A seguir, o
método proposto calcula a similaridade de conteúdo de cada par de nós (links) nessa
lista inicial (análise baseada em similaridade de conteúdo). Apenas os pares de nós que
alcançarem o limiar de similaridade adotado (parametrizável) serão propostos como
links futuros. Aqui, a análise de similaridade de conteúdo leva em conta os títulos e
resumos dos trabalhos publicados por cada autor.
Basicamente, o método trabalha com três redes de coautorias: a rede inicial,
usada para predição de novos links (chamada nesse trabalho de rede de Coautoria A),
uma rede de validação (rede de Coautoria B) e a rede predita (rede de Coautoria C). Nos
experimentos realizados, as redes A e B foram extraídas a partir de um repositório de
publicações. A rede de Coautoria A (rede inicial) foi gerada a partir de um intervalo de
três anos de publicações cientificas, e a rede de Coautoria B (rede futura real)
considerava os três anos consecutivos. A rede de Coautoria C predita segundo o método
proposto foi comparada com a rede B, a fim de medirmos a performance do nosso
método. Os experimentos realizados com quatro sub-redes reais demonstraram que,
em geral, o método obteve desempenho satisfatório, tendo obtido melhor resultado
sem o uso de Stemming (método para redução de uma palavra ao seu radical,
removendo as desinências, afixos, e vogais temáticas) na fase de processamento do
conteúdo textual de cada nó da rede.
|
Page generated in 0.0898 seconds