Spelling suggestions: "subject:"análise dde links"" "subject:"análise dee links""
1 |
SAAL - um sistema para Armazenammento e Análise de Links da WebCoelho, Roberta de Souza January 2003 (has links)
Made available in DSpace on 2014-06-12T15:59:07Z (GMT). No. of bitstreams: 2
arquivo4842_1.pdf: 796872 bytes, checksum: f32f019baff437f9e947861f8bfdf618 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2003 / O aumento do número de documentos disponíveis na World Wide Web (WWW)
traz uma série de novos desafios para a área de Recuperação de Informação (RI). As
páginas Web divergem em conteúdo e qualidade além de possuírem uma alta dinâmica.
Em adição a estes desafios os engenho de busca estão constantemente lidando com
usuários inexperientes e com páginas Web construídas com o intuito de manipular as
funções de ranking dos engenhos de busca.
Estudos recentes têm mostrado que a performance dos engenhos de busca está
longe da ideal. Apesar das evoluções tecnológicas, conseguidas até o momento,
permitirem a coleta e o armazenamento de um número cada vez maior de páginas nas
bases de índices dos engenhos de busca, a maioria destes sistemas enfrenta vários
problemas no momento de classificar as páginas de acordo com a necessidade do
usuário, em outras palavras, retornar para o usuário a informação que ele necessita.
A maioria dos engenhos de busca analisa as páginas Web como um documento
texto simples, não levando em consideração a estrutura na qual a página Web está
inserida. Diferentemente das coleções de documentos flat , a WWW corresponde a
uma coleção de documentos hipertexto que possuem informações auxiliares que vão
além do conteúdo textual, tais como a estrutura dos hiperlinks e o texto dos hiperlinks.
Estas informações são chamadas de informações hiper , que em conjunto com as
informações texto compõem o conjunto de informações que caracteriza uma página
Web.
A inadequação de estratégias singulares no processo de recuperação de
informações no ambiente Web constitui-se em um forte argumento para mostrar que as
técnicas recuperação de informação tradicionais não são suficientes no momento de
encontrar informações relevantes na Web.
Este trabalho propõe a utilização da estrutura de links da Web com o objetivo de
produzir um peso de importância global para cada página Web indexada por um
engenho de busca. Este peso, chamado peso de autoridade , é integrado aos engenhos
de busca, mais especificamente a função de ranking dos engenhos de busca que passa a
utilizar estes pesos juntamente com pesos de similaridade textual, com o objetivo de
melhorar a eficácia de recuperação do sistemaPara calcular o peso de autoridade para cada página Web foi elaborado um
algoritmo de análise de links, o Global Hybrid Hyperlinked Inducted Topic Search
(GHHITS) que foi concebido a partir do estudo dos algoritmos de análise de links préexistentes.
Para validar o algoritmo em questão foi implementado o SAAL - Sistema para
Armazenamento e Análise de Links - que propõe uma maneira eficiente de armazenar a
estrutura de links da Web, e executar o algoritmo proposto sobre esta estrutura.
Por fim, são apresentados os resultados obtidos durante os testes que avaliaram a
eficácia de recuperação de estratégias de busca que utilizaram o peso de autoridade como
componente da função de ranking.
Neste trabalho é mostrado, portanto, como as informações estruturais podem ser
utilizadas de forma a melhorar a qualidade da resposta retornada por um engenho de
busca
|
2 |
Métricas de análise de links e qualidade de conteúdo: um estudo de caso na Wikipédia / Link analysis metrics and content quality: a case of study in WikipediaHanada, Raíza Tamae Sarkis 26 February 2013 (has links)
Muitos links entre páginas na Web podem ser vistos como indicadores de qualidade e importância para as páginas que eles apontam. A partir desta ideia, vários estudos propuseram métricas baseadas na estrutura de links para inferir qualidade de conteúdo em páginas da web. Contudo, até onde sabemos, o único trabalho que examinou a correlação entre tais métricas e qualidade de conteúdo consistiu de um estudo limitado que deixou várias questões em aberto. Embora tais métricas sejam muito bem sucedidas na tarefa de ranquear páginas que foram fornecidas como respostas para consultas submetidas para máquinas de busca, não é possível determinar a contribuição específica de fatores como qualidade, popularidade e importância para os resultados. Esta dificuldade se deve em parte ao fato de que a informação sobre qualidade, popularidade e importância é difícil de obter para páginas da web em geral. Ao contrário de páginas da web, estas informações podem ser obtidas para artigos da Wikipédia, uma vez que qualidade e importância são avaliadas por especialistas humanos, enquanto a popularidade pode ser estimada com base nas visualizações dos artigos. Isso torna possível a verificação da relação existente entre estes fatores e métricas de análise de links, nosso objetivo neste trabalho. Para fazer isto, nós implementamos vários algoritmos de análise de links e comparamos os rankings obtidos com eles com os obtidos considerando a avaliação humana feita na Wikipédia com relação aos fatores qualidade, popularidade e importância. Nós observamos que métricas de análise de links são mais relacionadas com qualidade e popularidade que com importância e a correlação é moderada / Many links between Web pages can be viewed as indicative of the quality and importance of the pages pointed to. Accordingly, several studies have proposed metrics based on links to infer web page content quality. However, as far as we know, the only work that has examined the correlation between such metrics and content quality consisted of a limited study that left many open questions. In spite of these metrics having been shown successful in the task of ranking pages which were provided as answers to queries submitted to search machines, it is not possible to determine the specific contribution of factors such as quality, popularity, and importance to the results. This difficulty is partially due to the fact that such information is hard to obtain for Web pages in general. Unlike ordinary Web pages, the content quality of Wikipedia articles is evaluated by human experts, which makes it feasible to verify the relation between such link analysis metrics and the quality of Wikipedia articles, our goal in this work. To accomplish that, we implemented several link analysis algorithms and compared their resulting rankings with the ones created by human evaluators regarding factors such as quality, popularity and importance. We found that the metrics are more correlated to quality and popularity than to importance, and the correlation is moderate
|
3 |
Métricas de análise de links e qualidade de conteúdo: um estudo de caso na Wikipédia / Link analysis metrics and content quality: a case of study in WikipediaRaíza Tamae Sarkis Hanada 26 February 2013 (has links)
Muitos links entre páginas na Web podem ser vistos como indicadores de qualidade e importância para as páginas que eles apontam. A partir desta ideia, vários estudos propuseram métricas baseadas na estrutura de links para inferir qualidade de conteúdo em páginas da web. Contudo, até onde sabemos, o único trabalho que examinou a correlação entre tais métricas e qualidade de conteúdo consistiu de um estudo limitado que deixou várias questões em aberto. Embora tais métricas sejam muito bem sucedidas na tarefa de ranquear páginas que foram fornecidas como respostas para consultas submetidas para máquinas de busca, não é possível determinar a contribuição específica de fatores como qualidade, popularidade e importância para os resultados. Esta dificuldade se deve em parte ao fato de que a informação sobre qualidade, popularidade e importância é difícil de obter para páginas da web em geral. Ao contrário de páginas da web, estas informações podem ser obtidas para artigos da Wikipédia, uma vez que qualidade e importância são avaliadas por especialistas humanos, enquanto a popularidade pode ser estimada com base nas visualizações dos artigos. Isso torna possível a verificação da relação existente entre estes fatores e métricas de análise de links, nosso objetivo neste trabalho. Para fazer isto, nós implementamos vários algoritmos de análise de links e comparamos os rankings obtidos com eles com os obtidos considerando a avaliação humana feita na Wikipédia com relação aos fatores qualidade, popularidade e importância. Nós observamos que métricas de análise de links são mais relacionadas com qualidade e popularidade que com importância e a correlação é moderada / Many links between Web pages can be viewed as indicative of the quality and importance of the pages pointed to. Accordingly, several studies have proposed metrics based on links to infer web page content quality. However, as far as we know, the only work that has examined the correlation between such metrics and content quality consisted of a limited study that left many open questions. In spite of these metrics having been shown successful in the task of ranking pages which were provided as answers to queries submitted to search machines, it is not possible to determine the specific contribution of factors such as quality, popularity, and importance to the results. This difficulty is partially due to the fact that such information is hard to obtain for Web pages in general. Unlike ordinary Web pages, the content quality of Wikipedia articles is evaluated by human experts, which makes it feasible to verify the relation between such link analysis metrics and the quality of Wikipedia articles, our goal in this work. To accomplish that, we implemented several link analysis algorithms and compared their resulting rankings with the ones created by human evaluators regarding factors such as quality, popularity and importance. We found that the metrics are more correlated to quality and popularity than to importance, and the correlation is moderate
|
4 |
Trilhas de comunicação científica : links de postagens de pesquisadores brasileiros nos blogs de ciência / Trails of scientific communication: links of posts of Brazilian researchers in science blogsSousa, Rodrigo Silva Caxias de January 2011 (has links)
O objetivo deste estudo consiste em interpretar o uso dos links nas postagens dos blogs de pesquisadores brasileiros. A investigação tem início através da análise dos links dos blogs inclusos no Anel de Blogs Científicos. Sua efetivação ocorre a partir da composição dos aglomerados das redes de links oriundas dos blogrolls, dos blogs de ciência circunscritos ao Anel de Blogs Científicos. Em momento posterior, foram categorizados os 640 links inclusos no conteúdo das postagens de acordo com as categorias de funções e motivações obtidas de estudos precedentes, e de categorias que emergiram do fenômeno estudado. Por fim, a compreensão das motivações para a inserção de links na composição das postagens dos blogs e as funções que esses links cumprem foi inferida através da Análise de Conteúdo dos contextos aos quais os links estavam inseridos, considerando os espaços aos quais o leitor é remetido a partir de sua ativação. Resultados indicam que o conceito de diários pessoais, em que as mensagens têm um número reduzido de caracteres e são apresentadas em ordem cronológica inversa, só se confirmam em relação a essa última característica, decorrente dos softwares de composição que assim a condicionam. A pouca incidência de links em relação aos blogs de pesquisadores permite afirmar que há uma baixa conectividade por parte dos blogs compostos por diferentes atores que compõem a amostra relativa ao Anel e às áreas as quais pertencem, reforçada pela baixa existência de links entre as postagens e os comentários. Reforça essa questão a ausência de links trackbaks entre os comentários das postagens selecionadas. A primeira das hipóteses que guia o estudo foi refutada, na medida em que as postagens não indicam rearticulações através de seus links de interlocuções entre pesquisadores, leigos e jornalistas científicos, não permitindo reordenações e maior amplitude dessas interlocuções junto à sociedade. A segunda das hipóteses foi confirmada por se basear no fato de que os links colocam em evidência que os documentos e fontes de informação relacionados a partir desses dispositivos (links) são um híbrido de uso e socialização de informações, estas tanto circunscritas às fontes e documentos científicos quanto a fontes e documentos que não se caracterizem tradicionalmente como parte do ciclo de produção científica. A terceira hipótese que guia este estudo foi refutada, pois os dados analisados indicam que o uso dos links por pesquisadores brasileiros não se baseia em funções e motivações que objetivam agilizar processos de produção e comunicação dos resultados de pesquisa através de blogs. / The aim of this study is to interpret the use of links on the blog postings by Brazilian researchers. The investigation begins by examining the links of blogs included in the Anel de Blogs Científicos (Ring of Science Blogs). Its effectiveness is based on the combination of clusters of link networks coming from the blogrolls restricted to the Anel de Blogs Científicos. Afterwards the 640 links included in the content of the posts were classified according to categories of functions and motivations obtained from previous studies and from categories that emerged from the phenomenon studied. Finally, understanding of motivations for the insertion of links on the composition of the blog posts and the functions that such links fulfill were inferred by Content Analysis of the contexts to which the links were inserted, considering the locations to which the reader is referred from its activation. Results indicate that the concept of personal journals, in which the messages have a limited number of characters and are presented in reverse chronological order, is only confirmed through this latter feature, as a result of the software used for composing the posts. The low incidence of links in relation to blogs of researchers allows us to state that there is low connectivity by blogs composed by different authors who form the sample relative to the Anel and the areas which they belong to, reinforced by the low availability of links between posts and comments. What reinforces this point is the absence of trackbak links among comments of the selected posts. The first hypothesis guiding the study was refuted, in that the posts do not indicate rearticulations through its links of dialogues among researchers, lay people and science journalists, not allowing rearrangements and higher amplitude of these dialogues with society. The second hypothesis was confirmed by relying on the fact that the links give evidence that the documents and related sources of information from those devices (links) are a hybrid of using and sharing of information – this information being limited to the sources and scientific documents as much as to sources and documents that are not traditionally characterized as part of the cycle of scientific production. The third hypothesis that guides this study was refuted because the data analyzed indicate that the use of links by Brazilian researchers is not based on functions and motivations that aim at streamlining production processes and communication of research results through blogs.
|
5 |
Trilhas de comunicação científica : links de postagens de pesquisadores brasileiros nos blogs de ciência / Trails of scientific communication: links of posts of Brazilian researchers in science blogsSousa, Rodrigo Silva Caxias de January 2011 (has links)
O objetivo deste estudo consiste em interpretar o uso dos links nas postagens dos blogs de pesquisadores brasileiros. A investigação tem início através da análise dos links dos blogs inclusos no Anel de Blogs Científicos. Sua efetivação ocorre a partir da composição dos aglomerados das redes de links oriundas dos blogrolls, dos blogs de ciência circunscritos ao Anel de Blogs Científicos. Em momento posterior, foram categorizados os 640 links inclusos no conteúdo das postagens de acordo com as categorias de funções e motivações obtidas de estudos precedentes, e de categorias que emergiram do fenômeno estudado. Por fim, a compreensão das motivações para a inserção de links na composição das postagens dos blogs e as funções que esses links cumprem foi inferida através da Análise de Conteúdo dos contextos aos quais os links estavam inseridos, considerando os espaços aos quais o leitor é remetido a partir de sua ativação. Resultados indicam que o conceito de diários pessoais, em que as mensagens têm um número reduzido de caracteres e são apresentadas em ordem cronológica inversa, só se confirmam em relação a essa última característica, decorrente dos softwares de composição que assim a condicionam. A pouca incidência de links em relação aos blogs de pesquisadores permite afirmar que há uma baixa conectividade por parte dos blogs compostos por diferentes atores que compõem a amostra relativa ao Anel e às áreas as quais pertencem, reforçada pela baixa existência de links entre as postagens e os comentários. Reforça essa questão a ausência de links trackbaks entre os comentários das postagens selecionadas. A primeira das hipóteses que guia o estudo foi refutada, na medida em que as postagens não indicam rearticulações através de seus links de interlocuções entre pesquisadores, leigos e jornalistas científicos, não permitindo reordenações e maior amplitude dessas interlocuções junto à sociedade. A segunda das hipóteses foi confirmada por se basear no fato de que os links colocam em evidência que os documentos e fontes de informação relacionados a partir desses dispositivos (links) são um híbrido de uso e socialização de informações, estas tanto circunscritas às fontes e documentos científicos quanto a fontes e documentos que não se caracterizem tradicionalmente como parte do ciclo de produção científica. A terceira hipótese que guia este estudo foi refutada, pois os dados analisados indicam que o uso dos links por pesquisadores brasileiros não se baseia em funções e motivações que objetivam agilizar processos de produção e comunicação dos resultados de pesquisa através de blogs. / The aim of this study is to interpret the use of links on the blog postings by Brazilian researchers. The investigation begins by examining the links of blogs included in the Anel de Blogs Científicos (Ring of Science Blogs). Its effectiveness is based on the combination of clusters of link networks coming from the blogrolls restricted to the Anel de Blogs Científicos. Afterwards the 640 links included in the content of the posts were classified according to categories of functions and motivations obtained from previous studies and from categories that emerged from the phenomenon studied. Finally, understanding of motivations for the insertion of links on the composition of the blog posts and the functions that such links fulfill were inferred by Content Analysis of the contexts to which the links were inserted, considering the locations to which the reader is referred from its activation. Results indicate that the concept of personal journals, in which the messages have a limited number of characters and are presented in reverse chronological order, is only confirmed through this latter feature, as a result of the software used for composing the posts. The low incidence of links in relation to blogs of researchers allows us to state that there is low connectivity by blogs composed by different authors who form the sample relative to the Anel and the areas which they belong to, reinforced by the low availability of links between posts and comments. What reinforces this point is the absence of trackbak links among comments of the selected posts. The first hypothesis guiding the study was refuted, in that the posts do not indicate rearticulations through its links of dialogues among researchers, lay people and science journalists, not allowing rearrangements and higher amplitude of these dialogues with society. The second hypothesis was confirmed by relying on the fact that the links give evidence that the documents and related sources of information from those devices (links) are a hybrid of using and sharing of information – this information being limited to the sources and scientific documents as much as to sources and documents that are not traditionally characterized as part of the cycle of scientific production. The third hypothesis that guides this study was refuted because the data analyzed indicate that the use of links by Brazilian researchers is not based on functions and motivations that aim at streamlining production processes and communication of research results through blogs.
|
6 |
Trilhas de comunicação científica : links de postagens de pesquisadores brasileiros nos blogs de ciência / Trails of scientific communication: links of posts of Brazilian researchers in science blogsSousa, Rodrigo Silva Caxias de January 2011 (has links)
O objetivo deste estudo consiste em interpretar o uso dos links nas postagens dos blogs de pesquisadores brasileiros. A investigação tem início através da análise dos links dos blogs inclusos no Anel de Blogs Científicos. Sua efetivação ocorre a partir da composição dos aglomerados das redes de links oriundas dos blogrolls, dos blogs de ciência circunscritos ao Anel de Blogs Científicos. Em momento posterior, foram categorizados os 640 links inclusos no conteúdo das postagens de acordo com as categorias de funções e motivações obtidas de estudos precedentes, e de categorias que emergiram do fenômeno estudado. Por fim, a compreensão das motivações para a inserção de links na composição das postagens dos blogs e as funções que esses links cumprem foi inferida através da Análise de Conteúdo dos contextos aos quais os links estavam inseridos, considerando os espaços aos quais o leitor é remetido a partir de sua ativação. Resultados indicam que o conceito de diários pessoais, em que as mensagens têm um número reduzido de caracteres e são apresentadas em ordem cronológica inversa, só se confirmam em relação a essa última característica, decorrente dos softwares de composição que assim a condicionam. A pouca incidência de links em relação aos blogs de pesquisadores permite afirmar que há uma baixa conectividade por parte dos blogs compostos por diferentes atores que compõem a amostra relativa ao Anel e às áreas as quais pertencem, reforçada pela baixa existência de links entre as postagens e os comentários. Reforça essa questão a ausência de links trackbaks entre os comentários das postagens selecionadas. A primeira das hipóteses que guia o estudo foi refutada, na medida em que as postagens não indicam rearticulações através de seus links de interlocuções entre pesquisadores, leigos e jornalistas científicos, não permitindo reordenações e maior amplitude dessas interlocuções junto à sociedade. A segunda das hipóteses foi confirmada por se basear no fato de que os links colocam em evidência que os documentos e fontes de informação relacionados a partir desses dispositivos (links) são um híbrido de uso e socialização de informações, estas tanto circunscritas às fontes e documentos científicos quanto a fontes e documentos que não se caracterizem tradicionalmente como parte do ciclo de produção científica. A terceira hipótese que guia este estudo foi refutada, pois os dados analisados indicam que o uso dos links por pesquisadores brasileiros não se baseia em funções e motivações que objetivam agilizar processos de produção e comunicação dos resultados de pesquisa através de blogs. / The aim of this study is to interpret the use of links on the blog postings by Brazilian researchers. The investigation begins by examining the links of blogs included in the Anel de Blogs Científicos (Ring of Science Blogs). Its effectiveness is based on the combination of clusters of link networks coming from the blogrolls restricted to the Anel de Blogs Científicos. Afterwards the 640 links included in the content of the posts were classified according to categories of functions and motivations obtained from previous studies and from categories that emerged from the phenomenon studied. Finally, understanding of motivations for the insertion of links on the composition of the blog posts and the functions that such links fulfill were inferred by Content Analysis of the contexts to which the links were inserted, considering the locations to which the reader is referred from its activation. Results indicate that the concept of personal journals, in which the messages have a limited number of characters and are presented in reverse chronological order, is only confirmed through this latter feature, as a result of the software used for composing the posts. The low incidence of links in relation to blogs of researchers allows us to state that there is low connectivity by blogs composed by different authors who form the sample relative to the Anel and the areas which they belong to, reinforced by the low availability of links between posts and comments. What reinforces this point is the absence of trackbak links among comments of the selected posts. The first hypothesis guiding the study was refuted, in that the posts do not indicate rearticulations through its links of dialogues among researchers, lay people and science journalists, not allowing rearrangements and higher amplitude of these dialogues with society. The second hypothesis was confirmed by relying on the fact that the links give evidence that the documents and related sources of information from those devices (links) are a hybrid of using and sharing of information – this information being limited to the sources and scientific documents as much as to sources and documents that are not traditionally characterized as part of the cycle of scientific production. The third hypothesis that guides this study was refuted because the data analyzed indicate that the use of links by Brazilian researchers is not based on functions and motivations that aim at streamlining production processes and communication of research results through blogs.
|
Page generated in 0.0695 seconds