• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • Tagged with
  • 6
  • 6
  • 5
  • 5
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

SAAL - um sistema para Armazenammento e Análise de Links da Web

Coelho, Roberta de Souza January 2003 (has links)
Made available in DSpace on 2014-06-12T15:59:07Z (GMT). No. of bitstreams: 2 arquivo4842_1.pdf: 796872 bytes, checksum: f32f019baff437f9e947861f8bfdf618 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2003 / O aumento do número de documentos disponíveis na World Wide Web (WWW) traz uma série de novos desafios para a área de Recuperação de Informação (RI). As páginas Web divergem em conteúdo e qualidade além de possuírem uma alta dinâmica. Em adição a estes desafios os engenho de busca estão constantemente lidando com usuários inexperientes e com páginas Web construídas com o intuito de manipular as funções de ranking dos engenhos de busca. Estudos recentes têm mostrado que a performance dos engenhos de busca está longe da ideal. Apesar das evoluções tecnológicas, conseguidas até o momento, permitirem a coleta e o armazenamento de um número cada vez maior de páginas nas bases de índices dos engenhos de busca, a maioria destes sistemas enfrenta vários problemas no momento de classificar as páginas de acordo com a necessidade do usuário, em outras palavras, retornar para o usuário a informação que ele necessita. A maioria dos engenhos de busca analisa as páginas Web como um documento texto simples, não levando em consideração a estrutura na qual a página Web está inserida. Diferentemente das coleções de documentos flat , a WWW corresponde a uma coleção de documentos hipertexto que possuem informações auxiliares que vão além do conteúdo textual, tais como a estrutura dos hiperlinks e o texto dos hiperlinks. Estas informações são chamadas de informações hiper , que em conjunto com as informações texto compõem o conjunto de informações que caracteriza uma página Web. A inadequação de estratégias singulares no processo de recuperação de informações no ambiente Web constitui-se em um forte argumento para mostrar que as técnicas recuperação de informação tradicionais não são suficientes no momento de encontrar informações relevantes na Web. Este trabalho propõe a utilização da estrutura de links da Web com o objetivo de produzir um peso de importância global para cada página Web indexada por um engenho de busca. Este peso, chamado peso de autoridade , é integrado aos engenhos de busca, mais especificamente a função de ranking dos engenhos de busca que passa a utilizar estes pesos juntamente com pesos de similaridade textual, com o objetivo de melhorar a eficácia de recuperação do sistemaPara calcular o peso de autoridade para cada página Web foi elaborado um algoritmo de análise de links, o Global Hybrid Hyperlinked Inducted Topic Search (GHHITS) que foi concebido a partir do estudo dos algoritmos de análise de links préexistentes. Para validar o algoritmo em questão foi implementado o SAAL - Sistema para Armazenamento e Análise de Links - que propõe uma maneira eficiente de armazenar a estrutura de links da Web, e executar o algoritmo proposto sobre esta estrutura. Por fim, são apresentados os resultados obtidos durante os testes que avaliaram a eficácia de recuperação de estratégias de busca que utilizaram o peso de autoridade como componente da função de ranking. Neste trabalho é mostrado, portanto, como as informações estruturais podem ser utilizadas de forma a melhorar a qualidade da resposta retornada por um engenho de busca
2

Métricas de análise de links e qualidade de conteúdo: um estudo de caso na Wikipédia / Link analysis metrics and content quality: a case of study in Wikipedia

Hanada, Raíza Tamae Sarkis 26 February 2013 (has links)
Muitos links entre páginas na Web podem ser vistos como indicadores de qualidade e importância para as páginas que eles apontam. A partir desta ideia, vários estudos propuseram métricas baseadas na estrutura de links para inferir qualidade de conteúdo em páginas da web. Contudo, até onde sabemos, o único trabalho que examinou a correlação entre tais métricas e qualidade de conteúdo consistiu de um estudo limitado que deixou várias questões em aberto. Embora tais métricas sejam muito bem sucedidas na tarefa de ranquear páginas que foram fornecidas como respostas para consultas submetidas para máquinas de busca, não é possível determinar a contribuição específica de fatores como qualidade, popularidade e importância para os resultados. Esta dificuldade se deve em parte ao fato de que a informação sobre qualidade, popularidade e importância é difícil de obter para páginas da web em geral. Ao contrário de páginas da web, estas informações podem ser obtidas para artigos da Wikipédia, uma vez que qualidade e importância são avaliadas por especialistas humanos, enquanto a popularidade pode ser estimada com base nas visualizações dos artigos. Isso torna possível a verificação da relação existente entre estes fatores e métricas de análise de links, nosso objetivo neste trabalho. Para fazer isto, nós implementamos vários algoritmos de análise de links e comparamos os rankings obtidos com eles com os obtidos considerando a avaliação humana feita na Wikipédia com relação aos fatores qualidade, popularidade e importância. Nós observamos que métricas de análise de links são mais relacionadas com qualidade e popularidade que com importância e a correlação é moderada / Many links between Web pages can be viewed as indicative of the quality and importance of the pages pointed to. Accordingly, several studies have proposed metrics based on links to infer web page content quality. However, as far as we know, the only work that has examined the correlation between such metrics and content quality consisted of a limited study that left many open questions. In spite of these metrics having been shown successful in the task of ranking pages which were provided as answers to queries submitted to search machines, it is not possible to determine the specific contribution of factors such as quality, popularity, and importance to the results. This difficulty is partially due to the fact that such information is hard to obtain for Web pages in general. Unlike ordinary Web pages, the content quality of Wikipedia articles is evaluated by human experts, which makes it feasible to verify the relation between such link analysis metrics and the quality of Wikipedia articles, our goal in this work. To accomplish that, we implemented several link analysis algorithms and compared their resulting rankings with the ones created by human evaluators regarding factors such as quality, popularity and importance. We found that the metrics are more correlated to quality and popularity than to importance, and the correlation is moderate
3

Métricas de análise de links e qualidade de conteúdo: um estudo de caso na Wikipédia / Link analysis metrics and content quality: a case of study in Wikipedia

Raíza Tamae Sarkis Hanada 26 February 2013 (has links)
Muitos links entre páginas na Web podem ser vistos como indicadores de qualidade e importância para as páginas que eles apontam. A partir desta ideia, vários estudos propuseram métricas baseadas na estrutura de links para inferir qualidade de conteúdo em páginas da web. Contudo, até onde sabemos, o único trabalho que examinou a correlação entre tais métricas e qualidade de conteúdo consistiu de um estudo limitado que deixou várias questões em aberto. Embora tais métricas sejam muito bem sucedidas na tarefa de ranquear páginas que foram fornecidas como respostas para consultas submetidas para máquinas de busca, não é possível determinar a contribuição específica de fatores como qualidade, popularidade e importância para os resultados. Esta dificuldade se deve em parte ao fato de que a informação sobre qualidade, popularidade e importância é difícil de obter para páginas da web em geral. Ao contrário de páginas da web, estas informações podem ser obtidas para artigos da Wikipédia, uma vez que qualidade e importância são avaliadas por especialistas humanos, enquanto a popularidade pode ser estimada com base nas visualizações dos artigos. Isso torna possível a verificação da relação existente entre estes fatores e métricas de análise de links, nosso objetivo neste trabalho. Para fazer isto, nós implementamos vários algoritmos de análise de links e comparamos os rankings obtidos com eles com os obtidos considerando a avaliação humana feita na Wikipédia com relação aos fatores qualidade, popularidade e importância. Nós observamos que métricas de análise de links são mais relacionadas com qualidade e popularidade que com importância e a correlação é moderada / Many links between Web pages can be viewed as indicative of the quality and importance of the pages pointed to. Accordingly, several studies have proposed metrics based on links to infer web page content quality. However, as far as we know, the only work that has examined the correlation between such metrics and content quality consisted of a limited study that left many open questions. In spite of these metrics having been shown successful in the task of ranking pages which were provided as answers to queries submitted to search machines, it is not possible to determine the specific contribution of factors such as quality, popularity, and importance to the results. This difficulty is partially due to the fact that such information is hard to obtain for Web pages in general. Unlike ordinary Web pages, the content quality of Wikipedia articles is evaluated by human experts, which makes it feasible to verify the relation between such link analysis metrics and the quality of Wikipedia articles, our goal in this work. To accomplish that, we implemented several link analysis algorithms and compared their resulting rankings with the ones created by human evaluators regarding factors such as quality, popularity and importance. We found that the metrics are more correlated to quality and popularity than to importance, and the correlation is moderate
4

Trilhas de comunicação científica : links de postagens de pesquisadores brasileiros nos blogs de ciência / Trails of scientific communication: links of posts of Brazilian researchers in science blogs

Sousa, Rodrigo Silva Caxias de January 2011 (has links)
O objetivo deste estudo consiste em interpretar o uso dos links nas postagens dos blogs de pesquisadores brasileiros. A investigação tem início através da análise dos links dos blogs inclusos no Anel de Blogs Científicos. Sua efetivação ocorre a partir da composição dos aglomerados das redes de links oriundas dos blogrolls, dos blogs de ciência circunscritos ao Anel de Blogs Científicos. Em momento posterior, foram categorizados os 640 links inclusos no conteúdo das postagens de acordo com as categorias de funções e motivações obtidas de estudos precedentes, e de categorias que emergiram do fenômeno estudado. Por fim, a compreensão das motivações para a inserção de links na composição das postagens dos blogs e as funções que esses links cumprem foi inferida através da Análise de Conteúdo dos contextos aos quais os links estavam inseridos, considerando os espaços aos quais o leitor é remetido a partir de sua ativação. Resultados indicam que o conceito de diários pessoais, em que as mensagens têm um número reduzido de caracteres e são apresentadas em ordem cronológica inversa, só se confirmam em relação a essa última característica, decorrente dos softwares de composição que assim a condicionam. A pouca incidência de links em relação aos blogs de pesquisadores permite afirmar que há uma baixa conectividade por parte dos blogs compostos por diferentes atores que compõem a amostra relativa ao Anel e às áreas as quais pertencem, reforçada pela baixa existência de links entre as postagens e os comentários. Reforça essa questão a ausência de links trackbaks entre os comentários das postagens selecionadas. A primeira das hipóteses que guia o estudo foi refutada, na medida em que as postagens não indicam rearticulações através de seus links de interlocuções entre pesquisadores, leigos e jornalistas científicos, não permitindo reordenações e maior amplitude dessas interlocuções junto à sociedade. A segunda das hipóteses foi confirmada por se basear no fato de que os links colocam em evidência que os documentos e fontes de informação relacionados a partir desses dispositivos (links) são um híbrido de uso e socialização de informações, estas tanto circunscritas às fontes e documentos científicos quanto a fontes e documentos que não se caracterizem tradicionalmente como parte do ciclo de produção científica. A terceira hipótese que guia este estudo foi refutada, pois os dados analisados indicam que o uso dos links por pesquisadores brasileiros não se baseia em funções e motivações que objetivam agilizar processos de produção e comunicação dos resultados de pesquisa através de blogs. / The aim of this study is to interpret the use of links on the blog postings by Brazilian researchers. The investigation begins by examining the links of blogs included in the Anel de Blogs Científicos (Ring of Science Blogs). Its effectiveness is based on the combination of clusters of link networks coming from the blogrolls restricted to the Anel de Blogs Científicos. Afterwards the 640 links included in the content of the posts were classified according to categories of functions and motivations obtained from previous studies and from categories that emerged from the phenomenon studied. Finally, understanding of motivations for the insertion of links on the composition of the blog posts and the functions that such links fulfill were inferred by Content Analysis of the contexts to which the links were inserted, considering the locations to which the reader is referred from its activation. Results indicate that the concept of personal journals, in which the messages have a limited number of characters and are presented in reverse chronological order, is only confirmed through this latter feature, as a result of the software used for composing the posts. The low incidence of links in relation to blogs of researchers allows us to state that there is low connectivity by blogs composed by different authors who form the sample relative to the Anel and the areas which they belong to, reinforced by the low availability of links between posts and comments. What reinforces this point is the absence of trackbak links among comments of the selected posts. The first hypothesis guiding the study was refuted, in that the posts do not indicate rearticulations through its links of dialogues among researchers, lay people and science journalists, not allowing rearrangements and higher amplitude of these dialogues with society. The second hypothesis was confirmed by relying on the fact that the links give evidence that the documents and related sources of information from those devices (links) are a hybrid of using and sharing of information – this information being limited to the sources and scientific documents as much as to sources and documents that are not traditionally characterized as part of the cycle of scientific production. The third hypothesis that guides this study was refuted because the data analyzed indicate that the use of links by Brazilian researchers is not based on functions and motivations that aim at streamlining production processes and communication of research results through blogs.
5

Trilhas de comunicação científica : links de postagens de pesquisadores brasileiros nos blogs de ciência / Trails of scientific communication: links of posts of Brazilian researchers in science blogs

Sousa, Rodrigo Silva Caxias de January 2011 (has links)
O objetivo deste estudo consiste em interpretar o uso dos links nas postagens dos blogs de pesquisadores brasileiros. A investigação tem início através da análise dos links dos blogs inclusos no Anel de Blogs Científicos. Sua efetivação ocorre a partir da composição dos aglomerados das redes de links oriundas dos blogrolls, dos blogs de ciência circunscritos ao Anel de Blogs Científicos. Em momento posterior, foram categorizados os 640 links inclusos no conteúdo das postagens de acordo com as categorias de funções e motivações obtidas de estudos precedentes, e de categorias que emergiram do fenômeno estudado. Por fim, a compreensão das motivações para a inserção de links na composição das postagens dos blogs e as funções que esses links cumprem foi inferida através da Análise de Conteúdo dos contextos aos quais os links estavam inseridos, considerando os espaços aos quais o leitor é remetido a partir de sua ativação. Resultados indicam que o conceito de diários pessoais, em que as mensagens têm um número reduzido de caracteres e são apresentadas em ordem cronológica inversa, só se confirmam em relação a essa última característica, decorrente dos softwares de composição que assim a condicionam. A pouca incidência de links em relação aos blogs de pesquisadores permite afirmar que há uma baixa conectividade por parte dos blogs compostos por diferentes atores que compõem a amostra relativa ao Anel e às áreas as quais pertencem, reforçada pela baixa existência de links entre as postagens e os comentários. Reforça essa questão a ausência de links trackbaks entre os comentários das postagens selecionadas. A primeira das hipóteses que guia o estudo foi refutada, na medida em que as postagens não indicam rearticulações através de seus links de interlocuções entre pesquisadores, leigos e jornalistas científicos, não permitindo reordenações e maior amplitude dessas interlocuções junto à sociedade. A segunda das hipóteses foi confirmada por se basear no fato de que os links colocam em evidência que os documentos e fontes de informação relacionados a partir desses dispositivos (links) são um híbrido de uso e socialização de informações, estas tanto circunscritas às fontes e documentos científicos quanto a fontes e documentos que não se caracterizem tradicionalmente como parte do ciclo de produção científica. A terceira hipótese que guia este estudo foi refutada, pois os dados analisados indicam que o uso dos links por pesquisadores brasileiros não se baseia em funções e motivações que objetivam agilizar processos de produção e comunicação dos resultados de pesquisa através de blogs. / The aim of this study is to interpret the use of links on the blog postings by Brazilian researchers. The investigation begins by examining the links of blogs included in the Anel de Blogs Científicos (Ring of Science Blogs). Its effectiveness is based on the combination of clusters of link networks coming from the blogrolls restricted to the Anel de Blogs Científicos. Afterwards the 640 links included in the content of the posts were classified according to categories of functions and motivations obtained from previous studies and from categories that emerged from the phenomenon studied. Finally, understanding of motivations for the insertion of links on the composition of the blog posts and the functions that such links fulfill were inferred by Content Analysis of the contexts to which the links were inserted, considering the locations to which the reader is referred from its activation. Results indicate that the concept of personal journals, in which the messages have a limited number of characters and are presented in reverse chronological order, is only confirmed through this latter feature, as a result of the software used for composing the posts. The low incidence of links in relation to blogs of researchers allows us to state that there is low connectivity by blogs composed by different authors who form the sample relative to the Anel and the areas which they belong to, reinforced by the low availability of links between posts and comments. What reinforces this point is the absence of trackbak links among comments of the selected posts. The first hypothesis guiding the study was refuted, in that the posts do not indicate rearticulations through its links of dialogues among researchers, lay people and science journalists, not allowing rearrangements and higher amplitude of these dialogues with society. The second hypothesis was confirmed by relying on the fact that the links give evidence that the documents and related sources of information from those devices (links) are a hybrid of using and sharing of information – this information being limited to the sources and scientific documents as much as to sources and documents that are not traditionally characterized as part of the cycle of scientific production. The third hypothesis that guides this study was refuted because the data analyzed indicate that the use of links by Brazilian researchers is not based on functions and motivations that aim at streamlining production processes and communication of research results through blogs.
6

Trilhas de comunicação científica : links de postagens de pesquisadores brasileiros nos blogs de ciência / Trails of scientific communication: links of posts of Brazilian researchers in science blogs

Sousa, Rodrigo Silva Caxias de January 2011 (has links)
O objetivo deste estudo consiste em interpretar o uso dos links nas postagens dos blogs de pesquisadores brasileiros. A investigação tem início através da análise dos links dos blogs inclusos no Anel de Blogs Científicos. Sua efetivação ocorre a partir da composição dos aglomerados das redes de links oriundas dos blogrolls, dos blogs de ciência circunscritos ao Anel de Blogs Científicos. Em momento posterior, foram categorizados os 640 links inclusos no conteúdo das postagens de acordo com as categorias de funções e motivações obtidas de estudos precedentes, e de categorias que emergiram do fenômeno estudado. Por fim, a compreensão das motivações para a inserção de links na composição das postagens dos blogs e as funções que esses links cumprem foi inferida através da Análise de Conteúdo dos contextos aos quais os links estavam inseridos, considerando os espaços aos quais o leitor é remetido a partir de sua ativação. Resultados indicam que o conceito de diários pessoais, em que as mensagens têm um número reduzido de caracteres e são apresentadas em ordem cronológica inversa, só se confirmam em relação a essa última característica, decorrente dos softwares de composição que assim a condicionam. A pouca incidência de links em relação aos blogs de pesquisadores permite afirmar que há uma baixa conectividade por parte dos blogs compostos por diferentes atores que compõem a amostra relativa ao Anel e às áreas as quais pertencem, reforçada pela baixa existência de links entre as postagens e os comentários. Reforça essa questão a ausência de links trackbaks entre os comentários das postagens selecionadas. A primeira das hipóteses que guia o estudo foi refutada, na medida em que as postagens não indicam rearticulações através de seus links de interlocuções entre pesquisadores, leigos e jornalistas científicos, não permitindo reordenações e maior amplitude dessas interlocuções junto à sociedade. A segunda das hipóteses foi confirmada por se basear no fato de que os links colocam em evidência que os documentos e fontes de informação relacionados a partir desses dispositivos (links) são um híbrido de uso e socialização de informações, estas tanto circunscritas às fontes e documentos científicos quanto a fontes e documentos que não se caracterizem tradicionalmente como parte do ciclo de produção científica. A terceira hipótese que guia este estudo foi refutada, pois os dados analisados indicam que o uso dos links por pesquisadores brasileiros não se baseia em funções e motivações que objetivam agilizar processos de produção e comunicação dos resultados de pesquisa através de blogs. / The aim of this study is to interpret the use of links on the blog postings by Brazilian researchers. The investigation begins by examining the links of blogs included in the Anel de Blogs Científicos (Ring of Science Blogs). Its effectiveness is based on the combination of clusters of link networks coming from the blogrolls restricted to the Anel de Blogs Científicos. Afterwards the 640 links included in the content of the posts were classified according to categories of functions and motivations obtained from previous studies and from categories that emerged from the phenomenon studied. Finally, understanding of motivations for the insertion of links on the composition of the blog posts and the functions that such links fulfill were inferred by Content Analysis of the contexts to which the links were inserted, considering the locations to which the reader is referred from its activation. Results indicate that the concept of personal journals, in which the messages have a limited number of characters and are presented in reverse chronological order, is only confirmed through this latter feature, as a result of the software used for composing the posts. The low incidence of links in relation to blogs of researchers allows us to state that there is low connectivity by blogs composed by different authors who form the sample relative to the Anel and the areas which they belong to, reinforced by the low availability of links between posts and comments. What reinforces this point is the absence of trackbak links among comments of the selected posts. The first hypothesis guiding the study was refuted, in that the posts do not indicate rearticulations through its links of dialogues among researchers, lay people and science journalists, not allowing rearrangements and higher amplitude of these dialogues with society. The second hypothesis was confirmed by relying on the fact that the links give evidence that the documents and related sources of information from those devices (links) are a hybrid of using and sharing of information – this information being limited to the sources and scientific documents as much as to sources and documents that are not traditionally characterized as part of the cycle of scientific production. The third hypothesis that guides this study was refuted because the data analyzed indicate that the use of links by Brazilian researchers is not based on functions and motivations that aim at streamlining production processes and communication of research results through blogs.

Page generated in 0.0566 seconds