• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 28
  • 12
  • 7
  • 2
  • 1
  • 1
  • Tagged with
  • 51
  • 24
  • 9
  • 8
  • 7
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Cultura, complexidade e colaboração online : uma visão da Comunicação

Ferreira, Marcos Ramon Gomes 31 October 2014 (has links)
Tese (doutorado)—Universidade de Brasília, Faculdade de Comunicação, Programa de Pós-graduação em Comunicação, 2014. / Submitted by Larissa Stefane Vieira Rodrigues (larissarodrigues@bce.unb.br) on 2015-02-02T12:13:19Z No. of bitstreams: 1 2014_MarcosRamonGomesFerreira.pdf: 2898550 bytes, checksum: 8acfd4680f109f1e4109f33a0aaf9ce0 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2015-02-02T19:07:02Z (GMT) No. of bitstreams: 1 2014_MarcosRamonGomesFerreira.pdf: 2898550 bytes, checksum: 8acfd4680f109f1e4109f33a0aaf9ce0 (MD5) / Made available in DSpace on 2015-02-02T19:07:02Z (GMT). No. of bitstreams: 1 2014_MarcosRamonGomesFerreira.pdf: 2898550 bytes, checksum: 8acfd4680f109f1e4109f33a0aaf9ce0 (MD5) / Esta tese analisa o fenômeno da colaboração online em sua conexão com a Comunicação, considerando as relações entre a cibercultura e a complexidade. Entendemos como contribuições importantes desta pesquisa a análise da colaboração online - tema ainda pouco explorado no contexto acadêmico - assim como a discussão deste tema a partir da complexidade, que consideramos uma perspectiva rica em possibilidades dentro do campo da Comunicação. Investigamos os conceitos de cultura, considerando também a cultura de massa como um processo necessário para entendermos não só a colaboração online no contexto da cibercultura, mas boa parte das relações sociais da contemporaneidade. A partir disto passamos à análise da cibercultura, principalmente a partir de sua conexão com as transformações decorrentes da tecnologia digital. A cultura digital é, então, investigada a partir da complexidade, entendendo esta como uma perspectiva teórica e metodológica que nos proporciona a compreensão da colaboração nos ambientes online. Apresentamos indicadores da colaboração antes e a partir da tecnologia digital, analisando suas peculiaridades e circunstâncias. Como perspectiva metodológica utilizamos tanto a revisão bibliográfica como a observação dos fenômenos colaborativos online, a partir dos quais nos debruçamos para analisar as características e consequências dos projetos colaborativos na internet. A perspectiva do pensamento complexo foi importante também na forma como construímos nossa metodologia, onde mantivemos nosso foco em um processo reflexivo de análise. Consideramos o fenômeno da colaboração online a partir das características da ideologia da “cultura livre” e do open source, além da análise de ferramentas colaborativas (sendo a Wikipédia o principal exemplo utilizado por conta do seu sistema de colaboração para a produção de conhecimento de forma coletiva), considerando suas possibilidades e limitações. ___________________________________________________________________________________ ABSTRACT / This thesis examines the phenomenon of mass collaboration in its connection with Communication, considering the relations between cyberculture and complexity. We understand how important contributions of this study, the analysis of mass collaboration - topic not yet explored in the academic context - such as the discussion of this topic from complexity, we consider a rich perspective on possibilities within the field of Communications. We investigate the concepts of culture, also considering mass culture as a necessary process to understand not only the mass collaboration in the context of cyberspace, but much of the social relations of contemporaneity. From this we pass to the analysis of cyberculture, mostly from its connection with changes resulting from the digital technology. Digital culture is then investigated from complexity, understanding this as a theoretical and methodological perspective that gives us an understanding of collaboration in online environments. We show indicators of collaboration before and from digital technology, analyzing its peculiarities and circumstances. As a methodological perspective used both literature review and observation of online collaborative phenomena, from which we concentrate to analyze the characteristics and consequences of collaborative projects on the Internet. The approach based on complexity was also important in how we build our methodology, where we kept our focus on a reflective analysis process. We consider the phenomenon of mass collaboration from the characteristics of the ideology of "free culture" and open source, and analysis of collaborative tools (Wikipedia is the primary example used because of its collaboration system for the production of knowledge collectively) considering its possibilities and limitations.
12

Métricas de análise de links e qualidade de conteúdo: um estudo de caso na Wikipédia / Link analysis metrics and content quality: a case of study in Wikipedia

Raíza Tamae Sarkis Hanada 26 February 2013 (has links)
Muitos links entre páginas na Web podem ser vistos como indicadores de qualidade e importância para as páginas que eles apontam. A partir desta ideia, vários estudos propuseram métricas baseadas na estrutura de links para inferir qualidade de conteúdo em páginas da web. Contudo, até onde sabemos, o único trabalho que examinou a correlação entre tais métricas e qualidade de conteúdo consistiu de um estudo limitado que deixou várias questões em aberto. Embora tais métricas sejam muito bem sucedidas na tarefa de ranquear páginas que foram fornecidas como respostas para consultas submetidas para máquinas de busca, não é possível determinar a contribuição específica de fatores como qualidade, popularidade e importância para os resultados. Esta dificuldade se deve em parte ao fato de que a informação sobre qualidade, popularidade e importância é difícil de obter para páginas da web em geral. Ao contrário de páginas da web, estas informações podem ser obtidas para artigos da Wikipédia, uma vez que qualidade e importância são avaliadas por especialistas humanos, enquanto a popularidade pode ser estimada com base nas visualizações dos artigos. Isso torna possível a verificação da relação existente entre estes fatores e métricas de análise de links, nosso objetivo neste trabalho. Para fazer isto, nós implementamos vários algoritmos de análise de links e comparamos os rankings obtidos com eles com os obtidos considerando a avaliação humana feita na Wikipédia com relação aos fatores qualidade, popularidade e importância. Nós observamos que métricas de análise de links são mais relacionadas com qualidade e popularidade que com importância e a correlação é moderada / Many links between Web pages can be viewed as indicative of the quality and importance of the pages pointed to. Accordingly, several studies have proposed metrics based on links to infer web page content quality. However, as far as we know, the only work that has examined the correlation between such metrics and content quality consisted of a limited study that left many open questions. In spite of these metrics having been shown successful in the task of ranking pages which were provided as answers to queries submitted to search machines, it is not possible to determine the specific contribution of factors such as quality, popularity, and importance to the results. This difficulty is partially due to the fact that such information is hard to obtain for Web pages in general. Unlike ordinary Web pages, the content quality of Wikipedia articles is evaluated by human experts, which makes it feasible to verify the relation between such link analysis metrics and the quality of Wikipedia articles, our goal in this work. To accomplish that, we implemented several link analysis algorithms and compared their resulting rankings with the ones created by human evaluators regarding factors such as quality, popularity and importance. We found that the metrics are more correlated to quality and popularity than to importance, and the correlation is moderate
13

Comment l'amitié influence-t-elle la collaboration des étudiants dans la réalisation d'un article sur Wikipédia

Suarez, Fabio January 2014 (has links)
Cette étude exploratoire prétend analyser la corrélation entre le concept de l’amitié entre pairs et la collaboration sur un environnement wiki ouvert comme Wikipédia. 37 étudiants de premier cycle en enseignement primaire et préscolaire ont été rencontrés. Nous avons récolté les témoignages des étudiants concernant le type d’interventions qu’ils ont préféré faire à leurs amis et aux autres pairs. Les résultats nous ont permis de constater si l’amitié influence ou non la collaboration entre les étudiants. Nous avons observé que la collaboration ne dépend pas exclusivement de l’amitié entre les étudiants, mais d’autres facteurs qui caractérisent ce contexte sous lequel a été déroulé le projet. Nous allons finir avec une proposition de quelques sujets de recherche qui peuvent enrichir la littérature sur l’amitié et son influence sur la collaboration sur les wikis.
14

Wikipédia midiática: cotidianidades, compilação de saberes e lutas de poder nos bastidores da Enciclopédia Livre

Machuy, Camilla Cavalcante de Souza 12 June 2017 (has links)
Submitted by Programa de Pós-Graduação em Mídia e Cotidiano (ppgmc@vm.uff.br) on 2017-05-04T18:07:01Z No. of bitstreams: 1 Dissertação Camilla Final com ficha.pdf: 3014668 bytes, checksum: 72e881947c172414c4cd72c2468b88b0 (MD5) / Approved for entry into archive by Josimara Dias Brumatti (bcgdigital@ndc.uff.br) on 2017-06-12T15:59:23Z (GMT) No. of bitstreams: 1 Dissertação Camilla Final com ficha.pdf: 3014668 bytes, checksum: 72e881947c172414c4cd72c2468b88b0 (MD5) / Made available in DSpace on 2017-06-12T15:59:23Z (GMT). No. of bitstreams: 1 Dissertação Camilla Final com ficha.pdf: 3014668 bytes, checksum: 72e881947c172414c4cd72c2468b88b0 (MD5) / Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do Rio de Janeiro / Essa dissertação analisa as dinâmicas de interações os editores no ambiente online da Wikipédia em Língua Portuguesa. Avalia-se como essas relações internas constituem o cotidiano da maior enciclopédia online da Internet e como as comunicações nos bastidores interferem na construção coletiva de conteúdo nos mais diversos verbetes dessa poderosa mídia. O objetivo desta dissertação é compreender os bastidores da Wikipédia, entendida como uma poderosa mídia, em sua relação com outras mídias e com a cotidianidade. Tomando por base a teoria dos campos, de Bourdieu, avalia como as disputas editoriais compõem o cotidiano da maior enciclopédia da Internet, interferindo decisivamente na construção coletiva de conteúdo, nos mais diversos verbetes.Por meio de estudos de caso da Wikipédia em língua portuguesa, explora o universo não exposto dos wikipedistas, partindo da hipótese de que os campos de discussão dos artigos são terrenos férteis para coleta de informações e análises, além de um ponto de partida fundamental para a melhor compreensão dos embates intelectuais por trás dos textos divulgados publicamente no site. Todas as informações de bastidores coletadas para esta pesquisa estão disponíveis para qualquer usuário do site, basta saber onde procurar. O trabalho investiga também a relação dos editores com o conteúdo construído e como artigos de diferentes temáticas são abordados pelos wikipedistas. Discute, por fim, a construção de conteúdo à luz do conceito de Cotidiano, de Agnes Heller, com ênfase na dialética entre a construção enciclopédica como uma atividade coletiva de suspensão da cotidianidade, na qual se busca a divulgação de conhecimento cientificamente autorizado, e, ao mesmo tempo, uma imersão no fluxo da cotidianidade, uma vez que muitas das informações acrescentadas nos verbetes são oriundas de elementos do cotidiano, como notícias e textos jornalísticos, numa articulação entre mídias de origem, estrutura, função e uso distintos: a enciclopédia e o jornal. A partir dessa perspectiva, foi possível estabelecer relações sobre os conflitos internos, as disputas de poder, as cooperações, as dificuldades, os vandalismos e vários outros percalços vividos cotidianamente pelos voluntários que constituem a Enciclopédia Livre / This dissertation analyzes the interaction dynamics among users of Portuguese Wikipedia online environment. It evaluates how these internal relationships build the biggest online encyclopedia and also how background communications interfere on the crowdsourcing content gathering. Through the studies of several cases collection, it became possible to explore consistently the almost imperceptible universe of the wikipedians. The “talk” tabs turned out as fertile fields of research, analysis, info collection and also a starting point to better comprehend the intellectual processes behind the public texts, which sometimes a distract reader may not notice. It is important to stress that all background data gathered for this research are available for any Wikipedia user to learn. It is just a matter of knowing where to find it. It is also possible to analyze the relation between the editors and the content as well as the approach to the different subject articles. As well, this paper investigates the content building through Agnes Heller's Everyday Life concept. The dichotomy between the encyclopedic construction as an Everyday suspension activity which looks after the human knowledge spread. By the other hand, the same activity merges on the Everyday flow, once lots of information added come from the quotidian elements as news and journalistic articles. Starting at this point of view, it is possible to make connections about the inner conflicts among users, cooperation, struggles, vandalism and many other common issues in a Wikipedia volunteer's life
15

L'utilisation de ressources partagées dans l'apprentissage : un changement du rapport au savoir ? : Le cas de Wikipedia

Maneval, Béatrice 26 March 2013 (has links)
C'est face à la montée fulgurante de l'informatique pour tous que débute cette thèse. L'usage des nouvelles technologies se propage dans tous les domaines. L'éducation est bien sûr concernée par ce phénomène.C'est ainsi que nous remonterons le temps aux débuts de l'éducation en retraçant les évolutions qui l'ont affectée. Ceci nous permettra de mieux comprendre comment les bouleversements d'aujourd'hui s'intègrent dans notre système actuel. Nous étudierons tout particulièrement l'encyclopédie Wikipedia, véritable phénomène de société par sa gestion innovante. Comment est-elle appréhendée dans l'enseignement ? Notre étude essaiera d'apporter des éclaircissements dans ce domaine. L'encyclopédie est-elle exploitée par la population enseignante dans leurs pratiques professionnelles ? Cet espace collaboratif occupe-t-il toute sa place dans le monde de l'éducation ? Ces questionnements nous permettront d'élaborer notre plan d'étude. Il nous conduira en conclusion vers les modalités d'intégration de ces nouveaux espaces de ressources partagées dans l'enseignement. / The genesis of this thesis is the lightning rise of Information Technology. The use of new technologies is spreading in every field. Education is of course affected by this trend.This is why we will go back in time to the early stages of education by observing its evolution.This will allow us to better understand how today's changesfit into our current system. We will study with particular interest the Wikipedia encyclopedia, a genuine phenomenon of our time by his innovative approach. How is it utilized in teaching? Our study will attempt to bring light to such areas.How is the encyclopedia utilized in education, and particularly by teachers?Does this collaborative field occupy all its place in the world of education?These questions will allow us to develop our study plan. It will as a conclusion lead us towards the integration modes of these new shared-resource fields in teaching.
16

Wikipédia, encyclopédie et site d’actualités ˸ qualité de l'information et normes collaboratives d’un média en ligne / Wikipedia, encyclopaedia and news site ˸ quality of information and collaborative standards for an online media outlet

Doutreix, Marie-Noëlle 07 December 2018 (has links)
Approximations, fausses informations, biais idéologiques : Wikipédia a dû répondre à de nombreuses critiques depuis sa création en 2001. Pourtant, les contributeurs n’ont cessé d’élaborer des outils, labels et indicateurs pour accompagner les utilisateurs dans la recherche d’une information fiable.Cette thèse s’intéresse aux moyens mis en œuvre pour renforcer la fiabilité d’un média collaboratif en ligne. Car la synthèse que Wikipédia opère entre une prétention encyclopédique et la prise en charge de l’actualité invite à la concevoir comme une encyclopédie médiatique. En effet, l’actualité y est traitée en temps réel et les sources utilisées pour ce type de sujet sont bien souvent journalistiques, participant ainsi à la « circulation circulaire » de l’information médiatique. Le genre encyclopédique de Wikipédia est questionné en cherchant les éléments de filiation tels que l’hypertextualité et en soulignant les principaux points de divergences épistémologiques comme le rapport aux sources et le principe de neutralité de point de vue. Les deux corpus étudiés, de près de trois cents articles chacun, rendent manifeste la place de l’actualité dans les usages de Wikipédia et dans les pratiques des contributeurs. / Overly rough data, false information, ideological prejudices, such are the numerous criticisms to which the Wikipedia project has responded ever since its inception in 2001. All this despite the fact that contributors to the project had never ceased honing their tools, labels and indications to help users find reliable information.This thesis seeks to explore the means that have been used to enhance the reliability of the collaborative medium put on line. It argues that the synthesis proposed by the Wikipedia project combines, on the one hand, claims to possess an encyclopaedic format with, on the other, the ability to keep abreast of current developments makes it a media encyclopaedia. Indeed, current developments are dealt with in real time and the sources relied on are often journalistic in nature, a situation which displays the « circular circulation » of information, characteristic of media in general. The very genre of the encyclopaedia is brought into the spotlight when the thesis turns to related phenomena such as hypertextuality and also when it underscores the main areas of epistemological differences such as the relationship with sources and the principle of a neutral point of view. The two corpuses studied, each comprising nearly three hundred articles, clearly show the place that the Wikipedia project devotes to current events as well as the importance they have for the practices engaged in by contributors to the project.
17

A wikification prediction model based on the combination of latent, dyadic and monadic features / Um modelo de previsão para Wikification baseado na combinação de atributos latentes, diádicos e monádicos

Ferreira, Raoni Simões 25 April 2016 (has links)
Most of the reference information, nowadays, is found in repositories of documents semantically linked, created in a collaborative fashion and freely available in the web. Among the many problems faced by content providers in these repositories, one of the most important is Wikification, that is, the placement of links in the articles. These links have to support user navigation and should provide a deeper semantic interpretation of the content. Wikification is a hard task since the continuous growth of such repositories makes it increasingly demanding for editors. As consequence, they have their focus shifted from content creation, which should be their main objective. This has motivated the design of automatic Wikification tools which, traditionally, address two distinct problems: (a) how to identify which words (or phrases) in an article should be selected as anchors and (b) how to determine to which article the link, associated with the anchor, should point. Most of the methods in literature that address these problems are based on machine learning approaches which attempt to capture, through statistical features, characteristics of the concepts and its associations. Although these strategies handle the repository as a graph of concepts, normally they take limited advantage of the topological structure of this graph, as they describe it by means of human-engineered link statistical features. Despite the effectiveness of these machine learning methods, better models should take full advantage of the information topology if they describe it by means of data-oriented approaches such as matrix factorization. This indeed has been successfully done in other domains, such as movie recommendation. In this work, we fill this gap, proposing a wikification prediction model that combines the strengths of traditional predictors based on statistical features with a latent component which models the concept graph topology by means of matrix factorization. By comparing our model with a state-of-the-art wikification method, using a sample of Wikipedia articles, we obtained a gain up to 13% in F1 metric. We also provide a comprehensive analysis of the model performance showing the importance of the latent predictor component and the attributes derived from the associations between the concepts. The study still includes the analysis of the impact of ambiguous concepts, which allows us to conclude the model is resilient to ambiguity, even though does not include any explicitly disambiguation phase. We finally study the impact of selecting training samples from specific content quality classes, an information that is available in some respositories, such as Wikipedia. We empirically shown that the quality of the training samples impact on precision and overlinking, when comparing training performed using random quality samples versus high quality samples. / Atualmente, informações de referência são disponibilizadas através de repositórios de documentos semanticamente ligados, criados de forma colaborativa e com acesso livre na Web. Entre os muitos problemas enfrentados pelos provedores de conteúdo desses repositórios, destaca-se a Wikification, isto é, a inclusão de links nos artigos desses repositórios. Esses links possibilitam a navegação pelos artigos e permitem ao usuário um aprofundamento semântico do conteúdo. A Wikification é uma tarefa complexa, uma vez que o crescimento contínuo de tais repositórios resulta em um esforço cada vez maior dos editores. Como consequência, eles têm seu foco desviado da criação de conteúdo, que deveria ser o seu principal objetivo. Isso tem motivado o desenvolvimento de ferramentas de Wikification automática que, tradicionalmente, abordam dois problemas distintos: (a) como identificar que palavras (ou frases) em um artigo deveriam ser selecionados como texto de âncora e (b) como determinar para que artigos o link, associado ao texto de âncora, deveria apontar. A maioria dos métodos na literatura que abordam esses problemas usam aprendizado de máquina. Eles tentam capturar, através de atributos estatísticos, características dos conceitos e seus links. Embora essas estratégias tratam o repositório como um grafo de conceitos, normalmente elas pouco exploram a estrutura topológica do grafo, uma vez que se limitam a descrevê-lo por meio de atributos estatísticos dos links, projetados por especialistas humanos. Embora tais métodos sejam eficazes, novos modelos poderiam tirar mais proveito da topologia se a descrevessem por meio de abordagens orientados a dados, tais como a fatoração matricial. De fato, essa abordagem tem sido aplicada com sucesso em outros domínios como recomendação de filmes. Neste trabalho, propomos um modelo de previsão para Wikification que combina a força dos previsores tradicionais baseados em atributos estatísticos, projetados por seres humanos, com um componente de previsão latente, que modela a topologia do grafo de conceitos usando fatoração matricial. Ao comparar nosso modelo com o estado-da-arte em Wikification, usando uma amostra de artigos Wikipédia, observamos um ganho de até 13% em F1. Além disso, fornecemos uma análise detalhada do desempenho do modelo enfatizando a importância do componente de previsão latente e dos atributos derivados dos links entre os conceitos. Também analisamos o impacto de conceitos ambíguos, o que permite concluir que nosso modelo se porta bem mesmo diante de ambiguidade, apesar de não tratar explicitamente este problema. Ainda realizamos um estudo sobre o impacto da seleção das amostras de treino conforme a qualidade dos seus conteúdos, uma informação disponível em alguns repositórios, tais como a Wikipédia. Nós observamos que o treino com documentos de alta qualidade melhora a precisão do método, minimizando o uso de links desnecessários.
18

Google matrix analysis of Wikipedia networks

El zant, Samer 06 July 2018 (has links) (PDF)
Cette thèse s’intéresse à l’analyse du réseau dirigé extrait de la structure des hyperliens deWikipédia. Notre objectif est de mesurer les interactions liant un sous-ensemble de pages duréseau Wikipédia. Par conséquent, nous proposons de tirer parti d’une nouvelle représentationmatricielle appelée matrice réduite de Google ou "reduced Google Matrix". Cette matrice réduitede Google (GR) est définie pour un sous-ensemble de pages donné (c-à-d un réseau réduit).Comme pour la matrice de Google standard, un composant de GR capture la probabilité que deuxnoeuds du réseau réduit soient directement connectés dans le réseau complet. Une desparticularités de GR est l’existence d’un autre composant qui explique la probabilité d’avoir deuxnoeuds indirectement connectés à travers tous les chemins possibles du réseau entier. Dans cettethèse, les résultats de notre étude de cas nous montrent que GR offre une représentation fiabledes liens directs et indirects (cachés). Nous montrons que l’analyse de GR est complémentaire àl’analyse de "PageRank" et peut être exploitée pour étudier l’influence d’une variation de lien surle reste de la structure du réseau. Les études de cas sont basées sur des réseaux Wikipédiaprovenant de différentes éditions linguistiques. Les interactions entre plusieurs groupes d’intérêtont été étudiées en détail : peintres, pays et groupes terroristes. Pour chaque étude, un réseauréduit a été construit. Les interactions directes et indirectes ont été analysées et confrontées à desfaits historiques, géopolitiques ou scientifiques. Une analyse de sensibilité est réalisée afin decomprendre l’influence des liens dans chaque groupe sur d’autres noeuds (ex : les pays dansnotre cas). Notre analyse montre qu’il est possible d’extraire des interactions précieuses entre lespeintres, les pays et les groupes terroristes. On retrouve par exemple, dans le réseau de peintresissu de GR, un regroupement des artistes par grand mouvement de l’histoire de la peinture. Lesinteractions bien connues entre les grands pays de l’UE ou dans le monde entier sont égalementsoulignées/mentionnées dans nos résultats. De même, le réseau de groupes terroristes présentedes liens pertinents en ligne avec leur idéologie ou leurs relations historiques ou géopolitiques.Nous concluons cette étude en montrant que l’analyse réduite de la matrice de Google est unenouvelle méthode d’analyse puissante pour les grands réseaux dirigés. Nous affirmons que cetteapproche pourra aussi bien s’appliquer à des données représentées sous la forme de graphesdynamiques. Cette approche offre de nouvelles possibilités permettant une analyse efficace desinteractions d’un groupe de noeuds enfoui dans un grand réseau dirigé
19

A wikification prediction model based on the combination of latent, dyadic and monadic features / Um modelo de previsão para Wikification baseado na combinação de atributos latentes, diádicos e monádicos

Raoni Simões Ferreira 25 April 2016 (has links)
Most of the reference information, nowadays, is found in repositories of documents semantically linked, created in a collaborative fashion and freely available in the web. Among the many problems faced by content providers in these repositories, one of the most important is Wikification, that is, the placement of links in the articles. These links have to support user navigation and should provide a deeper semantic interpretation of the content. Wikification is a hard task since the continuous growth of such repositories makes it increasingly demanding for editors. As consequence, they have their focus shifted from content creation, which should be their main objective. This has motivated the design of automatic Wikification tools which, traditionally, address two distinct problems: (a) how to identify which words (or phrases) in an article should be selected as anchors and (b) how to determine to which article the link, associated with the anchor, should point. Most of the methods in literature that address these problems are based on machine learning approaches which attempt to capture, through statistical features, characteristics of the concepts and its associations. Although these strategies handle the repository as a graph of concepts, normally they take limited advantage of the topological structure of this graph, as they describe it by means of human-engineered link statistical features. Despite the effectiveness of these machine learning methods, better models should take full advantage of the information topology if they describe it by means of data-oriented approaches such as matrix factorization. This indeed has been successfully done in other domains, such as movie recommendation. In this work, we fill this gap, proposing a wikification prediction model that combines the strengths of traditional predictors based on statistical features with a latent component which models the concept graph topology by means of matrix factorization. By comparing our model with a state-of-the-art wikification method, using a sample of Wikipedia articles, we obtained a gain up to 13% in F1 metric. We also provide a comprehensive analysis of the model performance showing the importance of the latent predictor component and the attributes derived from the associations between the concepts. The study still includes the analysis of the impact of ambiguous concepts, which allows us to conclude the model is resilient to ambiguity, even though does not include any explicitly disambiguation phase. We finally study the impact of selecting training samples from specific content quality classes, an information that is available in some respositories, such as Wikipedia. We empirically shown that the quality of the training samples impact on precision and overlinking, when comparing training performed using random quality samples versus high quality samples. / Atualmente, informações de referência são disponibilizadas através de repositórios de documentos semanticamente ligados, criados de forma colaborativa e com acesso livre na Web. Entre os muitos problemas enfrentados pelos provedores de conteúdo desses repositórios, destaca-se a Wikification, isto é, a inclusão de links nos artigos desses repositórios. Esses links possibilitam a navegação pelos artigos e permitem ao usuário um aprofundamento semântico do conteúdo. A Wikification é uma tarefa complexa, uma vez que o crescimento contínuo de tais repositórios resulta em um esforço cada vez maior dos editores. Como consequência, eles têm seu foco desviado da criação de conteúdo, que deveria ser o seu principal objetivo. Isso tem motivado o desenvolvimento de ferramentas de Wikification automática que, tradicionalmente, abordam dois problemas distintos: (a) como identificar que palavras (ou frases) em um artigo deveriam ser selecionados como texto de âncora e (b) como determinar para que artigos o link, associado ao texto de âncora, deveria apontar. A maioria dos métodos na literatura que abordam esses problemas usam aprendizado de máquina. Eles tentam capturar, através de atributos estatísticos, características dos conceitos e seus links. Embora essas estratégias tratam o repositório como um grafo de conceitos, normalmente elas pouco exploram a estrutura topológica do grafo, uma vez que se limitam a descrevê-lo por meio de atributos estatísticos dos links, projetados por especialistas humanos. Embora tais métodos sejam eficazes, novos modelos poderiam tirar mais proveito da topologia se a descrevessem por meio de abordagens orientados a dados, tais como a fatoração matricial. De fato, essa abordagem tem sido aplicada com sucesso em outros domínios como recomendação de filmes. Neste trabalho, propomos um modelo de previsão para Wikification que combina a força dos previsores tradicionais baseados em atributos estatísticos, projetados por seres humanos, com um componente de previsão latente, que modela a topologia do grafo de conceitos usando fatoração matricial. Ao comparar nosso modelo com o estado-da-arte em Wikification, usando uma amostra de artigos Wikipédia, observamos um ganho de até 13% em F1. Além disso, fornecemos uma análise detalhada do desempenho do modelo enfatizando a importância do componente de previsão latente e dos atributos derivados dos links entre os conceitos. Também analisamos o impacto de conceitos ambíguos, o que permite concluir que nosso modelo se porta bem mesmo diante de ambiguidade, apesar de não tratar explicitamente este problema. Ainda realizamos um estudo sobre o impacto da seleção das amostras de treino conforme a qualidade dos seus conteúdos, uma informação disponível em alguns repositórios, tais como a Wikipédia. Nós observamos que o treino com documentos de alta qualidade melhora a precisão do método, minimizando o uso de links desnecessários.
20

Qualificando autores em um processo aberto para editoração de artigos / A open process for edition and review of articles implemented over Mediawiki

Simões, Gabriel da Silva January 2008 (has links)
AWeb 2.0 coloca em evidência iniciativas que valorizam atividades comunitárias, colaborativas e democráticas. Os processos de filtragem e seleção de artigos para publicação científica caminham na contra-mão destes novos conceitos. A seleção de artigos para publicação, tanto em conferências quanto em periódicos, utiliza abordagens fechadas. O objetivo deste processo fechado é garantir que somente artigos de qualidade sejam publicados. Por outro lado, devido a falta de transparência, o processo fechado está sujeito a uma infinidade de problemas que podem surgir através de equívocos ou até mesmo de tendências anti-éticas. Constam na literatura vários exemplos de problemas com o processo de seleção fechado. Com a consolidação daWeb 2.0, ambientes abertos de edição de conteúdo conquistam cada vez mais espaço. Aproveitam contribuições espontâneas de usuários para crescer rapidamente. A aplicação do processo de edição utilizado por estes ambientes em um contexto de edição e revisão de artigos científicos pode modificar radicalmente o processo utilizado atualmente. Por outro lado, por estarem sujeitos ao acesso de usuários não comprometidos, ambientes abertos não apresentam fortes argumentos para estabelecer confiança entre usuários. Este trabalho apresenta um método dinâmico para indicação de pontos de qualificação aplicado em um protótipo desenvolvido para editoração de artigos. O protótipo segue um processo onde todas as etapas que envolvem edição, revisão e comentários dos artigos são abertas e transparentes. As qualificações indicadas pelo método são geradas a partir de dados quantitativos e qualitativos e são utilizadas para gerar um ranking de qualificação dos usuários. Este ranking tem o objetivo de contribuir para o estabelecimento de confiança entre usuários. / Web 2.0 evidence initiatives over communitarian, collaborative and democratic activities. The filtering processes for selection of papers for scientific publication goes against these new concepts. The selection of paper for publications in conferences and periodics uses closed review. The objective of this closed process is to guarantee the quality of these published papers. On the other hand, the closed process has transparency lack. It is subject to a infinity of problems that can even appear through mistakes or of anti-ethics trends. Some examples of problems with the closed process consists in literature. The consolidation of Web 2.0 brings more attention to open content edition environments. These environments use spontaneous user’s contributions to enlarge quickly. The application of the process used by open content edition environments can strongly change the currently closed process used to selection of scientific publications. On the other hand, the open process is subject to fake or not compromised users. This problem starts a lack of trust for unknown users. This work presents a method for qualification points generation applied in a prototype for edition and review of articles that extends MediaWiki, the Wikipedia’s environment. The prototype implements a process where all steps of edition, comment and review of articles are open. To complete lacks of trust between users, the prototype uses a dynamic qualification method. The qualifications indicated by this method are based in quantitative and qualitative data and the users are listed in a ranking ordered by best ratings.

Page generated in 0.0382 seconds