Spelling suggestions: "subject:"wikipedia""
21 |
Um trabalho a troco de nada? a experiência das comunidades on-line de produção do software gnome e da wikipédia lusófona, à luz da teoria da dádiva.Aguiar, Vicente Macedo de 04 November 2016 (has links)
Submitted by Núcleo de Pós-Graduação Administração (npgadm@ufba.br) on 2017-08-01T19:47:48Z
No. of bitstreams: 1
Vicente Aguiar.pdf: 3999867 bytes, checksum: 015359700650e02e9bc4c0c6ed1d33ae (MD5) / Approved for entry into archive by Maria Angela Dortas (dortas@ufba.br) on 2017-08-03T20:56:25Z (GMT) No. of bitstreams: 1
Vicente Aguiar.pdf: 3999867 bytes, checksum: 015359700650e02e9bc4c0c6ed1d33ae (MD5) / Made available in DSpace on 2017-08-03T20:56:25Z (GMT). No. of bitstreams: 1
Vicente Aguiar.pdf: 3999867 bytes, checksum: 015359700650e02e9bc4c0c6ed1d33ae (MD5) / Esta tese examina as especificidades da natureza do trabalho realizado por indivíduos que participam de duas comunidades on-line voltadas à produção de bens na contemporaneidade: a do software livre para ambientes de desktop, denominado de GNOME; e aquela da versão em português da enciclopédia livre Wikipédia, também conhecida como Wikipédia Lusófona. Indo além dos limites analíticos ligados ao utilitarismo econômico, buscou-se entender como o trabalho compartilhado por esses indivíduos – que nesta tese são denominados de hackers e wikipedistas – impacta na viabilidade de um processo de produção por pares e na manifestação de um sistema de dádiva na contemporaneidade. Para isso, adotando um método de imersão etnográfica de forma adaptada a esse universo digital, esta tese procurou, num primeiro momento, caracterizar o processo de produção por pares, aberto e não mercantil de cada uma dessas duas comunidades. A partir dessa análise organizacional, buscou-se descrever a natureza, a ética e a cultura do trabalho adotado pelos hackers e wikipedistas em cada uma desses projetos e os impactos dessa lógica de trabalho no entendimento de um sistema de dádiva entre estranhos que é mediado pelos liames digitais da Internet. Para aprofundar ainda mais esse processo de investigação qualitativa, identificou-se como esse fenômeno da dádiva entre hackers e wikipedistas contribui para ampliação do entendimento sobre ambos os projetos de produção por pares na Internet, por meio da compreensão de uma dinâmica social de governança e relações de poder simbólico. Como resultado, é possível afirmar que a opção pelo exame desse tipo de fenômeno à luz da teoria da dádiva, em especial aquela que se manifesta entre estranhos na contemporaneidade, revelou alto grau de inteligibilidade. Afinal, o trabalho empreendido no seio dessas duas comunidades é melhor compreendido quando associado à força da “regra de ouro”, que nas sociedades antigas era traduzida pela tripla ação de “dar, receber e retribuir”, mas que, na atual sociedade em rede, parece ter sido sutilmente adequada para a tripla ação de “acessar, contribuir e compartilhar”. Foi possível então constatar que esse sistema de dádivas entre estranhos, além de ser tecido e mediado pela Internet, pode viabilizar organizações globais que, na prática, vão muito além da livre produção e distribuição de bens: elas viabilizam relações e vínculos entre pessoas de diferentes partes do mundo que não brotariam na aridez do utilitarismo de mercado. / This thesis examines the specific nature of the work performed by individuals who participate in two Commons-based Peer Production on-line communities: the free software desktop environment GNOME; and the Portuguese version of the free encyclopedia Wikipédia, also known as Lusophone Wikipédia. Going beyond the analytical limits linked to economic utilitarianism, we aimed to understand how the work shared by these individuals — who in this thesis are called hackers and Wikipédians — impacts on the viability of a peer production process and in the manifestation of a gift system in the contemporary times. To achieve this goal, adopting a form of ethnographic immersion method adapted to this digital universe, this thesis sought for, at first, to characterize the open and non-marked-based peer production process of each of these two communities. From this organizational analysis, we attempted to describe the nature, ethics and work culture adopted by hackers and Wikipédians in each of these projects and the impacts of this work ethic in the understanding of a gift system between strangers, which is mediated by the digital bonds of the Internet. To go deeper into this qualitative research process, it was identified how this donation phenomenon between hackers and Wikipédians helps to expand the understanding of each of those peer production projects on the Internet, through the understanding of the social dynamic of their governance and power relationships that are non-utilitarian, or more precisely, of symbolic nature. As a result, one can say that the choice of taking this kind of phenomenon under the light of the gift theory, specially the one that manifests itself among strangers in modernity, revealed a high degree of intelligibility. After all, the work undertaken within these two communities is best understood when associated with the strength of this "golden rule", which in ancient societies was translated into the triple action of "give, take, and give back". However, in the current network society, it seems to have been subtly suitable to the triple actions of "access, contribute, and share". It was possible to see that this gift system between strangers, beyond being woven and mediated through the Internet, can make global organizations that, in practice, go much beyond the free production and distribution of goods, feasible: they make relationships and links between people from different parts of the world that would not come about in the aridity of the utilitarian market, possible.
|
22 |
Descoberta de cross-language links ausentes na wikipédia / Identifying missing cross-language links in wikipediaMoreira, Carlos Eduardo Manzoni January 2014 (has links)
A Wikipédia é uma enciclopédia pública composta por milhões de artigos editados diariamente por uma comunidade de autores de diferentes regiões do mundo. Os artigos que constituem a Wikipédia possuem um tipo de link chamado de Cross-language Link que relaciona artigos correspondentes em idiomas diferentes. O objetivo principal dessa estrutura é permitir a navegação dos usuários por diferentes versões de um mesmo artigo em busca da informação desejada. Além disso, por permitir a obtenção de corpora comparáveis, os Cross-language Links são extremamente importantes para aplicações que trabalham com tradução automática e recuperação de informações multilíngues. Visto que os Cross-language Links são inseridos manualmente pelos autores dos artigos, quando o autor não reconhece o seu correspondente em determinado idioma ocorre uma situação de Cross-language Links ausente. Sendo assim, é importante o desenvolvimento de uma abordagem que realize a descoberta de Cross-language Links entre artigos que são correspondentes, porém, não estão conectados por esse tipo link. Nesta dissertação, é apresentado o CLLFinder, uma abordagem para a descoberta de Cross-language Links ausentes. A nossa abordagem utiliza o relacionamento entre as categorias e a indexação e consulta do conteúdo dos artigos para realizar a seleção do conjunto de candidatos. Para a identificação do artigo correspondente, são utilizados atributos que exploram a transitividade de Cross-language Links entre outros idiomas bem como características textuais dos artigos. Os resultados demonstram a criação de um conjunto de candidatos com 84,3% de presença do artigo correspondente, superando o trabalho utilizado como baseline. A avaliação experimental com mais de dois milhões de pares de artigos aponta uma precisão de 99,2% e uma revocação geral de 78,9%, superando, também, o baseline. Uma inspeção manual dos resultados do CLLFinder aplicado em um cenário real indica que 73,6% dos novos Cross-language Links sugeridos pela nossa abordagem eram de fato correspondentes. / Wikipedia is a public encyclopedia composed of millions of articles written daily by volunteer authors from different regions of the world. The articles contain links called Cross-language Links which relate corresponding articles across different languages. This feature is extremely useful for applications that work with automatic translation and multilingual information retrieval as it allows the assembly of comparable corpora. Since these links are created manually, in many occasions, the authors fail to do so. Thus, it is important to have a mechanism that automatically creates such links. This has been motivating the development of techniques to identify missing cross-language links. In this work, we present CLLFinder, an approach for finding missing cross-language links. The approach makes use of the links between categories and an index of the content of the articles to select candidates. In order to identify corresponding articles, the method uses the transitivity between existing cross-language links in other languages as well as textual features extracted from the articles. Experiments on over two million pairs of articles from the English and Portuguese Wikipedias show that our approach has a recall of 78.9% and a precision of 99.2%, outperforming the baseline system.A manual inspection of the results of CLLFinder applied to a real situation indicates that our approach was able to identify the Cross-language Link correctly 73.6% of the time.
|
23 |
Qualificando autores em um processo aberto para editoração de artigos / A open process for edition and review of articles implemented over MediawikiSimões, Gabriel da Silva January 2008 (has links)
AWeb 2.0 coloca em evidência iniciativas que valorizam atividades comunitárias, colaborativas e democráticas. Os processos de filtragem e seleção de artigos para publicação científica caminham na contra-mão destes novos conceitos. A seleção de artigos para publicação, tanto em conferências quanto em periódicos, utiliza abordagens fechadas. O objetivo deste processo fechado é garantir que somente artigos de qualidade sejam publicados. Por outro lado, devido a falta de transparência, o processo fechado está sujeito a uma infinidade de problemas que podem surgir através de equívocos ou até mesmo de tendências anti-éticas. Constam na literatura vários exemplos de problemas com o processo de seleção fechado. Com a consolidação daWeb 2.0, ambientes abertos de edição de conteúdo conquistam cada vez mais espaço. Aproveitam contribuições espontâneas de usuários para crescer rapidamente. A aplicação do processo de edição utilizado por estes ambientes em um contexto de edição e revisão de artigos científicos pode modificar radicalmente o processo utilizado atualmente. Por outro lado, por estarem sujeitos ao acesso de usuários não comprometidos, ambientes abertos não apresentam fortes argumentos para estabelecer confiança entre usuários. Este trabalho apresenta um método dinâmico para indicação de pontos de qualificação aplicado em um protótipo desenvolvido para editoração de artigos. O protótipo segue um processo onde todas as etapas que envolvem edição, revisão e comentários dos artigos são abertas e transparentes. As qualificações indicadas pelo método são geradas a partir de dados quantitativos e qualitativos e são utilizadas para gerar um ranking de qualificação dos usuários. Este ranking tem o objetivo de contribuir para o estabelecimento de confiança entre usuários. / Web 2.0 evidence initiatives over communitarian, collaborative and democratic activities. The filtering processes for selection of papers for scientific publication goes against these new concepts. The selection of paper for publications in conferences and periodics uses closed review. The objective of this closed process is to guarantee the quality of these published papers. On the other hand, the closed process has transparency lack. It is subject to a infinity of problems that can even appear through mistakes or of anti-ethics trends. Some examples of problems with the closed process consists in literature. The consolidation of Web 2.0 brings more attention to open content edition environments. These environments use spontaneous user’s contributions to enlarge quickly. The application of the process used by open content edition environments can strongly change the currently closed process used to selection of scientific publications. On the other hand, the open process is subject to fake or not compromised users. This problem starts a lack of trust for unknown users. This work presents a method for qualification points generation applied in a prototype for edition and review of articles that extends MediaWiki, the Wikipedia’s environment. The prototype implements a process where all steps of edition, comment and review of articles are open. To complete lacks of trust between users, the prototype uses a dynamic qualification method. The qualifications indicated by this method are based in quantitative and qualitative data and the users are listed in a ranking ordered by best ratings.
|
24 |
Descoberta de cross-language links ausentes na wikipédia / Identifying missing cross-language links in wikipediaMoreira, Carlos Eduardo Manzoni January 2014 (has links)
A Wikipédia é uma enciclopédia pública composta por milhões de artigos editados diariamente por uma comunidade de autores de diferentes regiões do mundo. Os artigos que constituem a Wikipédia possuem um tipo de link chamado de Cross-language Link que relaciona artigos correspondentes em idiomas diferentes. O objetivo principal dessa estrutura é permitir a navegação dos usuários por diferentes versões de um mesmo artigo em busca da informação desejada. Além disso, por permitir a obtenção de corpora comparáveis, os Cross-language Links são extremamente importantes para aplicações que trabalham com tradução automática e recuperação de informações multilíngues. Visto que os Cross-language Links são inseridos manualmente pelos autores dos artigos, quando o autor não reconhece o seu correspondente em determinado idioma ocorre uma situação de Cross-language Links ausente. Sendo assim, é importante o desenvolvimento de uma abordagem que realize a descoberta de Cross-language Links entre artigos que são correspondentes, porém, não estão conectados por esse tipo link. Nesta dissertação, é apresentado o CLLFinder, uma abordagem para a descoberta de Cross-language Links ausentes. A nossa abordagem utiliza o relacionamento entre as categorias e a indexação e consulta do conteúdo dos artigos para realizar a seleção do conjunto de candidatos. Para a identificação do artigo correspondente, são utilizados atributos que exploram a transitividade de Cross-language Links entre outros idiomas bem como características textuais dos artigos. Os resultados demonstram a criação de um conjunto de candidatos com 84,3% de presença do artigo correspondente, superando o trabalho utilizado como baseline. A avaliação experimental com mais de dois milhões de pares de artigos aponta uma precisão de 99,2% e uma revocação geral de 78,9%, superando, também, o baseline. Uma inspeção manual dos resultados do CLLFinder aplicado em um cenário real indica que 73,6% dos novos Cross-language Links sugeridos pela nossa abordagem eram de fato correspondentes. / Wikipedia is a public encyclopedia composed of millions of articles written daily by volunteer authors from different regions of the world. The articles contain links called Cross-language Links which relate corresponding articles across different languages. This feature is extremely useful for applications that work with automatic translation and multilingual information retrieval as it allows the assembly of comparable corpora. Since these links are created manually, in many occasions, the authors fail to do so. Thus, it is important to have a mechanism that automatically creates such links. This has been motivating the development of techniques to identify missing cross-language links. In this work, we present CLLFinder, an approach for finding missing cross-language links. The approach makes use of the links between categories and an index of the content of the articles to select candidates. In order to identify corresponding articles, the method uses the transitivity between existing cross-language links in other languages as well as textual features extracted from the articles. Experiments on over two million pairs of articles from the English and Portuguese Wikipedias show that our approach has a recall of 78.9% and a precision of 99.2%, outperforming the baseline system.A manual inspection of the results of CLLFinder applied to a real situation indicates that our approach was able to identify the Cross-language Link correctly 73.6% of the time.
|
25 |
Qualificando autores em um processo aberto para editoração de artigos / A open process for edition and review of articles implemented over MediawikiSimões, Gabriel da Silva January 2008 (has links)
AWeb 2.0 coloca em evidência iniciativas que valorizam atividades comunitárias, colaborativas e democráticas. Os processos de filtragem e seleção de artigos para publicação científica caminham na contra-mão destes novos conceitos. A seleção de artigos para publicação, tanto em conferências quanto em periódicos, utiliza abordagens fechadas. O objetivo deste processo fechado é garantir que somente artigos de qualidade sejam publicados. Por outro lado, devido a falta de transparência, o processo fechado está sujeito a uma infinidade de problemas que podem surgir através de equívocos ou até mesmo de tendências anti-éticas. Constam na literatura vários exemplos de problemas com o processo de seleção fechado. Com a consolidação daWeb 2.0, ambientes abertos de edição de conteúdo conquistam cada vez mais espaço. Aproveitam contribuições espontâneas de usuários para crescer rapidamente. A aplicação do processo de edição utilizado por estes ambientes em um contexto de edição e revisão de artigos científicos pode modificar radicalmente o processo utilizado atualmente. Por outro lado, por estarem sujeitos ao acesso de usuários não comprometidos, ambientes abertos não apresentam fortes argumentos para estabelecer confiança entre usuários. Este trabalho apresenta um método dinâmico para indicação de pontos de qualificação aplicado em um protótipo desenvolvido para editoração de artigos. O protótipo segue um processo onde todas as etapas que envolvem edição, revisão e comentários dos artigos são abertas e transparentes. As qualificações indicadas pelo método são geradas a partir de dados quantitativos e qualitativos e são utilizadas para gerar um ranking de qualificação dos usuários. Este ranking tem o objetivo de contribuir para o estabelecimento de confiança entre usuários. / Web 2.0 evidence initiatives over communitarian, collaborative and democratic activities. The filtering processes for selection of papers for scientific publication goes against these new concepts. The selection of paper for publications in conferences and periodics uses closed review. The objective of this closed process is to guarantee the quality of these published papers. On the other hand, the closed process has transparency lack. It is subject to a infinity of problems that can even appear through mistakes or of anti-ethics trends. Some examples of problems with the closed process consists in literature. The consolidation of Web 2.0 brings more attention to open content edition environments. These environments use spontaneous user’s contributions to enlarge quickly. The application of the process used by open content edition environments can strongly change the currently closed process used to selection of scientific publications. On the other hand, the open process is subject to fake or not compromised users. This problem starts a lack of trust for unknown users. This work presents a method for qualification points generation applied in a prototype for edition and review of articles that extends MediaWiki, the Wikipedia’s environment. The prototype implements a process where all steps of edition, comment and review of articles are open. To complete lacks of trust between users, the prototype uses a dynamic qualification method. The qualifications indicated by this method are based in quantitative and qualitative data and the users are listed in a ranking ordered by best ratings.
|
26 |
Descoberta de cross-language links ausentes na wikipédia / Identifying missing cross-language links in wikipediaMoreira, Carlos Eduardo Manzoni January 2014 (has links)
A Wikipédia é uma enciclopédia pública composta por milhões de artigos editados diariamente por uma comunidade de autores de diferentes regiões do mundo. Os artigos que constituem a Wikipédia possuem um tipo de link chamado de Cross-language Link que relaciona artigos correspondentes em idiomas diferentes. O objetivo principal dessa estrutura é permitir a navegação dos usuários por diferentes versões de um mesmo artigo em busca da informação desejada. Além disso, por permitir a obtenção de corpora comparáveis, os Cross-language Links são extremamente importantes para aplicações que trabalham com tradução automática e recuperação de informações multilíngues. Visto que os Cross-language Links são inseridos manualmente pelos autores dos artigos, quando o autor não reconhece o seu correspondente em determinado idioma ocorre uma situação de Cross-language Links ausente. Sendo assim, é importante o desenvolvimento de uma abordagem que realize a descoberta de Cross-language Links entre artigos que são correspondentes, porém, não estão conectados por esse tipo link. Nesta dissertação, é apresentado o CLLFinder, uma abordagem para a descoberta de Cross-language Links ausentes. A nossa abordagem utiliza o relacionamento entre as categorias e a indexação e consulta do conteúdo dos artigos para realizar a seleção do conjunto de candidatos. Para a identificação do artigo correspondente, são utilizados atributos que exploram a transitividade de Cross-language Links entre outros idiomas bem como características textuais dos artigos. Os resultados demonstram a criação de um conjunto de candidatos com 84,3% de presença do artigo correspondente, superando o trabalho utilizado como baseline. A avaliação experimental com mais de dois milhões de pares de artigos aponta uma precisão de 99,2% e uma revocação geral de 78,9%, superando, também, o baseline. Uma inspeção manual dos resultados do CLLFinder aplicado em um cenário real indica que 73,6% dos novos Cross-language Links sugeridos pela nossa abordagem eram de fato correspondentes. / Wikipedia is a public encyclopedia composed of millions of articles written daily by volunteer authors from different regions of the world. The articles contain links called Cross-language Links which relate corresponding articles across different languages. This feature is extremely useful for applications that work with automatic translation and multilingual information retrieval as it allows the assembly of comparable corpora. Since these links are created manually, in many occasions, the authors fail to do so. Thus, it is important to have a mechanism that automatically creates such links. This has been motivating the development of techniques to identify missing cross-language links. In this work, we present CLLFinder, an approach for finding missing cross-language links. The approach makes use of the links between categories and an index of the content of the articles to select candidates. In order to identify corresponding articles, the method uses the transitivity between existing cross-language links in other languages as well as textual features extracted from the articles. Experiments on over two million pairs of articles from the English and Portuguese Wikipedias show that our approach has a recall of 78.9% and a precision of 99.2%, outperforming the baseline system.A manual inspection of the results of CLLFinder applied to a real situation indicates that our approach was able to identify the Cross-language Link correctly 73.6% of the time.
|
27 |
A máquina do dissenso : a Wikipédia como espaço de conhecimento na cibercultura / Machine of dissent : cyberculture and knowledge building in the WikipediaSoares, Tiago Chagas, 1978- 22 August 2018 (has links)
Orientador: Rafael de Almeida Evangelista / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-22T16:29:54Z (GMT). No. of bitstreams: 1
Soares_TiagoChagas_M.pdf: 2422826 bytes, checksum: 889396d6a8ba374d58f1154859ba6192 (MD5)
Previous issue date: 2013 / Resumo: Nas primeiras décadas do século XXI, a Wikipédia aparenta desenhar-se como a mais popular e lida enciclopédia do mundo. Descentralizada, construída colaborativamente, e utilizando-se de expedientes técnicos e editoriais abertos, a Wikipédia é considerada um dos mais emblemáticos e bem sucedidos produtos do universo de práticas e ideologias conformado sob o projeto ao qual é dado o nome Cibercultura. A pesquisa proposta na dissertação em questão relaciona, a partir do levantamento histórico e crítico dos movimentos históricos a marcarem a Cibercultura, o funcionamento do projeto personificado na Wikipédia e seu papel na consolidação do ideal cibercultural no universo da cultura e da produção do conhecimento / Abstract: In the first decades of the 21st century, Wikipedia seems to be the most widely read and popular encyclopedia in the world. Decentralized, built collaboratively, and using open editorial and technical expedients, Wikipedia is considered one of the most iconic and successful products of the universe of practices and ideologies built under the project to which is given the name Cyberculture. The research here presented examines the historical events that culminated on the development of Cyberculture, mapping its relations to the project embodied in Wikipedia and the role of Wikipedia in consolidating the cybercultural ideal within spaces of culture and knowledge / Mestrado / Divulgação Científica e Cultural / Mestre em Divulgação Científica e Cultural
|
28 |
La détection automatique multilingue d’énoncés biaisés dans WikipédiaAleksandrova, Desislava 11 1900 (has links)
Nous proposons une méthode multilingue pour l'extraction de phrases biaisées de Wikipédia, et l'utilisons pour créer des corpus en bulgare, en français et en anglais. En parcourant l'historique des révisions des articles, nous cherchons ceux qui, à un moment donné, avaient été considérés en violation de la politique de neutralité de Wikipédia (et corrigés par la suite). Pour chacun de ces articles, nous récupérons la révision signalée comme biaisée et la révision qui semble avoir corrigé le biais. Ensuite, nous extrayons les phrases qui ont été supprimées ou réécrites dans cette révision. Cette approche permet d'obtenir suffisamment de données même dans le cas de Wikipédias relativement petites, comme celle en bulgare, où de 62 000 articles nous avons extrait 5 000 phrases biaisées. Nous évaluons notre méthode en annotant manuellement 520 phrases pour le bulgare et le français, et 744 pour l'anglais. Nous évaluons le niveau de bruit, ses sources et analysons les formes d’expression de biais. Enfin, nous utilisons les données pour entrainer et évaluer la performance d’algorithmes de classification bien connus afin d’estimer la qualité et le potentiel des corpus. / We propose a multilingual method for the extraction of biased sentences from Wikipedia, and use it to create corpora in Bulgarian, French and English. Sifting through the revision history of the articles that at some point had been considered biased and later corrected, we retrieve the last tagged and the first untagged revisions as the before/after snapshots of what was deemed a violation of Wikipedia’s neutral point of view policy. We extract the sentences that were removed or rewritten in that edit. The approach yields sufficient data even in the case of relatively small Wikipedias, such as the Bulgarian one, where 62k articles produced 5 thousand biased sentences. We evaluate our method by manually annotating 520 sentences for Bulgarian and French, and 744 for English. We assess the level of noise and analyze its sources. Finally, we exploit the data with well-known classification methods to detect biased sentences.
|
29 |
Online cooperation and peer production / Coopération en ligne et production par les pairsHergueux, Jérôme 12 June 2014 (has links)
Des logiciels Open Source à Wikipédia, la production par les pairs mobilise des centaines de milliers de contributeurs de par le monde. C’est une source importante de création de valeur dans les secteurs très compétitifs de l’information et de la technologie, ainsi qu’une source majeure d’innovation. Au-delà même de son importance économique, l’émergence de la production par les pairs représente une opportunité d’éclairer un certain nombre de questions anciennes et particulièrement ardues dans la littérature d’un jour nouveau. Compte-tenu de la nature souvent non conventionnelle des incitations au travail dans les environnements de production par les pairs, ceux-ci sont particulièrement adaptés à l’étude de l’impact des préférences économiques non standard sur la production de biens publics, à l’analyse de leur rôle en tant que motivations au travail, ainsi qu’à l’évaluation de leurs conséquences en termes d’économie organisationnelle.Ce travail de thèse s'appuie sur un outil d’expérimentation en ligne original (développé et évalué dans le chapitre 1) pour combiner expériences en ligne à large échelle et méthodes computationnelles (i.e. l’extraction systématique de données sur le comportement de terrain des sujets) afin de (i) mener le tout premier test de terrain exhaustif de la théorie de la production privée de biens publics, (ii) étudier l’importance des préférences sociales en tant que motivations au travail au sein d’organisations productives réelles et (iii) procéder aux premiers tests de terrain documentant des comportements endogènes d’appariement des agents économiques au sein d’équipes productives en fonction de leur type coopératif. / From Open Source Software to Wikipedia, peer production involves hundreds of thousands of contributors worldwide. It is an important source of value creation in the most competitive sectors of information and technology, as well as a major source of innovation. Beyond its economic significance, the emergence of peer production also represents an opportunity to shed new lights on a number of longstanding but notably difficult questions in the literature. Given the unconventional nature of many of the work incentives at play in peer production environments, those are particularly well suited for researching the impact of non standard economic preferences on public goods provision, studying their role as work incentives, and assessing their consequences in terms of organizational economics.This Ph.D. work leverages a novel online experimentation tool (developed and assessed in Chapter 1) to combine large-scale online experiments and computational methods (i.e. the systematic extraction of data on subjects’ field behavior) to respectively (i) provide the first comprehensive field test of the theory of the private provision of public goods, (ii) study the importance of social preferences as work motives within real-world productive organizations and(iii) report the first field evidence of endogenous sorting behavior of economic agents within productive teams based on their cooperative types.
|
30 |
Coreference resolution with and for WikipediaGhaddar, Abbas 06 1900 (has links)
Wikipédia est une ressource embarquée dans de nombreuses applications du traite-
ment des langues naturelles. Pourtant, aucune étude à notre connaissance n’a tenté de
mesurer la qualité de résolution de coréférence dans les textes de Wikipédia, une étape
préliminaire à la compréhension de textes. La première partie de ce mémoire consiste à
construire un corpus de coréférence en anglais, construit uniquement à partir des articles
de Wikipédia. Les mentions sont étiquetées par des informations syntaxiques et séman-
tiques, avec lorsque cela est possible un lien vers les entités FreeBase équivalentes. Le
but est de créer un corpus équilibré regroupant des articles de divers sujets et tailles.
Notre schéma d’annotation est similaire à celui suivi dans le projet OntoNotes. Dans la
deuxième partie, nous allons mesurer la qualité des systèmes de détection de coréférence
à l’état de l’art sur une tâche simple consistant à mesurer les mentions du concept décrit
dans une page Wikipédia (p. ex : les mentions du président Obama dans la page Wiki-
pédia dédiée à cette personne). Nous tenterons d’améliorer ces performances en faisant
usage le plus possible des informations disponibles dans Wikipédia (catégories, redi-
rects, infoboxes, etc.) et Freebase (information du genre, du nombre, type de relations
avec autres entités, etc.). / Wikipedia is a resource of choice exploited in many NLP applications, yet we are
not aware of recent attempts to adapt coreference resolution to this resource, a prelim-
inary step to understand Wikipedia texts. The first part of this master thesis is to build
an English coreference corpus, where all documents are from the English version of
Wikipedia. We annotated each markable with coreference type, mention type and the
equivalent Freebase topic. Our corpus has no restriction on the topics of the documents
being annotated, and documents of various sizes have been considered for annotation.
Our annotation scheme follows the one of OntoNotes with a few disparities. In part two,
we propose a testbed for evaluating coreference systems in a simple task of measuring
the particulars of the concept described in a Wikipedia page (eg. The statements of Pres-
ident Obama the Wikipedia page dedicated to that person). We show that by exploiting
the Wikipedia markup (categories, redirects, infoboxes, etc.) of a document, as well
as links to external knowledge bases such as Freebase (information of the type, num-
ber, type of relationship with other entities, etc.), we can acquire useful information on
entities that helps to classify mentions as coreferent or not.
|
Page generated in 0.0293 seconds