• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Open data locale : acteurs, pratiques et dispositifs / Local open data : stakeholders, practices and tools

Rahme, Patricia 16 September 2016 (has links)
Cette étude sur les projets open data dans les collectivités locales vise à associer, dans une approche globale, les modes de production et de collecte de données, les méthodes de diffusion et les dispositifs utilisés, et enfin les modèles d’usage des données publiques numériques. Partant de l’hypothèse que l’open data donne lieu à une nouvelle distribution des rôles des acteurs impliqués tout au long du processus d’ouverture, nous avons distingué un positionnement dynamique des acteurs qui ne se limite pas à une étape du processus d’ouverture des données - que ce soit de réflexion, production, de diffusion, de promotion ou d’usage - ce qui crée un système mixte d’open data. L’étude du système d’offre des collectivités nous a amené à considérer son adéquation avec les besoins des utilisateurs. Nous avons montré que malgré les efforts de créer un système multi-acteur, la mise en oeuvre de l’identification et de la collecte des données est éclectique et instable et ne construit pas un processus solide de l’Open data. Malgré l’urgence suggérée par le contexte politique et sociétal, l’ouverture et le choix des données sont généralement déterminés par des considérations pragmatiques qui imposent une ouverture lente mais progressive sans prétendre à l’exhaustivité.Il s’agit aussi d’examiner les plateformes open data considérées comme des « dispositifs socio-techniques » émergeants du web social dans leurs aspects de médiations, partage, collaboration et de coproduction de données. Dans ce cadre, nos observations nous permettent de mettre en exergue, de questionner et d’analyser les plateformes open data dont leur architecture principale nous amènent à les qualifier «dispositifs socio-techniques ». Ils sont des outils sociaux car ils donnent lieu à des formes d’action. Autour d’un catalogue de jeux de données, il subsiste des espaces virtuels, des blogs, des forums d’interactions entre les producteurs et les réutilisateurs des données ouvertes. / The main purpose of this survey is to explore the process of implementation of open data projects at the local level. The main challenge in realization of any open data project is the engagement of different stakeholders. In this respect, we distinguish a dynamic positioning of stakeholders not limited to one stage of the process - whether during the first phase of reflections before launching the project, the data production, dissemination, promotion or use - creating a mixed system of open data. The study of data offer on open data platforms led us to consider its appropriateness to the needs of users. We have shown that despite the efforts to create a multi-player system, the implementation, identification and data collection is eclectic and unstable and not building a solid process of Open Data. Despite the urgency suggested by the political and societal context, openness and choice of data are generally determined by pragmatic considerations that impose a slow but gradual opening without claiming to be exhaustive. By analyzing open data platforms, this leads us to qualify them as "socio-technical tools" emerging from the social web in their aspects of mediation, sharing, collaboration and co-production data. They are social tools because they give rise to forms of action. Around a catalog of data sets, there are still virtual spaces, blogs, forums of interaction between producers and re-users of open data.
2

Publish-Time Data Integration for Open Data Platforms

Eberius, Julian, Damme, Patrick, Braunschweig, Katrin, Thiele, Maik, Lehner, Wolfgang 16 September 2022 (has links)
Platforms for publication and collaborative management of data, such as Data.gov or Google Fusion Tables, are a new trend on the web. They manage very large corpora of datasets, but often lack an integrated schema, ontology, or even just common publication standards. This results in inconsistent names for attributes of the same meaning, which constrains the discovery of relationships between datasets as well as their reusability. Existing data integration techniques focus on reuse-time, i.e., they are applied when a user wants to combine a specific set of datasets or integrate them with an existing database. In contrast, this paper investigates a novel method of data integration at publish-time, where the publisher is provided with suggestions on how to integrate the new dataset with the corpus as a whole, without resorting to a manually created mediated schema or ontology for the platform. We propose data-driven algorithms that propose alternative attribute names for a newly published dataset based on attribute- and instance statistics maintained on the corpus. We evaluate the proposed algorithms using real-world corpora based on the Open Data Platform opendata.socrata.com and relational data extracted from Wikipedia. We report on the system's response time, and on the results of an extensive crowdsourcing-based evaluation of the quality of the generated attribute names alternatives.

Page generated in 0.0674 seconds