• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Context-aware worker selection for efficient quality control in crowdsourcing / Sélection des travailleurs attentifs au contexte pour un contrôle efficace de la qualité en externalisation à grande échelle

Awwad, Tarek 13 December 2018 (has links)
Le crowdsourcing est une technique qui permet de recueillir une large quantité de données d'une manière rapide et peu onéreuse. Néanmoins, La disparité comportementale et de performances des "workers" d’une part et la variété en termes de contenu et de présentation des tâches par ailleurs influent considérablement sur la qualité des contributions recueillies. Par conséquent, garder leur légitimité impose aux plateformes de crowdsourcing de se doter de mécanismes permettant l’obtention de réponses fiables et de qualité dans un délai et avec un budget optimisé. Dans cette thèse, nous proposons CAWS (Context AwareWorker Selection), une méthode de contrôle de la qualité des contributions dans le crowdsourcing visant à optimiser le délai de réponse et le coût des campagnes. CAWS se compose de deux phases, une phase d’apprentissage opérant hors-ligne et pendant laquelle les tâches de l’historique sont regroupées de manière homogène sous forme de clusters. Pour chaque cluster, un profil type optimisant la qualité des réponses aux tâches le composant, est inféré ; la seconde phase permet à l’arrivée d’une nouvelle tâche de sélectionner les meilleurs workers connectés pour y répondre. Il s’agit des workers dont le profil présente une forte similarité avec le profil type du cluster de tâches, duquel la tâche nouvellement créée est la plus proche. La seconde contribution de la thèse est de proposer un jeu de données, appelé CrowdED (Crowdsourcing Evaluation Dataset), ayant les propriétés requises pour, d’une part, tester les performances de CAWS et les comparer aux méthodes concurrentes et d’autre part, pour tester et comparer l’impact des différentes méthodes de catégorisation des tâches de l’historique (c-à-d, la méthode de vectorisation et l’algorithme de clustering utilisé) sur la qualité du résultat, tout en utilisant un jeu de tâches unique (obtenu par échantillonnage), respectant les contraintes budgétaires et gardant les propriétés de validité en terme de dimension. En outre, CrowdED rend possible la comparaison de méthodes de contrôle de qualité quelle que soient leurs catégories, du fait du respect d’un cahier des charges lors de sa constitution. Les résultats de l’évaluation de CAWS en utilisant CrowdED comparés aux méthodes concurrentes basées sur la sélection de workers, donnent des résultats meilleurs, surtout en cas de contraintes temporelles et budgétaires fortes. Les expérimentations réalisées avec un historique structuré en catégories donnent des résultats comparables à des jeux de données où les taches sont volontairement regroupées de manière homogène. La dernière contribution de la thèse est un outil appelé CREX (CReate Enrich eXtend) dont le rôle est de permettre la création, l’extension ou l’enrichissement de jeux de données destinés à tester des méthodes de crowdsourcing. Il propose des modules extensibles de vectorisation, de clusterisation et d’échantillonnages et permet une génération automatique d’une campagne de crowdsourcing. / Crowdsourcing has proved its ability to address large scale data collection tasks at a low cost and in a short time. However, due to the dependence on unknown workers, the quality of the crowdsourcing process is questionable and must be controlled. Indeed, maintaining the efficiency of crowdsourcing requires the time and cost overhead related to this quality control to stay low. Current quality control techniques suffer from high time and budget overheads and from their dependency on prior knowledge about individual workers. In this thesis, we address these limitation by proposing the CAWS (Context-Aware Worker Selection) method which operates in two phases: in an offline phase, the correlations between the worker declarative profiles and the task types are learned. Then, in an online phase, the learned profile models are used to select the most reliable online workers for the incoming tasks depending on their types. Using declarative profiles helps eliminate any probing process, which reduces the time and the budget while maintaining the crowdsourcing quality. In order to evaluate CAWS, we introduce an information-rich dataset called CrowdED (Crowdsourcing Evaluation Dataset). The generation of CrowdED relies on a constrained sampling approach that allows to produce a dataset which respects the requester budget and type constraints. Through its generality and richness, CrowdED helps also in plugging the benchmarking gap present in the crowdsourcing community. Using CrowdED, we evaluate the performance of CAWS in terms of the quality, the time and the budget gain. Results shows that automatic grouping is able to achieve a learning quality similar to job-based grouping, and that CAWS is able to outperform the state-of-the-art profile-based worker selection when it comes to quality, especially when strong budget ant time constraints exist. Finally, we propose CREX (CReate Enrich eXtend) which provides the tools to select and sample input tasks and to automatically generate custom crowdsourcing campaign sites in order to extend and enrich CrowdED.
2

Past, present, and future boreal forest productivity across North America : from eddy covariance observations to long-term model simulations over 1901–2100

Qu, Bo 08 1900 (has links)
Le changement climatique modifie rapidement la composition, la structure et le fonctionnement de la forêt boréale. Des simulations robustes de la productivité primaire brute (PPB) de la forêt boréale avec des modèles de biosphère terrestre (MBT) sont essentielles pour prédire la force des sources de puits de carbone dans les régions arctiques-boréales. Les mesures de covariance des turbulences fournissent des données précieuses pour l’analyse et l'affinement des MBT. Dans cette thèse, j'ai organisé un ensemble de données d'analyse de modèles pour les forêts boréales d'Amérique du Nord en compilant et harmonisant les données de flux de covariance des turbulences (les flux de dioxyde de carbone, d'eau et d'énergie) et les mesures environnementales (données météorologiques) sur huit peuplements forestiers matures (> 70 ans) représentatifs des différentes caractéristiques de peuplements, de climat et de conditions de pergélisol du biome boréal. L’ensemble de données a été utilisée dans une étude de cas pour paramétrer, forcer et évaluer le schéma canadien de surface terrestre incluant les cycles biogéochimiques (CLASSIC, version 1.3), le MBT de la suite canadienne de modèles du climat et de système terrestre. L'étude de cas a démontré l'utilité de l'ensemble de données et a fourni des lignes directrices pour l’amélioration du modèle CLASSIC. Ensuite, j'ai affiné le taux de carboxylation maximal (Vcmax), l'un des paramètres les plus importants du modèle de photosynthèse, pour les principaux types fonctionnels des plantes boréales (TFP) en utilisant une approche d'optimisation bayésienne. L'optimisation a amélioré les performances de la modélisation du PPB et de l'évapotranspiration. Enfin, avec la nouvelle paramétrisation de CLASSIC, j'ai simulé la PBB de la forêt boréale dans des peuplements forestiers de 1901 à 2100 à partir de données de forçage météorologique soigneusement ajustées en fonction des biais. Les changements dans la PBB annuelle simulée ont été quantifiés et étudiés en lien avec plusieurs contrôles environnementaux biotiques et abiotiques importants. Les simulations long terme ont révélé une augmentation du PBB annuel simulé dans tous les peuplements forestiers au cours des 200 ans. La PPB annuelle simulée dans les peuplements forestiers démontre une variation temporelle considérable des taux de changement du passé, au présent, jusqu'au futur. Les changements du début de la saison de croissance constituaient un contrôle environnemental central de la PPB annuelle simulée dans tous les peuplements forestiers du passé au présent. Il a été identifié que la température de l’air devenait plus importante pour la simulation des PBB annuelles que la durée de la saison de croissance dans le futur. Au cours du 21e siècle, l’augmentation du réchauffement, le dégel du pergélisol associé et les changements dans l’humidité du sol et la dynamique thermique étaient des mécanismes sous-jacents importants pour expliquer ces changements. Ma thèse de doctorat a permis d’identifier les opportunités d’analyses et d’affinement des modèles de biosphère terrestre en lien avec une base de données unique construite dans le cadre de cette thèse. Cette base de données a permis de fournir une nouvelle paramétrisation Vcmax au niveau de différentes TFP dans les modèles et fournir un aperçu de la productivité à long terme de la forêt boréale dans le biome boréal d’Amérique du Nord. / Climate change is rapidly altering boreal forest composition, structure, and functioning. Robust simulations of boreal forest gross primary productivity (GPP) with terrestrial biosphere models (TBMs) are critical for predicting carbon sink-source strength in Arctic-boreal regions. Eddy covariance measurements provide valuable data for benchmarking and refining TBMs. In this thesis, I curated a model benchmarking dataset for North America’s boreal forests by compiling and harmonizing eddy covariance flux (i.e., carbon dioxide, water, and energy fluxes) and supporting environmental measurements (i.e., meteorology) over eight mature forest stands (>70 years old) representative of different stand characteristics, climate, and permafrost conditions in the boreal biome. The dataset was used in a case study to parameterize, force, and evaluate the Canadian Land Surface Scheme Including biogeochemical Cycles (CLASSIC, version 1.3), the TBM of the Canadian suite of climate and Earth system models. The case study demonstrated the utility of the dataset and provided guidelines for further model refinement in CLASSIC. Next, I refined the maximum carboxylation rate at 25 °C (Vcmax25), one of the most important parameters in the photosynthesis model in CLASSIC, for representative boreal plant functional types (PFTs) using a Bayesian optimization approach. The refined PFT-level Vcmax25 yielded improved model performance for GPP and evapotranspiration. Last, I simulated boreal forest GPP in forest stands from 1901 to 2100 with CLASSIC, parameterized using the refined PFT-level Vcmax25. To reduce the uncertainty, daily meteorological forcing data from global historical reanalyses and regional climate projections were downscaled and bias-adjusted for forest stands using a multivariate bias correction algorithm. Changes in simulated annual GPP were quantified in trends and investigated with respect to several important biotic and abiotic environmental controls using a random forest approach. Long-term simulations revealed an increase in simulated annual GPP in all forest stands over the 200 years. However, simulated annual GPP in forest stands was characterized by considerable temporal variation in rates of changes from the past, over the present, to the future. Significant reductions in annual GPP were simulated in forest stands below the southern limit of permafrost during the mid-20th century. During the 21st century, all forest stands were simulated with significant increases in annual GPP. Further analyses show that the start of the growing season was a critical environmental control of simulated annual GPP in all forest stands from the past to the present. However, air temperature would become an important environmental control of simulated annual GPP in the future, showing an importance comparable to or even greater than that of the start of the growing season by the end of the 21st century. Enhanced warming, permafrost thaw, and changes in soil moisture and temperature were important for explaining the changes in simulated annual GPP over the 200 years. My PhD study provides a model benchmarking dataset for benchmarking and refining TBMs, and provides important suggestions for PFT-level Vcmax parameterizations in boreal forests. My long-term simulations reveal that boreal forest GPP in response to climate change had differential changes in different climate and permafrost zones during the 20th and 21st centuries, closely associated with differential changes in soil environment (e.g., soil thermal dynamics).

Page generated in 0.0805 seconds