• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

La mobilité occupationnelle entre pères et fils au Québec et en Ontario, 1852-1881

Torres Cantor, Catalina 11 1900 (has links)
Marquée par la mise en place et par le développement graduel d’importantes transformations de type socioéconomique et démographique, la deuxième moitié du 19e siècle constitue le scénario à partir duquel nous analysons et comparons le phénomène de la mobilité sociale intergénérationnelle au Québec et en Ontario, plus précisément dans la période 1852-1881. Grâce à la disponibilité de bases de microdonnées censitaires largement représentatives de la population qui habitait dans chacune de ces deux provinces en 1852 et en 1881 ainsi qu’au développement récent d’une technique de jumelage automatique, nous avons réussi à obtenir un échantillon de 4226 individus jumelés entre les recensements canadiens de 1852 et de 1881. Ces individus sont les garçons âgés de 0 à 15 ans en 1852, qui habitaient majoritairement en milieu rural au Québec ou en Ontario et qui se trouvent dans l’échantillon de 20% du recensement canadien de 1852. Cet échantillon jumelé nous a permis d’observer les caractéristiques de la famille d’origine de ces garçons en 1852 – par exemple, le statut socioprofessionnel du père et la fréquentation scolaire – ainsi que leur propre statut socioprofessionnel (en tant qu’adultes) en 1881. Malgré certains défis posés par la disponibilité et le type de données ainsi que par la procédure de jumelage, cet échantillon illustre bien les changements majeurs qui ont eu lieu durant la période étudiée dans le marché du travail, soit le déclin du groupe des cultivateurs au profit des travailleurs non-manuels et des travailleurs manuels (surtout les qualifiés). De plus, cet échantillon nous a permis d’identifier que malgré le déclin du groupe des cultivateurs entre les pères (en 1852) et les fils (en 1881), l’agriculture aurait continué à être importante durant cette période et aurait même été ouverte à des individus ayant des origines socioprofessionnelles ou socioéconomiques différentes, c'est-à-dire, à des fils de non-cultivateurs. Cette importance soutenue et cette ouverture de l’agriculture semble avoir été plus importante en Ontario qu’au Québec, ce qui pourrait être associé aux différences entre les provinces en ce qui a trait aux caractéristiques et au développement du secteur agricole entre 1852 et 1881. / Marked by the gradual development of important socioeconomic and demographic transformations, the second half of the 19th century constitutes the context of our analyses of the intergenerational social mobility in the provinces of Ontario and Quebec, specially focusing on the period 1852-1881. Taking advantage of the availability of census microdata databases – which are to a great extent representative of the population residing in those two provinces in 1852 and in 1881 – as well as of the development of a recent technique of automatic linkage, we used a sample of 4226 individuals who were linked between the Canadian censuses of 1852 and 1881. Those individuals are boys aged 0 to 15 years in 1852, who lived mainly in a rural area in Ontario or in Quebec and who are included in the 20% Canadian census sample of 1852. From this linked sample we could observe the characteristics of the family of origin in 1852 – e.g. the occupational status of the father and the boy’s school attendance – as well as the subject’s own occupational status as an adult in 1881. Despite some challenges posed by the availability and the type of the data as well as by the linking procedure, this sample illustrates quite well the transformations of the labour market that took place during the period of the study, notably the decline of the occupational group of the farmers in favour of the non-manual and manual skilled workers. Nevertheless, despite the decline in the proportion of farmers among sons (in 1881) compared to their fathers (in 1852), using this linked sample we discovered that agriculture continued to play an important role in economic activity and that this sector was even open to individuals with different occupational or socioeconomic backgrounds, i.e. to sons of non-farmer fathers. The sustained importance and openness of the agricultural sector seems to have been more important in Ontario than in Quebec. This difference could be associated with the contrasts between those two provinces regarding the characteristics and the development of the agricultural sector during the second half of the 19th century.
2

Automatic key discovery for Data Linking / Découverte des clés pour le Liage de Données

Symeonidou, Danai 09 October 2014 (has links)
Dans les dernières années, le Web de données a connu une croissance fulgurante arrivant à un grand nombre des triples RDF. Un des objectifs les plus importants des applications RDF est l’intégration de données décrites dans les différents jeux de données RDF et la création des liens sémantiques entre eux. Ces liens expriment des correspondances sémantiques entre les entités d’ontologies ou entre les données. Parmi les différents types de liens sémantiques qui peuvent être établis, les liens d’identité expriment le fait que différentes ressources réfèrent au même objet du monde réel. Le nombre de liens d’identité déclaré reste souvent faible si on le compare au volume des données disponibles. Plusieurs approches de liage de données déduisent des liens d’identité en utilisant des clés. Une clé représente un ensemble de propriétés qui identifie de façon unique chaque ressource décrite par les données. Néanmoins, dans la plupart des jeux de données publiés sur le Web, les clés ne sont pas disponibles et leur déclaration peut être difficile, même pour un expert.L’objectif de cette thèse est d’étudier le problème de la découverte automatique de clés dans des sources de données RDF et de proposer de nouvelles approches efficaces pour résoudre ce problème. Les données publiées sur le Web sont général volumineuses, incomplètes, et peuvent contenir des informations erronées ou des doublons. Aussi, nous nous sommes focalisés sur la définition d’approches capables de découvrir des clés dans de tels jeux de données. Par conséquent, nous nous focalisons sur le développement d’approches de découverte de clés capables de gérer des jeux de données contenant des informations nombreuses, incomplètes ou erronées. Notre objectif est de découvrir autant de clés que possible, même celles qui sont valides uniquement dans des sous-ensembles de données.Nous introduisons tout d’abord KD2R, une approche qui permet la découverte automatique de clés composites dans des jeux de données RDF pour lesquels l’hypothèse du nom Unique est respectée. Ces données peuvent être conformées à des ontologies différentes. Pour faire face à l’incomplétude des données, KD2R propose deux heuristiques qui per- mettent de faire des hypothèses différentes sur les informations éventuellement absentes. Cependant, cette approche est difficilement applicable pour des sources de données de grande taille. Aussi, nous avons développé une seconde approche, SAKey, qui exploite différentes techniques de filtrage et d’élagage. De plus, SAKey permet à l’utilisateur de découvrir des clés dans des jeux de données qui contiennent des données erronées ou des doublons. Plus précisément, SAKey découvre des clés, appelées "almost keys", pour lesquelles un nombre d’exceptions est toléré. / In the recent years, the Web of Data has increased significantly, containing a huge number of RDF triples. Integrating data described in different RDF datasets and creating semantic links among them, has become one of the most important goals of RDF applications. These links express semantic correspondences between ontology entities or data. Among the different kinds of semantic links that can be established, identity links express that different resources refer to the same real world entity. By comparing the number of resources published on the Web with the number of identity links, one can observe that the goal of building a Web of data is still not accomplished. Several data linking approaches infer identity links using keys. Nevertheless, in most datasets published on the Web, the keys are not available and it can be difficult, even for an expert, to declare them.The aim of this thesis is to study the problem of automatic key discovery in RDF data and to propose new efficient approaches to tackle this problem. Data published on the Web are usually created automatically, thus may contain erroneous information, duplicates or may be incomplete. Therefore, we focus on developing key discovery approaches that can handle datasets with numerous, incomplete or erroneous information. Our objective is to discover as many keys as possible, even ones that are valid in subparts of the data.We first introduce KD2R, an approach that allows the automatic discovery of composite keys in RDF datasets that may conform to different schemas. KD2R is able to treat datasets that may be incomplete and for which the Unique Name Assumption is fulfilled. To deal with the incompleteness of data, KD2R proposes two heuristics that offer different interpretations for the absence of data. KD2R uses pruning techniques to reduce the search space. However, this approach is overwhelmed by the huge amount of data found on the Web. Thus, we present our second approach, SAKey, which is able to scale in very large datasets by using effective filtering and pruning techniques. Moreover, SAKey is capable of discovering keys in datasets where erroneous data or duplicates may exist. More precisely, the notion of almost keys is proposed to describe sets of properties that are not keys due to few exceptions.

Page generated in 0.0875 seconds