• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 155
  • 59
  • 33
  • Tagged with
  • 240
  • 240
  • 127
  • 123
  • 50
  • 48
  • 32
  • 28
  • 27
  • 26
  • 23
  • 23
  • 22
  • 20
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
191

Towards better privacy preservation by detecting personal events in photos shared within online social networks / Vers une meilleure protection de la vie privée par la détection d'événements dans les photos partagées sur les réseaux sociaux

Raad, Eliana 04 December 2015 (has links)
De nos jours, les réseaux sociaux ont considérablement changé la façon dont les personnes prennent des photos qu’importe le lieu, le moment, le contexte. Plus que 500 millions de photos sont partagées chaque jour sur les réseaux sociaux, auxquelles on peut ajouter les 200 millions de vidéos échangées en ligne chaque minute. Plus particulièrement, avec la démocratisation des smartphones, les utilisateurs de réseaux sociaux partagent instantanément les photos qu’ils prennent lors des divers événements de leur vie, leurs voyages, leurs aventures, etc. Partager ce type de données présente un danger pour la vie privée des utilisateurs et les expose ensuite à une surveillance grandissante. Ajouté à cela, aujourd’hui de nouvelles techniques permettent de combiner les données provenant de plusieurs sources entre elles de façon jamais possible auparavant. Cependant, la plupart des utilisateurs des réseaux sociaux ne se rendent même pas compte de la quantité incroyable de données très personnelles que les photos peuvent renfermer sur eux et sur leurs activités (par exemple, le cas du cyberharcèlement). Cela peut encore rendre plus difficile la possibilité de garder l’anonymat sur Internet dans de nombreuses situations où une certaine discrétion est essentielle (politique, lutte contre la fraude, critiques diverses, etc.).Ainsi, le but de ce travail est de fournir une mesure de protection de la vie privée, visant à identifier la quantité d’information qui permettrait de ré-identifier une personne en utilisant ses informations personnelles accessibles en ligne. Premièrement, nous fournissons un framework capable de mesurer le risque éventuel de ré-identification des personnes et d’assainir les documents multimédias destinés à être publiés et partagés. Deuxièmement, nous proposons une nouvelle approche pour enrichir le profil de l’utilisateur dont on souhaite préserver l’anonymat. Pour cela, nous exploitons les évènements personnels à partir des publications des utilisateurs et celles partagées par leurs contacts sur leur réseau social. Plus précisément, notre approche permet de détecter et lier les évènements élémentaires des personnes en utilisant les photos (et leurs métadonnées) partagées au sein de leur réseau social. Nous décrivons les expérimentations que nous avons menées sur des jeux de données réelles et synthétiques. Les résultats montrent l’efficacité de nos différentes contributions. / Today, social networking has considerably changed why people are taking pictures all the time everywhere they go. More than 500 million photos are uploaded and shared every day, along with more than 200 hours of videos every minute. More particularly, with the ubiquity of smartphones, social network users are now taking photos of events in their lives, travels, experiences, etc. and instantly uploading them online. Such public data sharing puts at risk the users’ privacy and expose them to a surveillance that is growing at a very rapid rate. Furthermore, new techniques are used today to extract publicly shared data and combine it with other data in ways never before thought possible. However, social networks users do not realize the wealth of information gathered from image data and which could be used to track all their activities at every moment (e.g., the case of cyberstalking). Therefore, in many situations (such as politics, fraud fighting and cultural critics, etc.), it becomes extremely hard to maintain individuals’ anonymity when the authors of the published data need to remain anonymous.Thus, the aim of this work is to provide a privacy-preserving constraint (de-linkability) to bound the amount of information that can be used to re-identify individuals using online profile information. Firstly, we provide a framework able to quantify the re-identification threat and sanitize multimedia documents to be published and shared. Secondly, we propose a new approach to enrich the profile information of the individuals to protect. Therefore, we exploit personal events in the individuals’ own posts as well as those shared by their friends/contacts. Specifically, our approach is able to detect and link users’ elementary events using photos (and related metadata) shared within their online social networks. A prototype has been implemented and several experiments have been conducted in this work to validate our different contributions.
192

Résultats et simulation en spectroscopie γ des noyaux déformés : cas des noyaux isomériques et tétraédriques / Results and simulations on γ-spectroscopy of deformed nuclei : cases of isomers and tetrahedral nuclei

Vancraeyenest, Aurélie 25 October 2010 (has links)
Le travail présenté dans ce manuscrit regroupe deux études de spectroscopie γ. La première concerne les isomères des noyaux de néodyme autour de N=82. Ces noyaux, lorsqu’ils sont étudiés par des modèles de type Cranked-Nilsson-Strutinsky, présentent des états énergétiquement favorisés. Ils sont autant de candidats pour la recherche d’isomères de spin. Expérimentalement, un certain nombre d’états isomériques ont déjà été observés dans les noyaux de 138,139,140Nd sur lesquels porte cette étude. Afin de mieux caractériser ces états, une expérience a été menée en août 2009 à Jyväskylä auprès de l’ensemble de détection JUROGAM-RITU-GREAT. La réaction de fusion-évaporation 48Ca + 76Zr 144Nd* réalisée avec une cible mince a permis de produire majoritairement les noyaux 139,140Nd. Les noyaux produits, transportés au plan focal par le spectromètre RITU, sont implantés et le rayonnement émis par la décroissance des isomères est ensuite recueilli par l’ensemble de détection GREAT. Nous développerons l’analyse complète de cette expérience et nous montrerons les résultats émergents. Nous avons, par exemple, pu montrer l’alimentation du niveau 20+ de 140Nd ainsi que le placement énergétique du niveau isomérique du noyau 139Nd. La deuxième partie de ce travail s’articule autour de la recherche de la symétrie tétraédrique dans le noyau 156Gd. Cela a consisté à la fois en un travail de spectroscopie γ des bandes de parité positive de ce noyau, laquelle a fait émerger un certain nombre de nouvelles transitions. Le deuxième volet de cette étude consistait à simuler dans l’environnement ROOT - GEANT4 le seuil d’observation des signaux faibles avec le détecteur de rayonnements γ de nouvelle génération AGATA / Major part of this work is about the realization and complete analysis of an experiment for study of isomeric states in 138,139,140Nd nuclei. This was performed at Jyväskylä laboratory (Finland) using a fusion-evaporation reaction with 48Ca beam on a thin 96Zr target. Experimental setup consisted in the target position gamma ray detector JUROGAM II which was coupled with the RITU recoil separator and the GREAT focal plane detector array. This particularly well adapted setup permit to manage γ spectroscopy of the interest nuclei around isomeric states. Indeed, we used prompt-delayed matrix to separate rays that come onto isomeric states and these who decay from them. Then, correlations between the two components permit to establish feeding transitions of isomeric states. During this experiment, a new isomeric state was also highlighted in 139Nd with spin 23/2+, which was predicted and interpreted in Cranked-Nilsson-Strutinsky calculation. Finally, very clean time spectra allow to determine precisely life-time of four states in four nuclei. This PhD is also made of a part of analyze on experimental search for fingerprints of tetrahedral symmetry in 156Gd using high fold gamma ray spectroscopy. Thanks to a large number of triple coincidence events, we managed a detailed spectroscopy of this nucleus. Particularly, we found out 13 new transitions in positive parity bands. As a complement of this work, we have done GEANT4 simulations about the detection limit of weak intensity transitions by AGATA multidetector. Indeed, tetrahedral symmetry predicts vanishing of E2 transitions at lower spin states and simulations permit to determine observation limit of these transitions with different version of AGATA
193

Détection directe de matière noire avec l’expérience EDELWEISS-III : étude des signaux induits par le piégeage de charges, analyse de données et caractérisation de la sensibilité des détecteurs cryogéniques aux WIMPs de basse masse / Direct detection of dark matter with the EDELWEISS-III experiment : signals induced by charge trapping, data analysis and characterization of cryogenic detector sensitivity to low-mass WIMPs

Arnaud, Quentin 02 November 2015 (has links)
L'expérience EDELWEISS-III est dédiée à la détection directe de matière noire sous forme de WIMPs. Ces particules massives devraient constituer plus de 80% de la masse de l'univers et être détectables via leur diffusion élastique sur un noyau de l'absorbeur d'un détecteur. Le taux d'événements WIMPs attendu étant très faible (<1/kg/an) , une méthode de double mesure chaleur/ionisation est réalisée afin de discriminer les reculs électroniques issus du fond et , des reculs nucléaires engendrés par les neutrons et WIMPs. Le travail de thèse a consisté en l'étude des signaux induits par le piégeage de charges. Un modèle analytique de son impact sur les signaux des voies ionisation et chaleur est présenté. Les prédictions du modèle, confortées par leur accord avec les données et une simulation numérique, ont donné lieu à diverses applications : amélioration des résolutions, sensibilité à la profondeur des dépôts d'énergie, caractérisation du piégeage de charges dans les cristaux. L'analyse des données du Run308 est détaillée et les résultats interprétés en terme de limite d'exclusion. Cette analyse a mis au jour la présence d'un bruit de fond neutron limitant pour la recherche de WIMPs de haute masse (>20GeV). La dernière partie est consacrée à une étude de l'optimisation des détecteurs cryogéniques aux WIMPs de basse masse. Ce travail, réalisée via un test statistique de rapport de vraisemblance profilé, a permis d'étudier l'influence des divers paramètres expérimentaux sur le potentiel d'exclusion. Les conclusions de cette analyse, conjointement aux résultats du Run308, ont mené l'expérience EDELWEISS à privilégier la recherche de WIMPs de basse masse (<20GeV) / The EDELWEISS-III experiment is dedicated to direct dark matter searches aiming at detecting WIMPS. These massive particles should account for more than 80% of the mass of the Universe and be detectable through their elastic scattering on nuclei constituting the absorber of a detector. As the expected WIMP event rate is extremely low (<1/kg/year), a double measurement heat/ionization is performed to discriminate electronic recoils originating from _ and backgrounds and nuclear recoils induced by neutrons and WIMPs. The first part of the thesis work consisted in studying the signals induced by charge carrier trapping. An analytical model of its impact on both ionization and heat signals is presented. The model predictions, through their agreement with both data and a numerical simulation, lead to various applications : improvement of the resolutions, statistical sensitivity to energy deposit depths, characterization of trapping within the crystals. The analysis of the Run308 data is detailed and its results are interpreted in terms of an exclusion limit on the WIMP-nucleon cross section (SI). This study brings to light the presence of a limiting neutron background for high mass WIMP searches (>20GeV). Finally, a study dedicated to the optimization of solid cryogenic detectors to low mass WIMP searches is presented. This study is performed on simulated data using a statistical test based on a profiled likelihood ratio that allows for statistical background subtraction and spectral shape discrimination. This study combined with results from Run308, has lead the EDELWEISS experiment to favor low mass WIMP searches (<20GeV)
194

Recherche de déformation dans des noyaux riches en neutrons / Search for deformation in neutron rich nuclei

Mancuso, Clément 04 July 2016 (has links)
Actuellement, le noyau de l'atome sert dans diverses utilisations courantes. Pourtant, notre compréhension que de cet objet n'est pas complète. C'est pourquoi la recherche nucléaire est nécessaire. Parmi cet ensemble vaste, ce manuscrit s'intéresse à l'étude des changements de forme dans les isotopes riches en neutrons des séries Ru et Sr. Le sujet est d'abord cerné dans un chapitre de concepts théoriques de la physique nucléaire. Un second chapitre décrit l'expérience permettant de produire les isotopes d'intérêt. Cette expérience de spectroscopie gamma est réalisée avec un multidétecteur HPGe composé à partir d'EXOGAM et complété de cristaux GASP et LOHENGRIN. Cette expérience consiste en la fission du 241Pu induite par neutrons froids fournis par le réacteur de l'Institut Laue Langevin. Elle fait partie de la campagne EXILL. Le deuxième chapitre traite également de la pré-analyse des données. Après avoir montré les effets d'une pré-sélection des événements en multiplicité, les résultats obtenus concernant les isotopes 108Ru à 115Ru, et 92Sr à 96Sr sont abordés dans le troisième chapitre. Enfin, le quatrième chapitre replace ces résultats dans des ensembles plus larges des parties riches en neutrons des deux séries. Ces séries sont également replacées dans le contexte de leur région de masse.La région d'intérêt est riche en changement de forme, avec l'enrichissement neutronique ou avec l'excitation des noyaux. Ces changements sont plutôt bien décrits par certains modèles, mais ces derniers peinent encore à en décrire les limites. Leurs déterminations précises est essentielle pour contraindre les modèles / Nowadays, the atomic nucleus is used in a variety of common way. Nevertheless, this object is not fully understood yet. This is why nuclear physics research is still needed. Among the large number of nuclear physics topics, this work is interested in the study of shape changes in neutron rich Ru and Sr isotopes. The subject is figured out in the first chapter, dealing with theoretical concepts about nuclear physics. A second chapter describes the experiment permitting to produce the isotopes of interest. This gamma-ray spectroscopy experiment has been realized with a HPGe multidetector made from EXOGAM and completed by GASP and LOHENGRIN detectors. This experiment consists of the cold neutron, supplied by the reactor of the Institute Laue Langevin, induced fission of 241Pu. This experiment is a part of the EXILL measurement campaign. The second chapter also deals with the data pre-analysis of this experiment. After showing the effects of a multiplicity cut on event preselection, the obtained results concerning 108Ru to 115Ru and 92Sr to 96Sr isotopes are presented on the third chapter. Finally, the fourth chapter puts these results in a wider part of the neutron rich side of both series. These last ones are also placed in their mass region context.The region of interest is rich in shape change, whether with neutronic enrichment or with excitation energy. These changes are rather well described by certain models, but the latter still have difficulty to describe the limits. Their precise determinations by experiment is essential to constrain models
195

Etude des réseaux de reconnaissance biomoléculaire à l'échelle atomique pour les systèmes ARN et ARN/protéines / Atomic-scale investigation of recognition networks in RNA and RNA/protein systems

D'Ascenzo, Luigi 29 September 2016 (has links)
Mis à part les liaisons hydrogène, d’autres interactions non covalentes participent dans les réseaux de reconnaissance ARN et ARN protéines. Parmi celles-ci, j’ai étudié les interactions oxygène-pi. Cette interaction prend la forme phosphate-pi dans les U turns et O4'-pi dans les motifs ARN-Z. Je propose une nouvelle classification des boucles de quatre nucléotides, décrivant les U turn et les Z turn à partir d’interactions oxygène-pi. De plus, les motifs "Z like" présents dans tous les ARN, sont aussi reconnus par certaines protéines immunologiques. Pour mieux comprendre les réseaux de reconnaissance biomoléculaire, nous avons examiné les interactions entre cations/anions et ARN. Nous avons trouvé de nombreuses erreurs dans les structures de la PDB et proposé des règles pour améliorer l'attribution d’espèces ioniques. Les résultats de cette thèse amélioreront notre connaissance des réseaux de reconnaissance biomoléculaire et aideront aux techniques de modélisation structurale des ARN. / Together with hydrogen bonds, uncommon non-covalent interactions are fundamental for recognition networks in RNA and RNA-protein systems. Among them, I focused on oxygen-pi stacking. This interaction takes the form of phosphate-pi within U-turns and of ribose O4’-pi within “Z-RNA” motifs. In that respect, a novel classification of tetraloops is proposed, defining U-turns and Z-turns based on their oxygen-pi stacking properties. Further, “Z-like” motifs are found to pervade small and large RNAs, being also a recognition pattern for immunology-related proteins. To better understand biomolecular recognition networks, we reviewed the binding of metal ions and anions within RNA, finding many examples of ions misattribution in PDB structures. We propose rules to avoid attribution errors. The results of this thesis will improve our knowledge and understanding of biomolecular recognition networks, as well as assist structural determination and structural modelling techniques of RNA systems.
196

Estimation du bénéfice de survie à partir de méta-analyse sur données individuelles et évaluation économique. / Estimation of the survival benefit from individual participant data meta-analysis and economic evaluation.

Lueza, Béranger 30 September 2016 (has links)
Le bénéfice de survie restreint à un horizon temporel donné a été proposé comme mesure alternative aux mesures relatives de l’effet d’un traitement notamment dans le cas de non proportionnalité des risques de décès. Le bénéfice de survie restreint correspond à la différence des survies moyennes entre deux bras de traitement et s’exprime en nombre d’années de vie gagnées. Dans la littérature, cette mesure est présentée comme plus intuitive que le hazard ratio et plusieurs auteurs ont proposé son utilisation pour le design et l’analyse d’un essai clinique. Toutefois, ce n’est pas actuellement la mesure qui est utilisée de manière courante dans les essais randomisés. Cette mesure s’applique quelle que soit la distribution des temps de survie et est adaptée si l’hypothèse des risques proportionnels n’est pas respectée. De plus, le bénéfice de survie restreint peut être utilisé en évaluation médico-économique où la mesure d’un effet absolu est nécessaire (nombre d’années de vie gagnées pondérées ou non par la qualité de vie). Si l’on souhaite estimer le bénéfice de survie restreint à partir d’une méta-analyse sur données individuelles, se pose alors la question de prendre en compte l’effet essai dû à la structure hiérarchique des données. L’objectif de cette thèse était de comparer des méthodes statistiques d’estimation du bénéfice de survie restreint à partir de données individuelles d’une méta-analyse d’essais cliniques randomisés. Le point de départ a été une étude de cas (étude coût-efficacité) réalisée à partir des données de la Meta-Analysis of Radiotherapy in Lung Cancer. Cette étude a montré que les cinq méthodes d’estimation étudiées conduisaient à des estimations différentes du bénéfice de survie et de son intervalle de confiance. Le choix de la méthode d’estimation avait également un impact sur les résultats de l’analyse coût-efficacité. Un second travail a consisté à mener une étude de simulation pour mieux comprendre les propriétés des méthodes d’estimation considérées en termes de biais moyen et d’erreur-type. Enfin, la dernière partie de la thèse a mis en application les enseignements de cette étude de simulation au travers de trois méta-analyses sur données individuelles dans le cancer du nasopharynx et dans le cancer du poumon à petites cellules. / The survival benefit restricted up to a certain time horizon has been suggested as an alternative measure to the common relative measures used to estimate the treatment effect, especially in case of non-proportional hazards of death. The restricted survival benefit corresponds to the difference of the two restricted mean survival times estimated for each treatment arm, and is expressed in terms of life years gained. In the literature, this measure is considered as more intuitive than the hazard ratio and many authors have suggested its use for the design and the analysis of clinical trials. However, it is not currently the most used measure in randomized trials. This measure is valid under any distribution of the survival times and is adapted if the proportional hazards assumption does not hold. In addition, the restricted survival benefit can be used in medico-economic evaluation where an absolute measure of the treatment effect is needed (number of [quality adjusted] life years gained). If one wants to estimate the restricted survival benefit from an individual participant data meta-analysis, there is a need to take into account the trial effect due to the hierarchical structure of the data. The aim of this thesis was to compare statistical methods to estimate the restricted survival benefit from an individual participant data meta-analysis of randomized trials. The starting point was a case study (cost-effectiveness analysis) using data from the Meta-Analysis of Radiotherapy in Lung Cancer. This study showed that the five investigated methods yielded different estimates for the restricted survival benefit and its confidence interval. The choice of a method to estimate the survival benefit also impacted on cost-effectiveness results. Our second project consisted in a simulation study to have a better understanding of the properties of the investigated methods in terms of bias and standard error. Finally, the last part of the thesis illustrated the lessons learned from the simulation study through three examples of individual participant data meta-analysis in nasopharynx cancer and in small cell lung cancer.
197

Analyse spatiale intrasite de l'habitat : méthodologie, procédures et études de cas : les sites protohistohistoriques de Bucy-le-Long "la Foselle" 'Aisne, Néolithique ancien), et de Changis-sur-Marne "les Pétreaux" (Seine-et-Marne, Âges du Bronze et du Fer) / Intra-site spatial analysis of settlement : analysis, procedures and case studies : protohistoric sites of Bucy-le-Long "la Fosselle" (Aisne, France, the Early Neolithic) and of Changis-sur-Marne "les Pétreaux" (Seine-et-Marne, France, the Bronze Age and the Iron Age)

Lemort, Sophie 23 November 2018 (has links)
L’analyse spatiale intrasite de l’habitat ne permet pas de recourir à un modèle général d’étude, applicable à n’importe quel site archéologique. Pourtant, plusieurs d’entre eux ont des profils semblables d’implantation de l’habitat. Peut-on donc envisager de rechercher des protocoles d’analyse qui soient transposables sur des sites d’habitat couramment rencontrés ? C’est l’objet de la présente étude à partir d’une démarche exploratoire, sur deux sites d’habitat protohistoriques. Sur le site rubané de Bucy-le-Long « la Fosselle », l’analyse se concentre sur la distribution spatiale des vestiges mobiliers au sein d’unités architecturales comparables. L’analyse des données est employée pour déterminer les différents paramètres d’étude. Le potentiel informatif des unités d’habitation, établi selon des critères morphologiques et taphonomiques, est évalué et confronté au potentiel archéologique, déterminé à partir de la richesse du mobilier et des différentes catégories d’artefacts. L’analyse globale intrasite est envisagée en regroupant les mobiliers par catégorie fonctionnelle et pour mettre en évidence des assemblages significatifs de vestiges selon les habitations. Ils permettent ainsi de caractériser et sectoriser les ensembles signifiants d’activités vivrières et d’activités techniques à l’échelle du site, à partir d’un partitionnement des maisons. Le site de Changis-sur-Marne « les Pétreaux » connaît une longue occupation du Bronze final à la Tène ancienne, ce qui rend la lecture des implantations difficiles à démêler. L’analyse spatiale est tout d’abord tentée sur des groupes de structures établies lors des travaux de terrain. Puis, la répartition du mobilier est étudiée à plusieurs échelles d’observation. Cependant, il apparaît que ces premiers découpages ne reflètent pas des groupements d’établissements ruraux significatifs. Un partitionnement des structures au sein d’entités spatiales plus restreintes est alors envisagé à partir de la recherche d’agrégats, mis en évidence par l’analyse spatiale de semis de points. La dynamique d’occupation du site est de ce fait plus aisément perceptible. Les deux études de cas sont pour finir confrontées à d’autres études spatiales menées sur des sites d’habitat. Il apparaît qu’aux côtés des vestiges mobiliers très régulièrement pris pour référence dans l’analyse spatiale intrasite de l’habitat, les vestiges immobiliers trouvent toutes leurs places. / Intra-site spatial analysis of settlement does not allow use of general model applicable to any archaeological site. However some items have similar habitat settlement profiles. Can we consider looking for protocols transposable to usual settlement sites? The purpose of this study is based on an exploratory approach, on two protohistoric settlements. On the Bandkeramik site of Bucy-le-Long "la Fosselle", the analysis focuses on spatial distribution of the material remains within comparable architectural units. Data analysis is used to determine different study parameters. The informative potential of housing units, established according to morphological and taphonomic criteria, is evaluated and compared with the archaeological potential, determined from the richness of the furniture and the different categories of artifacts. The global intra-site analysis is made by grouping the furniture by functional category, to highlight significant assemblages of vestiges according to the dwellings. They allow to characterize and to segment the significant sets of food and technical activities at the site scale, based on houses partitioning. The site of Changis-sur-Marne "les Pétreaux" having suffered a long occupation from the Late bronze to the Early la Tène period, lead to a difficult reading of the settlements. During excavation spatial analysis is tried on structures groups. Then, the distribution of furniture is studied at various observation scales. However, those first divisions do not reflect groups of obvious rural settlements. A partitioning of the structures within smaller spatial entities is then engaged starting from the search for aggregates, highlighted by the space-time hot spot analysis. The dynamic of occupation of the site is thus more easily perceptible. Two case studies are finally challenged with other spatial studies about settlement sites. In addition to the material remains commonly seen as reference in the intra-site spatial analysis of settlement, archaeological structures find all their places.
198

Apprentissage supervisé de données symboliques et l'adaptation aux données massives et distribuées / Supervised learning of Symbolic Data and adaptation to Big Data

Haddad, Raja 23 November 2016 (has links)
Cette thèse a pour but l'enrichissement des méthodes supervisées d'analyse de données symboliques et l'extension de ce domaine aux données volumineuses, dites "Big Data". Nous proposons à cette fin une méthode supervisée nommée HistSyr. HistSyr convertit automatiquement les variables continues en histogrammes les plus discriminants pour les classes d'individus. Nous proposons également une nouvelle méthode d'arbres de décision symbolique, dite SyrTree. SyrTree accepte tous plusieurs types de variables explicatives et à expliquer pour construire l'arbre de décision symbolique. Enfin, nous étendons HistSyr aux Big Data, en définissant une méthode distribuée nommée CloudHistSyr. CloudHistSyr utilise Map/Reduce pour créer les histogrammes les plus discriminants pour des données trop volumineuses pour HistSyr. Nous avons testé CloudHistSyr sur Amazon Web Services (AWS). Nous démontrons la scalabilité et l’efficacité de notre méthode sur des données simulées et sur les données expérimentales. Nous concluons sur l’utilité de CloudHistSyr qui , grâce à ses résultats, permet l'étude de données massives en utilisant les méthodes d'analyse symboliques existantes. / This Thesis proposes new supervised methods for Symbolic Data Analysis (SDA) and extends this domain to Big Data. We start by creating a supervised method called HistSyr that converts automatically continuous variables to the most discriminant histograms for classes of individuals. We also propose a new method of symbolic decision trees that we call SyrTree. SyrTree accepts many types of inputs and target variables and can use all symbolic variables describing the target to construct the decision tree. Finally, we extend HistSyr to Big Data, by creating a distributed method called CloudHistSyr. Using the Map/Reduce framework, CloudHistSyr creates of the most discriminant histograms for data too big for HistSyr. We tested CloudHistSyr on Amazon Web Services. We show the efficiency of our method on simulated data and on actual car traffic data in Nantes. We conclude on overall utility of CloudHistSyr which, through its results, allows the study of massive data using existing symbolic analysis methods.
199

Caractérisation différentielle de forums de discussion sur le VIH en vietnamien et en français : Éléments pour la fouille comportementale du web social / Differential characterization of discussion forums on HIV in Vietnamese and French : Elements for behaviour mining on the social web

Hô Dinh, Océane 22 December 2017 (has links)
Les discours normés que produisent les institutions sont concurrencés par les discours informels ou faiblement formalisés issus du web social. La démocratisation de la prise de parole redistribue l’autorité en matière de connaissance et modifie les processus de construction des savoirs. Ces discours spontanés sont accessibles par tous et dans des volumes exponentiels, ce qui offre aux sciences humaines et sociales de nouvelles possibilités d’exploration. Pourtant elles manquent encore de méthodologies pour appréhender ces données complexes et encore peu décrites. L’objectif de la thèse est de montrer dans quelle mesure les discours du web social peuvent compléter les discours institutionnels. Nous y développons une méthodologie de collecte et d’analyse adaptée aux spécificités des discours natifs du numérique (massivité, anonymat, volatilité, caractéristiques structurelles, etc.). Nous portons notre attention sur les forums de discussion comme environnements d’élaboration de ces discours et appliquons la méthodologie développée à une problématique sociale définie : celle de l’épidémie du VIH/SIDA au Viêt Nam. Ce terrain applicatif recouvre plusieurs enjeux de société : sanitaire et social, évolutions des moeurs, concurrence des discours. L’étude est complétée par l’analyse d’un corpus comparable de langue française, relevant des mêmes thématique, genre et discours que le corpus vietnamien, de manière à mettre en évidence les spécificités de contextes socioculturels distincts. / The standard discourse produced by official organisations is confronted with the unofficial or informal discourse of the social web. Empowering people to express themselves results in a new balance of authority, when it comes to knowledge and changes the way people learn. Social web discourse is available to each and everyone and its size is growing fast, which opens up new fields for both humanities and social sciences to investigate. The latter, however, are not equipped to engage with such complex and little-analysed data. The aim of this dissertation is to investigate how far social web discourse can help supplement official discourse. In it we set out a method to collect and analyse data that is in line with the characteristics of a digital environment, namely data size, anonymity, transience, structure. We focus on forums, where such discourse is built, and test our method on a specific social issue, ie the HIV/AIDS epidemic in Vietnam. This field of investigation encompasses several related questions that have to do with health, society, the evolution of morals, the mismatch between different kinds of discourse. Our study is also grounded in the analysis of a comparable French corpus dealing with the same topic, whose genre and discourse characteristics are equivalent to those of the Vietnamese one: this two-pronged research highlights the specific features of different socio-cultural environments.
200

Les mises en forme algorithmiques, ruptures et continuités dans la quantification du social

Lareau, Justine 08 1900 (has links)
Ce mémoire de maîtrise porte sur les algorithmes de « data mining » et de « machine learning », constitutifs d’un domaine que l’on appelle plus récemment la « science des données ». Pour essayer d’éclairer la portée et la spécificité des enjeux que leur usage soulève dans nos sociétés, il est proposé d’interroger le rapport qu’ils entretiennent avec les fondements et les limites des outils plus traditionnels de la statistique sociale/mathématique, bien documentés en sociologie, à l'égard notamment du « langage des variables » et du raisonnement expérimental « toutes choses égales par ailleurs ». En inscrivant l’approche au croisement de la sociologie de la connaissance et de la quantification, le cadre conceptuel s’inspire de l’épistémologie comparative de Gilles-Gaston Granger, de la « méta-épistémologie historique » de Ian Hacking et de la sociohistoire de la statistique sociale d’Alain Desrosières. Par l’idée de mises en forme algorithmique de la vie sociale, les algorithmes de calcul sont envisagés comme modes d’investigation, partiellement ou complètement automatisés, procédant à des mises en forme et en ordre plurielles et différenciées du social et de ses propriétés. À partir de données de Statistique Canada servant à étayer plus concrètement les formes de connaissances produites et les visées d’objets qu’elles délimitent en termes de possibilités et de contraintes d’expérience, la présente étude de cas entreprend d’examiner le clivage des méthodes « classiques » et « contemporaines » à l’intérieur du cadre supervisé de l’apprentissage. Pour ce faire, trois techniques/familles d’algorithmes sont comparées sous l’angle de leurs opérations d’analyse: 1) les méthodes de régression logistique, 2) les arbres de décision et 3) les forêts aléatoires. L’objectif de cette analyse sociologique théorique comme empirique est d’examiner comment ces approches opèrent certains modes de classification et facilitent ou défavorisent des représentations du monde et de l’individu. Le travail conduit plus généralement à ouvrir quelques pistes de réflexion quant aux rapports de compatibilité et d’incompatibilité des formes de raisonnement du style statistique et probabiliste avec certains états du développement de la sociologie. / This master's thesis focuses on data mining and machine learning algorithms, constituting a field more recently called “data science”. To try to shed light on the specificity of the issues they raise in our societies, it is proposed to question the relationship they maintain with the foundations and the limits of the more “classic” tools of mathematical statistics in sociology, with regard in particular to the “language of variables” and to the experimental reasoning “all other things being equal” (cetaris paribus). By placing the approach at the intersection of the sociology of knowledge and quantification, the conceptual framework is inspired by the comparative epistemology of Gilles-Gaston Granger (1920-2016), the historical meta-epistemology of Ian Hacking (1936-) and the sociohistory of social statistics by Alain Desrosières (1940-2013). Through the idea of “mises en forme algorithmique de la vie sociale”, computational algorithms are considered as partially or completely automated types of investigation, carrying out plural and differentiated of shaping and ordering of the social and its properties. Using data from Statistics Canada used to more concretely support the forms of knowledge produced as well as the possibilities and experience constraints that they define, this case study sets out to examine the divide between “classical” and more “contemporary” methods of analysis within the framework of “supervised” learning. To do this, three algorithm techniques (or families of algorithms) are compared from the angle of their knowledge operations: 1) logistic regressions, 2) decision trees and 3) random forests. The objective of this theoretical as well as empirical work is to examine how these approaches operate certain modes of classification, facilitate or disadvantage representations of the world and can also be performative in social activities. The research work more generally leads to opening up some avenues of reflection as to the compatibility and incompatibility relationships of the forms of reasoning of the statistical and probabilistic style with certain states of development in society and in sociology.

Page generated in 0.4151 seconds