• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • 1
  • 1
  • Tagged with
  • 4
  • 4
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Statistiques de scan : théorie et application à l'épidémiologie / Scan statistics : theory and application to epidemiology

Genin, Mickaël 03 December 2013 (has links)
La notion de cluster désigne l'agrégation dans le temps et/ou l'espace d'évènements. Dans de nombreux domaines, les experts observent certaines agrégations d'évènements et la question se pose de savoir si ces agrégations peuvent être considérées comme normales (le fruit du hasard) ou non. D'un point de vue probabiliste, la normalité peut être décrite par une hypothèse nulle de répartition aléatoire des évènements. La détection de clusters d'évènements est un domaine de la statistique qui s'est particulièrement étendu au cours des dernières décennies. En premier lieu, la communauté scientifique s'est attachée à développer des méthodes dans le cadre unidimensionnel (ex : le temps) puis, par la suite, a étendu ces méthodes au cas multidimensionnel, et notamment bidimensionnel (l'espace). Parmi l'ensemble des méthodes de détection de clusters d'évènements, trois grands types de tests peuvent être distingués. Le premier concerne les tests globaux qui permettent de détecter une tendance globale à l'agrégation, sans pour autant localiser les clusters éventuels. Le deuxième type correspond aux tests focalisés qui sont utilisés lorsque des connaissances a priori permettent de définir un point source (date ou localisation spatiale) et de tester l'agrégation autour de ce dernier. Le troisième type englobe les tests de détection de cluster (ou sans point source défini) qui permettent la localisation, sans connaissance a priori, de clusters d'évènements et le test de leur significativité statistique. Au sein de cette thèse, nous nous sommes focalisés sur cette dernière catégorie et plus particulièrement aux méthodes basées sur les statistiques de scan (ou de balayage). Ces méthodes sont apparues au début des années 1960 et permettent de détecter des clusters d'évènements et de déterminer leur aspect "normal" (le fruit du hasard) ou "anormal". L'étape de détection est réalisée par le balayage (scan) par une fenêtre, dite fenêtre de scan, du domaine d'étude (discret ou continu) dans lequel sont observés les évènements (ex: le temps, l'espace,…). Cette phase de détection conduit à un ensemble de fenêtres définissant chacune un cluster potentiel. Une statistique de scan est une variable aléatoire définie comme la fenêtre comportant le nombre maximum d'évènements observés. Les statistiques de scan sont utilisées comme statistique de test pour vérifier l'indépendance et l'appartenance à une distribution donnée des observations, contre une hypothèse alternative privilégiant l'existence de cluster au sein de la région étudiée. Par ailleurs, la principale difficulté réside dans la détermination de la distribution, sous l'hypothèse nulle, de la statistique de scan. En effet, puisqu'elle est définie comme le maximum d'une suite de variables aléatoires dépendantes, la dépendance étant due au recouvrement des différentes fenêtres de scan, il n'existe que dans de très rares cas de figure des solutions explicites. Aussi, un pan de la littérature est axé sur le développement de méthodes (formules exactes et surtout approximations) permettant de déterminer la distribution des statistiques de scan. Par ailleurs, dans le cadre bidimensionnel, la fenêtre de scan peut prendre différentes formes géométriques (rectangulaire, circulaire,…) qui pourraient avoir une influence sur l'approximation de la distribution de la statistique de scan. Cependant, à notre connaissance, aucune étude n'a évalué cette influence. Dans le cadre spatial, les statistiques de scan spatiales développées par M. Kulldorff s'imposent comme étant, de loin, les méthodes les plus utilisées par la communauté scientifique. Le principe de ces méthodes résident dans le fait de scanner le domaine d'étude avec des fenêtres de forme circulaire et de sélectionner le cluster le plus probable comme celui maximisant un test de rapport de vraisemblance. [...] / The concept of cluster means the aggregation of events in time and / or space. In many areas, experts observe certain aggregations of events and the question arises whether these aggregations can be considered normal (by chance) or not. From a probabilistic point of view, normality can be described by a null hypothesis of random distribution of events.The detection of clusters of events is an area of statistics that has particularly spread over the past decades. First, the scientific community has focused on developing methods for the one-dimensional framework (eg time) and then subsequently extended these methods to the multidimensional case, especially two-dimensional (space). Of all the methods for detecting clusters of events, three major types of tests can be distinguished. The first type concerns global tests that detect an overall tendency to aggregation, without locating any clusters. The second type corresponds to the focused tests that are used when a priori knowledge is used to define a point source (date or spatial location) and to test the aggregation around it. The third type includes the cluster detection tests that allow localization, without a priori, cluster of events and test their statistical significance. In this thesis, we focused on the latter category, especially to methods based on scan statistics.These methods have emerged in the early 1960s and can detect clusters of events and determine their \"normal" appearance (coincidence) or "abnormal". The detection step is performed by scanning through a window, namely scanning window, the studied area (discrete or continuous, time, space), in which the events are observed. This detection step leads to a set of windows, each defining a potential cluster. A scan statistic is a random variable defined as the window with the maximum number of events observed.Scan statistics are used as a test statistic to check the independence and belonging to a given distribution of observations, against an alternative hypothesis supporting the existence of cluster within the studied region. Moreover, the main difficulty lies in determining the distribution of scan statistics under the null hypothesis. Indeed, since it is defined as the maximum of a sequence of dependent random variables, the dependence is due to the recovery of different windows scan, it exists only in very rare cases explicit solutions. Also, a piece of literature is focused on the development of methods (exact formulas and approximations) to determine the distribution of scan statistics. Moreover, in the two-dimensional framework, the scanning window can take various geometric shapes (rectangular, circular, ...) that could have an influence on the approximation of the distribution of the scan statistic. However, to our knowledge, no study has evaluated this influence. In the spatial context, the spatial scan statistics developed by M. Kulldorff are the most commonly used methods for spatial cluster detection. The principle of these methods lies in scanning the studied area with circular windows and selecting the most likely cluster maximizing a likelihood ratio test statistic. Statistical inference of the latter is achieved through Monte Carlo simulations. However, in the case of huge databases and / or when important accuracy of the critical probability associated with the detected cluster is required, Monte Carlo simulations are extremely time-consuming.First , we evaluated the influence of the scanning window shape on the distribution of two dimensional discrete scan statistics. A simulation study performed with squared, rectangular and discrete circle scanning windows has highlighted the fact that the distributions of the associated scan statistics are very close each to other but significantly different. The power of the scan statistics is related to the shape of the scanning window and that of the existing cluster under alternative hypothesis through out a simulation study. [...]
2

Approximations for multidimensional discrete scan statistics / Approximations pour les statistiques de scan discrètes multidimensionnelles

Amărioarei, Alexandru 15 September 2014 (has links)
Dans cette thèse nous obtenons des approximations et les erreurs associées pour la distribution de la statistique de scan discrète multi-dimensionnelle. La statistique de scan est vue comme le maximum d'une suite de variables aléatoires stationnaires 1-dépendante. Dans ce cadre, nous présentons un nouveau résultat pour l'approximation de la distribution de l'extremum d'une suite de variables aléatoire stationnaire 1-dépendante, avec des conditions d'application plus larges et des erreurs d'approximations plus petites par rapport aux résultats existants en littérature. Ce résultat est utilisé ensuite pour l'approximation de la distribution de la statistique de scan. L'intérêt de cette approche par rapport aux techniques existantes en littérature est du à la précision d'une erreur d'approximation, d'une part, et de son applicabilité qui ne dépend pas de la distribution du champ aléatoire sous-adjacent aux données, d'autre part.Les modèles considérés dans ce travail sont le modèle i.i.d et le modèle de dépendance de type block-factor. Pour la modélisation i.i.d. les résultats sont détaillés pour la statistique de scan uni, bi et tri-dimensionnelle. Un algorithme de simulation de type "importance sampling" a été introduit pour le calcul effectif des approximations et des erreurs associées. Des études de simulations démontrent l'efficacité des résultats obtenus. La comparaison avec d'autres méthodes existantes est réalisée. La dépendance de type block-factor est introduite comme une alternative à la dépendance de type Markov. La méthodologie développée traditionnellement dans le cas i.i.d. est étendue à ce type de dépendance. / In this thesis, we derive accurate approximations and error bounds for the probability distribution of the multidimensional discrete scan statistics. We start by improving some existing results concerning the estimation of the distribution of extremes of 1-dependent stationary sequences of random variables, both in terms of range of applicability and sharpness of the error bound. These estimates play the key role in the approximation process of the multidimensional discrete scan statistics distribution. The presented methodology has two main advantages over the existing ones found in the literature: first, beside the approximation formula, an error bound is also established and second, the approximation does not depend on the common distribution of the observations. For the underlying random field under which the scan process is evaluated, we consider two models: the classical model, of independent and identically distributed observations and a dependent framework, where the observations are generated by a block-factor. In the i.i.d. case, in order to illustrate the accuracy of our results, we consider the particular settings of one, two and three dimensions. A simulation study is conducted where we compare our estimate with other approximations and inequalities derived in the literature. The numerical values are efficiently obtained via an importance sampling algorithm discussed in detail in the text. Finally, we consider a block-factor model for the underlying random field, which consists of dependent data and we show how to extend the approximation methodology to this case. Several examples in one and two dimensions are investigated.
3

Typologie des arrêts cardiaques au regard des inégalités sociales et territoriales de santé en Ile-de-France : application au registre national des arrêts cardiaques (RéAC) / Typology of cardiac arrests with regard to social and territorial inequalities in health : application to cardiac arrest registry (REAC) data for Ile de France area

Castra, Laurent 02 October 2018 (has links)
Introduction : L'arrêt cardiaque (AC) est considéré comme un problème majeur de santé publique. Prévenir les arrêts cardiaques, les décès consécutifs et optimiser leur prise en charge sont les objectifs partagés à la fois par les professionnels de l’urgence et les décideurs des politiques de santé publique. A l’heure de la territorialisation prenant en compte les besoins des populations, très peu d’études ont été consacrées aux variations d’incidence induites par la localisation géographique des arrêts cardiaques et les caractéristiques socio-économiques des patients. L’objectif de cette thèse est d'identifier, à partir des données du registre national des arrêts cardiaques RéAC, dans les trois départements de la petite couronne d’Ile-de-France, des clusters de communes présentant une incidence élevée ou faible en matière d’arrêt cardiaque, puis de les caractériser à partir des facteurs socio-économiques qui peuvent leur être associés. Matériel et Méthodes : Nous avons étudié les données d’arrêt cardiaque des trois départements d’Ile-de-France composant la petite couronne francilienne. Nous avons ainsi travaillé sur un ensemble de 123 communes. Les données relatives aux arrêts cardiaques ont été extraites du registre français des arrêts cardiaques RéAC. Des données socioéconomiques ont été collectées pour chacune de ces communes auprès de l’Institut National de la Statistique et des Etudes Economiques (INSEE). En termes de méthodes, nous avons eu recours à une double approche sur le plan statistique, combinant des méthodes bayésiennes afin d’étudier les variations géographiques d'incidence des arrêts cardiaques et des statistiques de scan en vue d’identifier des clusters de communes selon le niveau d’incidence des arrêts cardiaques. Enfin, nous avons caractérisé et comparé ces clusters de communes selon des facteurs socioéconomiques. Résultats : Nous avons inclus 3.414 arrêts cardiaques sur une période de deux ans, entre août 2013 et août 2015. De fortes variations géographiques - significatives - ont été observées parmi 123 municipalités : 34 présentaient un risque d'incidence élevé et 37 présentaient un risque faible. Les statistiques de scan ont permis d’identifier 7 clusters significatifs sur le plan de l’incidence des arrêts cardiaques, dont 3 clusters à faible incidence (le risque relatif variait de 0,23 à 0,54) et 4 clusters à forte incidence (avec un risque relatif de 1,43 à 2). Les clusters de municipalités ayant une incidence élevée d'AC se caractérisent par un statut socioéconomique inférieur à celui des autres (clusters d'incidence d’arrêt cardiaque faible ou normale). L'analyse a montré des relations statistiquement significatives entre les facteurs de défaveur sociale et une incidence élevée. Discussion : L’analyse des taux d’incidence standardisés et lissés dans la zone de la petite couronne parisienne révèle l’existence d’une forte hétérogénéité en termes d’incidence des arrêts cardiaques. L’utilisation des statistiques de scan nous a permis d’identifier 7 clusters significatifs, dont 4 de sur-incidence et 3 de sous-incidence. Ces résultats, les premiers en France sur cette thématique, confirment ceux déjà existants dans la littérature internationale montrant une hétérogénéité spatiale de l'incidence de l'arrêt cardiaque et l’importance de certains facteurs socio-économiques. Enfin, le recours aux statistiques de scan, différente des méthodes généralement utilisées, permet de mettre en évidence l'existence de zones à haut risque d’arrêt cardiaque [...] / Cardiac arrest (CA) is considered a major public health problem. Preventing cardiac arrest and subsequent deaths and optimizing their management are objectives shared by both emergency professionals and public health policy makers. At a time when territorialization is taking into account the needs of populations, very few studies have been devoted to the variations in incidence induced by the geographical location of cardiac arrests and the socio-economic characteristics of patients. The objective of this thesis is to identify, based on data from the national register of cardiac arrests RéAC, in the three departments of the inner suburbs of Ile-de-France, clusters of municipalities with a high or low incidence of cardiac arrest, and then to characterize them based on the socio-economic factors that can be associated with them. Equipment and Methods: We studied cardiac arrest data from the three departments of Ile-de-France that make up the inner suburbs of the Paris region. We have worked on a total of 123 municipalities. Data on cardiac arrests were extracted from the French register of cardiac arrests RéAC. Socio-economic data were collected for each of these municipalities from the Institut National de la Statistique et des Etudes Economiques (INSEE). In terms of methods, we used a statistically twofold approach, combining Bayesian methods to study geographical variations in the incidence of cardiac arrest and CT statistics to identify clusters of communes according to the incidence level of cardiac arrest. Finally, we characterized and compared these clusters of municipalities according to socio-economic factors.
4

Statistiques de scan : théorie et application à l'épidémiologie

Genin, Mickaël 03 December 2013 (has links) (PDF)
La notion de cluster désigne l'agrégation dans le temps et/ou l'espace d'évènements. Dans de nombreux domaines, les experts observent certaines agrégations d'évènements et la question se pose de savoir si ces agrégations peuvent être considérées comme normales (le fruit du hasard) ou non. D'un point de vue probabiliste, la normalité peut être décrite par une hypothèse nulle de répartition aléatoire des évènements.

Page generated in 0.1194 seconds