Spelling suggestions: "subject:"statistique"" "subject:"qtatistique""
591 |
Mesures de localisation et de dispersion et profondeur de Tukey en statistique directionnelleGenest, Maxime 17 April 2018 (has links)
La statistique directionnelle a pour objets d'étude les échantillons et les distributions sur un cercle ou sur une sphère. Elle peut être vue comme une extension de la statistique classique à l'étude des vecteurs unités aléatoires. En premier lieu, on fait ici un bref survol de quelques notions importantes de la statistique directionnelle. Ce mémoire se concentre plus particulièrement sur l'étude de mesures de localisation et de dispersion pour des distributions circulaires ou sphériques. Un point important du travail consiste à présenter l'adaptation naturelle de la fonction profondeur de Tukey au contexte directionnel. Ce dernier outil nous permet de définir plusieurs mesures de localisation sur le cercle et la sphère. Ces dernières mesures sont pertinentes pour leurs qualités de robustesse. À l'aide d'une simulation de type Monte Carlo, nous comparons finalement les mesures de localisation de la statistique directionnelle classique à celles produites par la profondeur de Tukey.
|
592 |
Les copules en finance : analyse qualitative et quantitative de l'expansion de cette théorieBourdeau-Brien, Michaël 12 April 2018 (has links)
Le terme « copula » utilisé dans le moteur de recherche Google produisait 1 130 000 résultats en janvier 2007. Dans ce mémoire, nous cherchons à analyser cet intérêt phénoménal pour les copules. Notre démarche est à la fois qualitative en terme d'analyse de l'évolution des domaines de recherche et quantitative en terme de production d'articles. Une attention particulière est apportée à la statistique, où s'est d'abord développée la théorie, et à la finance qui semble être devenue un domaine privilégié d'application. L'analyse s'appuie sur une base de données exhaustive de 871 documents de travail et articles qui nous permet d'identifier les principaux champs de recherche, les auteurs les plus prolifiques, ainsi que les revues qui publient le plus d'articles. Nous constatons que l'utilisation des copules en finance ne semble pas démesurée et qu'elle s'appuie solidement sur les travaux séminaux de Paul Embrechts et de ses collaborateurs. / The term "copula" used in the search engine Google produced 1,310,000 results in January 2007. In this Master's thesis, we seek to analyze this phenomenal interest for copulas. Our approach is at the same time qualitative in terms of analysis of the evolution and quantitative in terms of production of articles. Special attention is given to Statistics where the theory was initially developed, and to Finance which seems to have become a privileged field of application. The analysis is based on an exhaustive database of 871 working papers and articles printed in scientific journals which allows us to describe the evolution of the number of publications and identify the most popular fields of research, the most prolific authors, as well as the journals that published the largest number of articles. We note that the use of copulas in finance does not seem disproportionate and that it is firmly based on the seminal work of Paul Embrechts and his collaborators.
|
593 |
On the growth and structure of social systems following preferential attachmentHébert-Dufresne, Laurent 20 April 2018 (has links)
L’inégalité est une caractéristique notoire des systèmes sociaux. Dans cette thèse, nous nous attarderons à la distribution et à la structure de la répartition de leurs ressources et activités. Dans ce contexte, leurs extrêmes iniquités tendent à suivre une propriété universelle, l’indépendance d’échelle, qui se manifeste par l’absence d’échelle caractéristique. En physique, les organisations indépendantes d’échelle sont bien connues en théorie des transitions de phase dans laquelle on les observe à des points critiques précis. Ceci suggère que des mécanismes bien définis sont potentiellement responsables de l’indépendance d’échelle des systèmes sociaux. Cette analogie est donc au coeur de cette thèse, dont le but est d’aborder ce problème de nature multidisciplinaire avec les outils de la physique statistique. En premier lieu, nous montrons qu’un système dont la distribution de ressource croît vers l’indépendance d’échelle se trouve assujetti à deux contraintes temporelles particulières. La première est l’attachement préférentiel, impliquant que les riches s’enrichissent. La seconde est une forme générale de comportement d’échelle à délai entre la croissance de la population et celle de la ressource. Ces contraintes dictent un comportement si précis qu’une description instantanée d’une distribution est suffisante pour reconstruire son évolution temporelle et prédire ses états futurs. Nous validons notre approche au moyen de diverses sphères d’activités humaines dont les activités des utilisateurs d’une page web, des relations sexuelles dans une agence d’escorte, ainsi que la productivité d’artistes et de scientifiques. En second lieu, nous élargissons notre théorie pour considérer la structure résultante de ces activités. Nous appliquons ainsi nos travaux à la théorie des réseaux complexes pour décrire la structure des connexions propre aux systèmes sociaux. Nous proposons qu’une importante classe de systèmes complexes peut être modélisée par une construction hiérarchique de niveaux d’organisation suivant notre théorie d’attachement préférentiel. Nous montrons comment les réseaux complexes peuvent être interprétés comme une projection de ce modèle de laquelle émerge naturellement non seulement leur indépendance d’échelle, mais aussi leur modularité, leur structure hiérarchique, leurs caractéristiques fractales et leur navigabilité. Nos résultats suggèrent que les réseaux sociaux peuvent être relativement simples, et que leur complexité apparente est largement une réflexion de la structure hiérarchique complexe de notre monde. / Social systems are notoriously unfair. In this thesis, we focus on the distribution and structure of shared resources and activities. Through this lens, their extreme inequalities tend to roughly follow a universal pattern known as scale independence which manifests itself through the absence of a characteristic scale. In physical systems, scale-independent organizations are known to occur at critical points in phase transition theory. The position of this critical behaviour being very specific, it is reasonable to expect that the distribution of a social resource might also imply specific mechanisms. This analogy is the basis of this work, whose goal is to apply tools of statistical physics to varied social activities. As a first step, we show that a system whose resource distribution is growing towards scale independence is subject to two constraints. The first is the well-known preferential attachment principle, a mathematical principle roughly stating that the rich get richer. The second is a new general form of delayed temporal scaling between the population size and the amount of available resource. These constraints pave a precise evolution path, such that even an instantaneous snapshot of a distribution is enough to reconstruct its temporal evolution and predict its future states. We validate our approach on diverse spheres of human activities ranging from scientific and artistic productivity, to sexual relations and online traffic. We then broaden our framework to not only focus on resource distribution, but to also consider the resulting structure. We thus apply our framework to the theory of complex networks which describes the connectivity structure of social, technological or biological systems. In so doing, we propose that an important class of complex systems can be modelled as a construction of potentially infinitely many levels of organization all following the same universal growth principle known as preferential attachment. We show how real complex networks can be interpreted as a projection of our model, from which naturally emerge not only their scale independence, but also their clustering or modularity, their hierarchy, their fractality and their navigability. Our results suggest that social networks can be quite simple, and that the apparent complexity of their structure is largely a reflection of the complex hierarchical nature of our world.
|
594 |
Participation à un programme de réinsertion sociale et évolution du potentiel criminogène : données probantes du QuébecFaucher, Ariane 13 December 2023 (has links)
Une littérature dynamique en économie du crime a, au cours des dernières années, proposé des analyses qui permettent de mieux comprendre l'impact des programmes de réinsertion sur la récidive observée des criminels. Cependant, l'impact, et l'hétérogénéité de l'impact de tels programmes sur le potentiel criminogène latent des individus, en particulier chez les récidivistes, demeure inconnu. Bien qu'elle soit importante d'un point de vue des politiques publiques et de gestion des ressources en milieu carcéral, il est difficile de répondre à cette question car le potentiel criminogène des individus n'est généralement pas observable. En utilisant des données du ministère de la Sécurité publique du Québec, ce mémoire propose une réponse à ce problème. En mesurant le potentiel criminogène de récidivistes à l'aide du LS/CMI, un outil actuariel évaluant les risques de récidive et les besoins des individus, il estime comment ce dernier peut être influencé par la participation à des programmes de réinsertion sociales lors d'une sentence initiale. Ce mémoire évalue également l'hétérogénéité de ces impacts en fonction du milieu socioéconomique dans lequel se retrouve le détenu à sa sortie du milieu carcéral. Un modèle à variables instrumentales pour contrecarrer l'endogénéité de la participation volontaire des individus aux différents programmes de réinsertion sociale est utilisé. Pour ce faire, la participation à un programme est instrumentée par la propension de participation des autres détenus évalués par l'évaluateur ayant évalué l'individu au LS/CMI lors de sa première incarcération. Des effets non-statistiquement significatifs de la participation sur le potentiel d'amélioration des récidivistes masculins sont estimés. L'estimation d'effets positifs de plus grande magnitude à l'aide de la méthode des variables instrumentales comparativement à un modèle linéaire en probabilité est observée. Cela laisse croire que les individus avec un plus grand potentiel d'amélioration ne sont pas les individus qui ont davantage tendance à participer aux programmes. Un impact positif des programmes sur l'évolution du potentiel criminogène pourrait être observé pour la population criminelle n'étant pas réévaluée par le LS/CMI, puisqu'elle ne récidive pas pour une peine de plus de 6 mois. Du point de vue de gains de société, une amélioration du potentiel criminogène s'exprime par des présences plus courtes en détention et d'actes criminels moins graves résultant en des économies d'investissement à long terme. / A dynamic literature in the economics of crime has, in recent years, offered analyses that allow us to better understand the impact of reintegration programs on the observed recidivism of criminals. However, the impact and the heterogenity of the impact of such programs on the latent criminogenic tendency of individuals, particularly among repeat offenders, remains unknown. Although it is important from the point of view of public policies and management of resources in prisons, it is difficult to answer this question because the criminogenic tendency of individuals is generally not observable. Using data from the Quebec Ministry of Public Security, this thesis proposes an answer to this problem. Measuring the criminogenic tendency of repeat offenders using LS/CMI, an actuarial tool that assesses the risks of recidivism and the needs of individuals, it estimates how the latter can be influenced by participation in social reintegration programs during a previous sentence. This thesis also assesses the heterogeneity of these impacts depending on the socioeconomic environment in which the inmate finds himself when he leaves prison. I use an instrumental variable stratgy to address the endogeneity of the offenders' participation in different social reintegration programs. More specifically, I instrument the participation in a program by the estimated propensity of the evaluator, randomly assigned to an offender on his first incarceration, to incentivize inmates to register for such programs. The estimated impacts, positive and not statiscally significant, are larger in magnitude with an IV method than with a non-instrumented linear probability model, suggesting that the inmates who have the most to gain from reinsertion programs are not systematically the ones who sign up for them. This finding suggests that the programs might have an even larger positive impact on the criminogenic tendencies of the population of individual for whom such an evolution is not observed given that they never receive a second LS/CMI evaluation. From the point of view of societal gains, an improvement in the criminogenic potential translates into a shorter presence in detention and less serious criminal acts resulting in long-term savings of investment.
|
595 |
La corrélation appliquée dans un contexte bayésienLepage, Maude 17 April 2018 (has links)
Bien que largement utilisée, la corrélation n'est pas souvent abordée dans un contexte bayésien. À l'aide de formules simples, on calcule ici la corrélation de Pearson entre un paramètre [thêta] et son estimation bayésienne ou par la méthode du maximum de vraisemblance. Ceci nous permet alors d'examiner le comportement de la corrélation de Pearson selon la taille de l'échantillon et le choix des paramètres de la loi a priori. On compare ensuite son comportement avec celui des corrélations de Spearman, de Kendall et de Blomqvist obtenues à l'aide de simulations effectuées avec le logiciel R. Plusieurs cas sont considérés faisant notamment intervenir des lois conjuguées.
|
596 |
Application d'une technique d'autocorrélation à divers domaines de l'astrophysiqueDeschatelets, David 21 March 2024 (has links)
Dans ce projet de doctorat, nous appliquons une technique d'analyse basée sur la fonction d'autocorrélation à trois domaines distincts de l'astrophysique dans le but de détecter avec une grande précision des variations causées par différents phénomènes physiques dans le profil des raies d'absorption des spectres stellaires. Le premier sujet concerne la mesure de champs magnétiques stellaires. Nous avons obtenu la courbe de variation du module moyen du champ magnétique de 18 étoiles en fonction de leur période de rotation, et avons comparé quelques courbes magnétiques obtenues avec la technique d'autocorrélation avec celles découlant de l'analyse d'un autre groupe de recherche qui a utilisé une méthode conventionnelle. Pour tous les cas, la technique d'autocorrélation nous a procuré des résultats d'une précision supérieure à la technique concurrentielle. Le second sujet analysé se rapporte aux mesures de la vitesse de microturbulence des céphéides avec la technique d'autocorrélation. Nous avons obtenu des courbes de vitesses de microturbulence en fonction de la phase de pulsation de six céphéides. Pour la grande majorité des cas étudiés, nous avons mesuré un pic de vitesse de microturbulence à l'instant où la céphéide atteint son rayon minimal. Ces résultats sont en accord avec des travaux antérieurs menés sur le sujet. Le troisième et dernier sujet analysé est en lien avec la détection de signaux d'exoplanètes par lumière réfléchie de l'étoile hôte. Dans le spectre visible, le signal d'une planète est approximativement une copie de celui de son étoile hôte, mais d'intensité beaucoup plus faible (i.e. 10-⁵ à 10-⁴ fois l'intensité de l'étoile). De ce fait, détecter la signature d'une planète dans le visible avec un degré de certitude acceptable est un défi important. Pour cette portion du projet, nous avons mis de l'avant les avantages de la fonction d'autocorrélation par rapport à une méthode déjà bien établie dans le domaine basée sur la fonction de corrélation croisée au moyen de spectres simulés. De plus, nous avons analysé le système de l'étoile 51 Peg accompagnée de sa planète 51 Peg b. Nous avons réussi à mesurer le signal de la planète 51 Peg b avec une détection maximale de 5.52 ợ bruit. Il s'agit d'un degré de détection presque 50 % supérieur à celui atteint par un autre groupe de recherche ayant utilisé les mêmes spectres et une technique de corrélation croisée.De ce fait, détecter la signature d'une planète dans le visible avec un degré de certitude acceptable est un défi important. Pour cette portion du projet, nous avons mis de l'avant les avantages de la fonction d'autocorrélation par rapport à une méthode déjà bien établie dans le domaine basée sur la fonction de corrélation croisée au moyen de spectres simulés. De plus, nous avons analysé le système de l'étoile 51 Peg accompagnée de sa planète 51 Peg b. Nous avons réussi à mesurer le signal de la planète 51 Peg b avec une détection maximale de 5.52 o bruit. Il s'agit d'un degré de détection presque 50 % supérieur à celui atteint par un autre groupe de recherche ayant utilisé les mêmes spectres et une technique de corrélation croisée.De ce fait, détecter la signature d'une planète dans le visible avec un degré de certitude acceptable est un défi important. Pour cette portion du projet, nous avons mis de l'avant les avantages de la fonction d'autocorrélation par rapport à une méthode déjà bien établie dans le domaine basée sur la fonction de corrélation croisée au moyen de spectres simulés. De plus, nous avons analysé le système de l'étoile 51 Peg accompagnée de sa planète 51 Peg b. Nous avons réussi à mesurer le signal de la planète 51 Peg b avec une détection maximale de 5.52 o bruit. Il s'agit d'un degré de détection presque 50 % supérieur à celui atteint par un autre groupe de recherche ayant utilisé les mêmes spectres et une technique de corrélation croisée. / In this PhD project, we apply an analysis technique based on the autocorrelation function to three different fields in order to detect with great precision variations caused by different physical phenomena in the profile of the absorption lines of stellar spectra. The first subject relates to the measurement of stellar magnetic fields. We obtained the variation curve of the mean magnetic field modulus of 18 stars as a function of their rotation period and compared some magnetic curves obtained with the autocorrelation technique with those of another research group who used a conventional method. For all cases, the autocorrelation technique gave us magnetic curves of a higher precision compared to the competitive technique. The second subject that we studied pertains to the measurements of the microturbulence velocity of Cepheids with the autocorrelation technique. We obtained microturbulence curves as a function of the pulsation phase of six Cepheids. For the vast majority of the cases studied, we measured a microturbulence velocity peak at the precise moment during which the Cepheid reaches its minimum radius. These results are in agreement with previous work done on the subject. The third and last subject refers to the detection of exoplanet signals by reflected light of the host star. In the visible spectrum, the signal of a planet is approximately a copy of that of its host star but of much lower intensity (i.e. 10-⁵ à 10-⁴ the intensity of the star). As a result, detecting the planetary signal in the visible band with an acceptable degree of certainty is a major challenge. For this portion of the project, we have highlighted the advantages of the autocorrelation function compared to an already well-established method in astrophysics based on the cross-correlation function using simulated spectra. In addition, we analyzed the 51 Peg + 51 Peg b planetary system. We succeeded to measure the 51 Peg b planetary signal with a maximum detection of 5.52 o noise. This is about 50 % higher than what was achieved by another research group using the same spectra and a cross-correlation technique.
|
597 |
Inference algorithms for the regression approach to sequence predictionRolland, Amélie 28 January 2025 (has links)
La prédiction de séquence comporte plusieurs applications en traitement du langage naturel, en bioinformatique, et en vision numérique. La complexité de calcul requise pour trouver la séquence optimale parmi un nombre exponentiel de possibilités limite cependant l’utilisation de tels algorithmes. Dans ce mémoire, nous proposons une approche permettant de résoudre cette recherche efficacement pour deux types de problèmes différents. Plus précisément, nous adressons le problème de pré-image en prédiction de structure nécessitant de trouver la séquence associée à une entrée arbitraire, et le problème consistant à trouver la séquence qui maximise la fonction de prédiction de plusieurs classificateurs et régresseurs à noyaux. Nous démontrons que ces deux problèmes se réduisent en un même problème combinatoire valide pour plusieurs noyaux à séquences. Pour ce problème, nous proposons une borne supérieure sur la fonction de prédiction pouvant être utilisée dans un algorithme de recherche branch and bound pour l’obtention de solutions optimales. Sur les tâches de reconnaissance de mots et de prédiction de phonèmes, l’approche proposée obtient des résultats compétitifs avec les algorithmes de prédiction de structure de l’état de l’art. De plus, la solution exacte du problème de pré-image augmente de manière significative les performances de prédiction en comparaison avec une approximation trouvée par l’heuristique la plus connue. Pour les tâches consistant à trouver la séquence maximisant la fonction de prédiction de classificateurs et régresseurs, nous montrons que des méthodes existantes peuvent être biaisées à prédire de longues séquences comportant des symboles répétitifs. Nous soulignons que ce biais est enlevé lorsque le noyau est normalisé. Finalement, nous présentons des résultats en conception de médicaments sur la découverte de composés principaux. Le code source peut être téléchargé à https://github.com/a-ro/preimage. / Sequence prediction algorithms have many applications in natural language processing, bioinformatics, and computer vision. However, the computational complexity required to find the optimal sequence among an exponential number of possibilities limits the use of such algorithms. In this thesis, we propose an approach to solve this search efficiently for two types of sequence prediction problems. More precisely, we address the pre-image problem encountered in structured output prediction, which consists of finding the sequence associated with an arbitrary input, and the problem of finding a sequence maximizing the prediction function of various kernel-based classifiers and regressors. We demonstrate that these problems reduce to a common combinatorial problem valid for many sequence kernels. For this problem, we propose an upper bound on the prediction function which has low computational complexity and which can be used in a branch and bound search algorithm to obtain optimal solutions. On the practical tasks of optical word recognition and grapheme-to-phoneme prediction, the proposed approach is shown to be competitive with state-of-the-art structured prediction algorithms. Moreover, the exact solution of the pre-image problem is shown to significantly improve the prediction accuracy in comparison with an approximation found by the best known heuristic. On the task of finding a sequence maximizing the prediction function of kernelbased classifiers and regressors, we highlight that existing methods can be biased toward long sequences that contain many repeated symbols. We demonstrate that this bias is removed when using normalized kernels. Finally, we present results for the discovery of lead compounds in drug discovery. The source code can be found at https://github.com/a-ro/preimage.
|
598 |
Analyse de l'impact de la dépendance sur l'évaluation individuelle des réserves en assurances IARDTurcotte, Roxane 02 April 2024 (has links)
Dans ce mémoire, il sera question de la modélisation de réserve en assurances générales. Puisqu’une base de données provenant de l’industrie a été utilisée dans le cadre de ce projet, une attention particulière a été portée à des considérations pratiques. Encore aujourd’hui, les modèles appliqués en pratique sont souvent des modèles simples qui sont utilisés à cause de leur commodité. Par contre, de plus en plus de données sont disponibles et la possibilité d’en tirer profit est de plus en plus grande grâce à l’augmentation de la capacité computationnelle. Les méthodes classiques de provisionnement délaissent donc le potentiel de perfectionnement que permet le détail des données. Les modèles dits « individuels », dont il sera question dans ce projet, cherchent à expliquer la dynamique de l’évolution des sommes payées par réclamation. Ces modèles tirent parti des informations détaillées de chaque paiement pour modéliser la réserve du portefeuille. Il a été décidé de reprendre l’idée des facteurs de développement utilisés par Pigeon et al. (2013) qui sont inspirés de ceux de la méthode de Chain-Ladder. On considérera toutefois une loi multivariée construite par copule pour modéliser conjointement les variables de ce vecteur de développement plutôt qu’une loi normale multivariée asymétrique telle qu’utilisée dans l’article précédemment mentionné. On s’est également intéressé à la dépendance présente entre certaines composantes caractérisant la réclamation, comme le délai de déclaration (en années), le délai de premier paiement (en années) et le nombre de paiements.
|
599 |
Conceptions erronnées des jeux de hasard selon le niveau de connaissances en statistiquesBenhsain, Karim 20 April 2021 (has links)
L’enseignement de notions théoriques sur le hasard est un élément crucial en thérapie dans le traitement des joueurs excessifs. Le but de cette étude est de comparer en situation de jeu deux groupes qui diffèrent au niveau de leurs connaissances en statistiques et probabilités. 15 femmes et 15 hommes (N= 30; M= 21.3 ans) ont participé à cette recherche. Les participants ont à compléter un questionnaire pendant une séance de roulette américaine informatisée et sont comparés sur deux variables :(a) le nombre de perceptions erronées émises pendant la partie et (b) leur niveau de perception de contrôle. Les résultats ne nous permettent pas de rejeter l’hypothèse nulle. Les implications théoriques et pratiques de ces résultats sont discutées dans le contexte général de la psychologie des jeux de hasard et d’argent.
|
600 |
Capture-Recapture. Problématique des listes incomplètesCaron, Bernard 16 April 2018 (has links)
Il arrive parfois lors de l'utilisation de la méthode multi-liste que les listes administratives ne couvrent pas exactement la même période. On appelle ce problème un problème de listes incomplètes. La façon la plus courante pour résoudre ce problème est de se servir exclusivement des parties des listes où il y a un chevauchement complet. Cette méthode entraîne beaucoup d'imprécision. Afin de tenir compte de toute l'information disponible, il est possible de modéliser conjointement les strates. Deux méthode de modélisation conjointe sont présentées. Premièrement, il est possible d'estimer les valeurs manquantes à l'aide le l'algorithme EM et ainsi travailler avec des listes complètes. Deuxièmement, un modèle log-linéaire avec effet de strate qui permet de tenir compte de toute l'information tout en demeurant beaucoup plus simple à utiliser. En mesurant l'efficacité de façon explicite, on voit que la modélisation conjointe est plus avantageuse que la modélisation strate par strate.
|
Page generated in 0.0769 seconds