• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • Tagged with
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Ajout de données textuelles au modèle de Cox dans un contexte longitudinal

Lépine, Simon-Olivier 27 March 2023 (has links)
Afin d'éviter le départ de ses clients, une compagnie d'assurance souhaite prédire la probabilité d'annulation de polices d'assurance automobile dans un intervalle de temps à partir de données sur les voitures et les clients. Les clients étant suivis dans le temps, le modèle doit incorporer des variables explicatives qui dépendent du temps. Nous utilisons le modèle de survie de Cox pour prédire les probabilités d'événement dans un intervalle de temps variable. Des notes prises par des agents lors de conversations téléphoniques avec les clients et des courriels sont également disponibles. Il est pertinent d'inclure ces textes dans le modèle statistique, car ils contiennent de l'information utile pour prédire l'annulation du contrat. Plusieurs méthodes de traitement automatique du langage naturel sont utilisées pour représenter les textes en vecteurs qui peuvent être utilisés par le modèle de Cox. Puis, une sélection de variables est effectuée. Le modèle est ensuite utilisé pour prédire les probabilités d'événements. Les notes d'agents contiennent des fautes d'orthographe, des abréviations, etc. Ainsi, nous étudions dans un premier temps l'effet d'utiliser des textes dont la qualité est graduellement détériorée sur les performances prédictives du modèle de Cox. Nous trouvons que toutes les méthodes d'encodage du texte utilisées, sans faire de raffinement sur les textes, ont un certain niveau de robustesse face aux textes de moins bonne qualité. Ensuite, nous étudions l'effet de différentes approches d'inclusion des textes dans le modèle de Cox dans un contexte longitudinal. Les effets de la sélection de variables, des méthodes d'encodage du texte et de la concaténation temporelle des textes sont analysés. L'approche proposée pour inclure les textes a permis d'améliorer les performances comparativement à un modèle qui n'inclut aucun texte. Toutefois, les performances sont similaires d'une méthode d'encodage du texte à l'autre. / In order to avoid customer attrition, an insurance company wants to predict the probability of cancellation of car insurance policies in a time interval based on car and customer covariates. Since customers are tracked over time, the model must incorporate time-dependent covariates. We use a Cox survival model to predict event probabilities in a variable time interval. Notes taken by agents during telephone conversations with customers and emails are also available. It is relevant to include these texts in the statistical model, as they contain information useful for predicting policy cancellation. Several natural language processing methods are used to represent the documents with vectors that can be used by the Cox model. Then, variable selection is performed. The model is then used to predict event probabilities. Notes taken by the agents contain spelling mistakes, abbreviations, etc. Thus, we first study the effect of using texts of gradually worse quality on the predictive performance of the Cox model. We find that all the text encoding methods used, without fine-tuning the embedding models, have a certain level of robustness against texts of lower quality. Next, we investigate the effect of different approaches to including texts in the Cox model in a longitudinal context. The effects of variable selection, text encoding methods and temporal concatenation of texts are analyzed. The proposed approach to include text resulted in improved performance compared to a model that does not include any text. However, the performance is similar across text encoding methods.
2

Analyse de l'impact d'une intervention à grande échelle avec le modèle de risques proportionnels de Cox avec surplus de zéros : application au projet Avahan de lutte contre le VIH/SIDA en Inde

Loko, Houdété Odilon 20 April 2018 (has links)
L’évaluation de l’impact des interventions à grande échelle est nécessaire dans un contexte de rareté des ressources. La rapidité de leur mise en oeuvre et certaines raisons éthiques font qu’on ne randomise pas les populations en groupes témoin et traitement. La non disponibilité de données fiables avant le démarrage des interventions ajoute aux difficultés. Certains ont proposé, dans ce cas, la reconstruction de l’historique des données à partir d’enquêtes. Dans le cas du projet Avahan pour lutter contre le VIH/SIDA, pour déterminer son effet sur l’utilisation du condom par les travailleuses du sexe, nous avons proposé une méthode qui est un mélange des modèles de régression logistique et de Cox. Nous comparons notre méthode à une basée sur les équations d’estimation généralisées en utilisant une simulation et les données d’Avahan. Les résultats montrent que notre méthode est plus puissante, mais moins robuste.
3

Le risque de décès dans les Centres d'hébergement de soins de longue durée au Québec

Ali, Ousman Ali 27 July 2022 (has links)
Ce mémoire a pour but principal d'analyser le risque de décès (ou de survie) dans les Centres d'hébergement de soins de longue durée (CHSLD) au Québec. Les données sociosanitaires issues de la Régie d'assurance maladie du Québec (RAMQ) et du ministère de la Santé et des Services Sociaux (MSSS) ont permis de construire des modèles de risque proportionnel paramétrique permettant d'analyser ce phénomène. L'estimation de ces modèles montre que les patients qui manifestent un fort risque de décès dans les CHSLD sont : les hommes, les patients les plus âgés, les Montréalais vivant en CHSLD et ceux qui ont un mauvais état de santé avant le début du séjour. Ainsi, l'espérance de vie moyenne à l'entrée du CHSLD au Québec est d'environ 157 semaines. Quant à la relation entre les revenus moyens régionaux et le risque de décès dans les CHSLD, l'estimation faite à partir de données appariées n'a pu mettre en évidence sa significativité. / The main aim of this thesis is to estimate the hazard of death (or survival) in long-term health care facilities in Quebec (CHSLD). The sociosanitary data from the Quebec Health Insurance Board (RAMQ) and the Ministry of Health and Social Services (MSSS) were used to build parametric proportional hazard models to analyze this phenomenon. The estimation of these models indicates that the patients who show a high risk of death in CHSLD are: males, oldest patients, Montrealers living in CHSLD, and those who have a worse health status before the beginning of the stay. The average life expectancy at the entrance of the CHSLD in Quebec is approximately 157 weeks (around 3 years). As for the relationship between average regional income and the risk of death in long-term health care facilities, the estimation based on matched data fails to its significance.

Page generated in 0.1366 seconds