Spelling suggestions: "subject:"statistique -- méthodologie."" "subject:"statistique -- céthodologie.""
1 |
Est-ce que l'apprentissage automatique permet de prédire un comportement en nutrition?Côté, Melina 13 December 2023 (has links)
L'apprentissage automatique (AA) a permis des progrès inégalés en nutrition, notamment dans les domaines de l'évaluation alimentaire, du traitement de données massives associées aux sciences « omiques », de l'analyse des médias sociaux et de la prédiction du risque de maladie. Toutefois, l'AA n'est pas encore exploité dans le domaine de la prédiction de comportements associés à la saine alimentation. Les interventions et politiques de santé publique en nutrition mises sur pied jusqu'à ce jour ne semblent pas porter fruit puisque les choix et comportements alimentaires au niveau populationnel restent sous-optimaux. Afin de contrer l'épidémie de maladies chroniques qui découle d'une alimentation sous-optimale au Québec, il est essentiel d'identifier les facteurs individuels, sociaux et environnementaux qui déterminent les choix alimentaires de la population. Plusieurs études soutiennent l'idée que les algorithmes d'AA ont une meilleure capacité de prédiction que des modèles statistiques traditionnels, et pourraient donc permettre de mieux documenter les facteurs qui influencent les choix alimentaires de la population. Cependant, d'autres études n'ont rapporté aucune valeur ajoutée de l'utilisation d'algorithmes d'AA pour la prédiction du risque de maladies par rapport à des approches prédictives plus traditionnelles. L'objectif de ce projet de maîtrise était donc de comparer la performance de neuf algorithmes d'AA à celle de deux modèles statistiques traditionnels pour prédire un comportement en nutrition, soit une consommation adéquate de légumes et fruits, à partir de 525 variables individuelles, sociales et environnementales reliées aux habitudes alimentaires. Les résultats de ce mémoire démontrent que les algorithmes d'AA ne prédisent pas mieux la consommation adéquate de légumes et fruits que les modèles statistiques traditionnels. Cependant, étant une des premières études à comparer les algorithmes d'AA à des modèles statistiques traditionnels pour prédire un comportement en nutrition, davantage d'études comparant les deux approches doivent être menées afin d'identifier celles qui nous permettront de mieux documenter les déterminants de la saine alimentation. / Machine learning (ML) has offered unparalleled opportunities of progress in nutrition, including in the fields of dietary assessment, omics data analysis, social media data analysis and diet-related health outcome prediction. However, ML has not yet been explored for the prediction of dietary behaviours. Despite several public health interventions and policies in nutrition, adhering to heathy eating remains a challenge. In order to address the epidemic of chronic disease caused by unhealthy eating habits, it is necessary to better identify the individual, social and environmental determinants of healthy eating in the Quebec population. Many studies demonstrate that ML algorithms predict health outcomes with higher accuracy than traditional statistical models, and thus, could allow better identifying the factors that influence food choices in the Quebec population. However, other studies have reported no added value of using ML algorithms for disease risk prediction compared to traditional approaches. The aim of this master's project was to compare the accuracy of nine ML algorithms and two traditional statistical models to predict adequate vegetable and fruit consumption using a large array of individual, social and environmental variables. The results of this study demonstrate that ML algorithms do not predict adequate vegetable and fruit consumption with higher accuracy than traditional statistical models. However, being one of the first studies to compare ML algorithms and traditional statistical models to predict dietary behaviours, more studies comparing both approaches are needed to determine which models will allow better identifying the determinants of healthy eating.
|
2 |
Comparaison de modèles de régression logistique utilisés pour l'analyse de données recueillies dans le cadre d'études de type cas-témoins appariés sur le déplacement animalBeauregard, Benjamin 19 April 2018 (has links)
L’étude de la sélection des ressources en fonction du déplacement des animaux est un sujet qui intéresse plusieurs chercheurs en écologie, qui cherchent à prédire comment les ressources disponibles influencent le déplacement des animaux dans un environnement hétérogène. Pour ce faire, une stratégie souvent utilisée consiste à comparer les caractéristiques des lieux visités à celles des lieux disponibles mais non visités à différents instants. Comme l’étendue du territoire des lieux disponibles est généralement imposant, un échantillonnage aléatoire des lieux non-visités devient pratiquement inévitable. Toutefois, une méthode d’échantillonnage non adéquate peut induire un biais dans les inférences. L’échantillonnage des lieux non-visités peut se faire selon une étude longitudinale cas-témoins appariée dont la variable réponse prend la valeur 1 dans le cas d’une ressource sélectionnée et la valeur 0 dans le cas contraire. Un modèle de régression logistique peut donc être ajusté aux données. L’objectif de ce mémoire est d’étudier les avantages et les limites de divers modèles de régression logistique, tout particulièrement le modèle à effets mixtes, dans le cadre d’études cas-témoins appariées. Une étude de simulation ainsi que l’analyse de données réelles nous a permis de comparer les inférences obtenues par le modèle mixte à ceux d’un modèle à effets fixes. Les conclusions observables indiquent que les modèles mixtes sont plus performants que les modèles fixes lorsque le type d’environnement est "homogène" et "très homogène" avec une faible force de sélection, mais rarement dans d’autres situations.
|
3 |
Adéquation du modèle de socialisation à la consommation appliquée au domaine de l'épargne et invariance selon le mode de collecte de donnéesCloutier, Jacinthe 18 April 2018 (has links)
La venue de l'Internet engendre chez les chercheurs des préoccupations à l'égard de possibles biais liés au choix du mode de collecte de données. La présente recherche consiste à vérifier l'adéquation aux données du modèle de socialisation à la consommation (Moschis & Churchill, 1978) appliqué au domaine de l'épargne et d'effectuer une comparaison des résultats obtenus au selon le mode de collecte de données (téléphone ou Internet). Le modèle de socialisation à la consommation regroupe les influences de différentes variables socioéconomiques ainsi que d'agents de socialisation (parents, pairs, médias, école, etc.) sur l'apprentissage de connaissances, de comportements ou d'attitudes en matière de consommation chez les jeunes. Cette recherche comporte deux volets : (a) l'adéquation du modèle de socialisation à la consommation est vérifiée à l'aide d'analyses acheminatoires basées sur les équations structurelles et (b) des analyses par équations structurelles pour vérifier l'invariance du modèle selon le mode de collecte de données sont effectuées. Les données utilisées proviennent d'une étude plus large qui visait à mesurer différents concepts liés aux compétences en matière d'épargne. Un total de 1 366 jeunes adultes québécois âgés entre 18 et 29 ans a complété un questionnaire (téléphone : n = 400 [221 femmes, 179 hommes]; Internet : n = 966 [652 femmes, 314 hommes]). Les résultats obtenus au premier volet indiquent d'abord un bon ajustement du modèle de socialisation à la consommation aux données. Le niveau de compétence des jeunes adultes en matière d'épargne est défini en grande partie par leurs comportements. De plus, parmi les deux sources d'influence, ce sont celles non spécialisées (parents, amis, collègues) qui les incitent le plus à épargner. Au Volet 2, un seul lien diffère d'amplitude selon le mode de collecte de données, soit celui reliant les sources d'influence non spécialisées au facteur latent « compétence ». Une explication possible de ces variations selon le mode de collecte de données est qu'elles seraient causées par les différences observées sur le plan du profil des deux échantillons plutôt que par le modèle.
|
Page generated in 0.0834 seconds