201 |
Improving message logging protocols towards extreme-scale HPC systems / Amélioration des protocoles de journalisation des messages vers des systèmes HPC extrême-échelleMartsinkevich, Tatiana V. 22 September 2015 (has links)
Les machines pétascale qui existent aujourd'hui ont un temps moyen entre pannes de plusieurs heures. Il est prévu que dans les futurs systèmes ce temps diminuera. Pour cette raison, les applications qui fonctionneront sur ces systèmes doivent être capables de tolérer des défaillances fréquentes. Aujourd'hui, le moyen le plus commun de le faire est d'utiliser le mécanisme de retour arrière global où l'application fait des sauvegardes périodiques à partir d’un point de reprise. Si un processus s'arrête à cause d'une défaillance, tous les processus reviennent en arrière et se relancent à partir du dernier point de reprise. Cependant, cette solution deviendra infaisable à grande échelle en raison des coûts de l'énergie et de l'utilisation inefficace des ressources. Dans le contexte des applications MPI, les protocoles de journalisation des messages offrent un meilleur confinement des défaillances car ils ne demandent que le redémarrage du processus qui a échoué, ou parfois d’un groupe de processus limité. Par contre, les protocoles existants ont souvent un surcoût important en l’absence de défaillances qui empêchent leur utilisation à grande échelle. Ce surcoût provient de la nécessité de sauvegarder de façon fiable tous les événements non-déterministes afin de pouvoir correctement restaurer l'état du processus en cas de défaillance. Ensuite, comme les journaux de messages sont généralement stockés dans la mémoire volatile, la journalisation risque de nécessiter une large utilisation de la mémoire. Une autre tendance importante dans le domaine des HPC est le passage des applications MPI simples aux nouveaux modèles de programmation hybrides tels que MPI + threads ou MPI + tâches en réponse au nombre croissant de cœurs par noeud. Cela offre l’opportunité de gérer les défaillances au niveau du thread / de la tâche contrairement à l'approche conventionnelle qui traite les défaillances au niveau du processus. Par conséquent, le travail de cette thèse se compose de trois parties. Tout d'abord, nous présentons un protocole de journalisation hiérarchique pour atténuer une défaillance de processus. Le protocole s'appelle Scalable Pattern-Based Checkpointing et il exploite un nouveau modèle déterministe appelé channel-determinism ainsi qu’une nouvelle relation always-happens-before utilisée pour mettre partiellement en ordre les événements de l'application. Le protocole est évolutif, son surcoût pendant l'exécution sans défaillance est limité, il n'exige l'enregistrement d'aucun évènement et, enfin, il a une reprise entièrement distribuée. Deuxièmement, afin de résoudre le problème de la limitation de la mémoire sur les nœuds de calcul, nous proposons d'utiliser des ressources dédiées supplémentaires, appelées logger nodes. Tous les messages qui ne rentrent pas dans la mémoire du nœud de calcul sont envoyés aux logger nodes et sauvegardés dans leur mémoire. À travers de nos expériences nous montrons que cette approche est réalisable et, associée avec un protocole de journalisation hiérarchique comme le SPBC, les logger nodes peuvent être une solution ultime au problème de mémoire limitée sur les nœuds de calcul. Troisièmement, nous présentons un protocole de tolérance aux défaillances pour des applications hybrides qui adoptent le modèle de programmation MPI + tâches. Ce protocole s'utilise pour tolérer des erreurs détectées non corrigées qui se produisent lors de l'exécution d'une tâche. Normalement, une telle erreur provoque une exception du système ce qui provoque un arrêt brutal de l'application. Dans ce cas, l'application doit redémarrer à partir du dernier point de reprise. Nous combinons la sauvegarde des données de la tâche avec une journalisation des messages afin d’aider à la reprise de la tâche qui a subi une défaillance. Ainsi, nous évitons le redémarrage au niveau du processus, plus coûteux. Nous démontrons les avantages de ce protocole avec l'exemple des applications hybrides MPI + OmpSs. / Existing petascale machines have a Mean Time Between Failures (MTBF) in the order of several hours. It is predicted that in the future systems the MTBF will decrease. Therefore, applications that will run on these systems need to be able to tolerate frequent failures. Currently, the most common way to do this is to use global application checkpoint/restart scheme: if some process fails the whole application rolls back the its last checkpointed state and re-executes from that point. This solution will become infeasible at large scale, due to its energy costs and inefficient resource usage. Therefore fine-grained failure containment is a strongly required feature for the fault tolerance techniques that target large-scale executions. In the context of message passing MPI applications, message logging fault tolerance protocols provide good failure containment as they require restart of only one process or, in some cases, a bounded number of processes. However, existing logging protocols experience a number of issues which prevent their usage at large scale. In particular, they tend to have high failure-free overhead because they usually need to store reliably any nondeterministic events happening during the execution of a process in order to correctly restore its state in recovery. Next, as message logs are usually stored in the volatile memory, logging may incur large memory footprint, especially in communication-intensive applications. This is particularly important because the future exascale systems expect to have less memory available per core. Another important trend in HPC is switching from MPI-only applications to hybrid programming models like MPI+threads and MPI+tasks in response to the increasing number of cores per node. This gives opportunities for employing fault tolerance solutions that handle faults on the level of threads/tasks. Such approach has even better failure containment compared to message logging protocols which handle failures on the level of processes. Thus, the work in these dissertation consists of three parts. First, we present a hierarchical log-based fault tolerance solution, called Scalable Pattern-Based Checkpointing (SPBC) for mitigating process fail-stop failures. The protocol leverages a new deterministic model called channel-determinism and a new always-happens-before relation for partial ordering of events in the application. The protocol is scalable, has low overhead in failure-free execution and does not require logging any events, provides perfect failure containment and has a fully distributed recovery. Second, to address the memory limitation problem on compute nodes, we propose to use additional dedicated resources, or logger nodes. All the logs that do not fit in the memory of compute nodes are sent to the logger nodes and kept in their memory. In a series of experiments we show that not only this approach is feasible, but, combined with a hierarchical logging scheme like the SPBC, logger nodes can be an ultimate solution to the problem of memory limitation for logging protocols. Third, we present a log-based fault tolerance protocol for hybrid applications adopting MPI+tasks programming model. The protocol is used to tolerate detected uncorrected errors (DUEs) that happen during execution of a task. Normally, a DUE caused the system to raise an exception which lead to an application crash. Then, the application has to restart from a checkpoint. In the proposed solution, we combine task checkpointing with message logging in order to support task re-execution. Such task-level failure containment can be beneficial in large-scale executions because it avoids the more expensive process-level restart. We demonstrate the advantages of this protocol on the example of hybrid MPI+OmpSs applications.
|
202 |
Metalinguistic knowledge of second language pre-service teachers and the quality of their written corrective feedback : what relations?Benmessaoud, Sirine 06 1900 (has links)
Cette étude quantitative vise à 1) mesurer les connaissances métalinguistiques des futurs enseignants, 2) décrire la qualité de la rétroaction corrective écrite (RCÉ) des futurs enseignants de français langue seconde (FLS), et 3) examiner la relation entre les connaissances métalinguistiques des futurs enseignants et la qualité de leur rétroaction corrective à l’écrit.
Un groupe de 18 futurs enseignants de français langue seconde inscrit dans le programme de formation initiale des maîtres à Montréal a participé à l'étude. Les participants ont accompli 1) une tâche d’analyse de phrases pour mesurer leurs connaissances métalinguistiques, et 2) une tâche de rétroaction corrective écrite, pour évaluer la qualité de leurs pratiques rétroactives à l’écrit en termes de localisation d'erreur et d'explication métalinguistique fournie. Alors que les analyses descriptives sont effectuées pour répondre aux deux premières questions de la présente étude, des analyses de corrélation ont été réalisées pour déterminer s’il existe des relations entre les connaissances métalinguistiques des futurs enseignants et la qualité de leur rétroaction corrective à l’écrit.
Les résultats indiquent que 1) la localisation de l'erreur de la RCÉ fournie est précise, mais 2) l'explication métalinguistique l’est moins, 3) il existe une relation entre les connaissances métalinguistiques des futurs enseignants et la qualité de leur rétroaction corrective à l’écrit. / The present quantitative study seeks to 1) measure pre-service teachers’ metalinguistic knowledge, 2) describe the quality of French as a second language (FSL) pre-service teachers’ written corrective feedback (WCF), and 3) examine the relationship between pre-service teachers’ metalinguistic knowledge and the quality of their written corrective feedback (i.e., teachers’ metalinguistic awareness).
A group of 18 French as a second language pre-service teachers following the initial teacher training program in Montreal, participated in the study. Participants were assigned 1) a task of analytical abilities to measure their metalinguistic knowledge, and 2) a task of written corrective feedback provision to evaluate the quality of their written corrective feedback in terms of error location and the metalinguistic explanation provided. Descriptive analyses were undertaken to answer the first two research questions. Correlation analyses were performed to examine whether there exist any relations between pre-service teachers’ metalinguistic knowledge and the quality of their WCF.
Among other things, results indicated that 1) while the error location of WCF provided was precise, 2) the metalinguistic explanation provided by the participants was not accurate, 3) there is a relationship between pre-service teachers’ metalinguistic knowledge and the quality of written corrective feedback.
|
203 |
Évaluation d’un outil informatisé pour soutenir la prescription dans un établissement de santé pédiatrique : sécurité de l’usage des médicaments en pré et post-implantationLiang, Man Qing 06 1900 (has links)
La prescription électronique, définie comme la saisie et la transmission électronique de diverses données de prescriptions (médicaments, requêtes de laboratoires, imagerie), est une technologie qui promet d’augmenter la productivité de l’exécution d’une prescription, de diminuer les erreurs reliées à l’illisibilité des prescriptions manuscrites et d’améliorer l’usage approprié des médicaments. Toutefois, la réalisation des bénéfices associés à cette technologie dépend grandement du contexte local de l’implantation et la configuration du système, qui doivent être adaptés aux besoins de l’établissement de santé et aux pratiques locales des professionnels. Bien que la prescription électronique soit implantée depuis plus d’une décennie dans plusieurs établissements de santé à travers le monde, il s’agit d’une technologie émergente au Québec et au Canada. Le Centre hospitalier universitaire (CHU) Sainte-Justine est l’un des premiers établissements de santé au Québec qui a implanté un système informatisé d’entrée d’ordonnances (SIEO) en 2019. L’outil, développé par un fournisseur local, a été adapté spécifiquement aux besoins de cet hôpital pédiatrique.
Ainsi, l’objectif principal de ce mémoire est d’évaluer les effets de ce SIEO sur la sécurité de l’usage des médicaments. Plus spécifiquement, ce mémoire vise à 1) mesurer et décrire les problèmes liés à l’usage des médicaments avant et après l’implantation du SIEO, 2) identifier les caractéristiques du SIEO qui influencent la sécurité de l’usage des médicaments et 3) formuler des recommandations pour optimiser les bénéfices de l’outil de prescription électronique pour les patients et les utilisateurs. Afin de répondre à ces objectifs, ce travail présente deux études distinctes :
1. Une première analyse heuristique de l’utilisabilité portant spécifiquement sur la vulnérabilité du système a été effectuée en préimplantation du SIEO. Des scénarios visant à identifier les vulnérabilités du système ont été élaborés, puis un score permettant de noter la capacité du système à pallier ces vulnérabilités a été attribué par trois experts indépendants, afin de formuler des recommandations sur le design des fonctionnalités clés de cet outil.
2. Une étude observationnelle pré-post a été menée dans la période précédant l'implantation du système, et suivant l'implantation du système, dans l'unité pilote de pédiatrie générale. L’étude observationnelle est composée de deux volets, soit : a) une analyse des erreurs liées aux prescriptions de médicaments pour un échantillon d’ordonnances rédigées pendant une semaine par une analyse des interventions des pharmaciens et un audit de conformité des prescriptions et b) une analyse pré-post des erreurs liées au circuit du médicament, à partir des rapports d’incidents et accidents déclarés en lien avec le médicament. Les types d'erreurs ont été analysés afin de bien comprendre leur nature, ainsi que le rôle potentiel de la technologie sur la sécurité de l’usage des médicaments. Ces analyses ont été contextualisées par une description des fonctionnalités du SIEO (par l’utilisation d’outils validés pour l’évaluation des SIEO), des flux cliniques (par l’observation directe), et du projet d’implantation (par l’analyse de documents et des discussions avec les parties prenantes) afin de formuler des recommandations visant à optimiser les bénéfices du SIEO.
Le premier article rapporte l'analyse de l'utilisabilité (étude 1) et des problèmes liés à la prescription de médicaments (étude 2a). Les résultats suggèrent que le système d’aide à la décision intégré au SIEO ne disposait pas de fonctionnalités recommandées pour limiter les vulnérabilités liées à l’usage de ce type d’outil. Néanmoins, les erreurs de conformité, qui représentaient la majorité des problèmes de prescription avant l’implantation ont été complètement éliminées par le nouveau SIEO. Toutefois, il n’y a pas eu de différence sur les erreurs de dosage et les autres interventions des pharmaciens. Ainsi, les résultats obtenus confirment qu’il est nécessaire de configurer un système d’aide à la décision avancé et adapté aux soins hospitaliers pédiatriques afin de réduire davantage les erreurs cliniques liées aux ordonnances de médicaments.
Le deuxième article présente l’analyse des rapports d’incidents et accidents (étude 2b), et vise à estimer les effets du SIEO sur la sécurité de l'usage des médicaments, ainsi que mieux comprendre les erreurs de médicaments dans l’ensemble du processus des soins. L’article met en évidence le rôle important de la prescription électronique dans la simplification des étapes de la relève, de la transmission et de la transcription de la prescription. De plus, l'amélioration de l’utilisabilité de la feuille d’administration des médicaments électronique (FADMe) pourrait contribuer à réduire davantage le nombre d'erreurs liées au médicament.
Ces deux articles permettent d’explorer les liens entre les caractéristiques du SIEO et les effets sur la sécurité de l’usage des médicaments, durant l’étape de prescription spécifiquement ainsi qu’à travers l’entièreté du circuit du médicament. Des recommandations sur l’utilisabilité du système et des stratégies de prévention sont présentées afin de réduire les erreurs liées au médicament. / Computerized provider order entry (CPOE), defined as a system used for entering and transmitting orders (e.g., for drugs, imaging, or lab requests) electronically, is a technology that can increase the productivity of order dispensing, reduce errors related to the illegibility of handwritten prescriptions and increase the appropriate use of medication. However, achieving the benefits associated with this technology depends on the local context of the implementation and configuration of the system, which must be adapted to the needs of the healthcare institution and the local practices of the healthcare professionals. Although CPOEs have been implemented for more than a decade in many healthcare institutions worldwide, it is an emerging technology in Quebec and Canada. The Centre hospitalier universitaire (CHU) Sainte-Justine is one of the first healthcare institutions in Quebec to implement a CPOE system in 2019. The CPOE, which was developed by a local vendor, was tailored specifically to meet the needs of the CHU Sainte-Justine's pediatric inpatient population.
Thus, this study aims to evaluate the effects of the CPOE on medication safety. More specifically, this study seeks to 1) measure and describe problems related to medication use before and after the implementation of the CPOE, 2) identify the characteristics of the CPOE that influence medication safety, and 3) provide recommendations to optimize the benefits of the CPOE for patients and users.
To address these objectives, two studies were conducted:
1. An expert-based heuristic vulnerability analysis of the system was performed to analyze the usability of the CPOE in the pre-implementation phase. Scenarios to identify system vulnerabilities were developed, and a score to rate the CPOE's ability to address these vulnerabilities was assigned by three independent experts to make recommendations on the design of the CPOE's key features.
2. A pre-post observational study was conducted prior to and following the CPOE implementation in the general pediatrics unit. The observational study included two components: a) An analysis of medication orders problems for a sample of prescriptions ordered for one week through the documentation of pharmacists’ interventions and a prescription conformity audit; b) An analysis of medication-related incident and accident reports throughout the year in pre and post implementation. The types of errors were described to understand their nature, as well as the potential role of technology on the safety of medication use. The analyses were contextualized with descriptions of the CPOE features (through the use of validated tools for CPOE evaluation), clinical workflows (through direct observation) and implementation project (through secondary document analysis and discussions with stakeholders) in order to make recommendations to improve medication safety.
The first article covers the vulnerability analysis (study 1) and the medication orders problems at the prescribing step (study 2a). The results show that the clinical decision support system (CDSS) integrated into the CPOE lacked the recommended features to identify pediatric order errors. Conformity errors, which accounted for most prescribing errors, were completely eliminated by the prescriber implementation. However, there was no difference in dosing errors and other pharmacist interventions. Thus, the results obtained from these two components suggest the need to configure an advanced CDSS tailored to pediatric hospital care to further reduce clinical errors.
The second article, focused on the analysis of incident and accident reports (study 2b), aims to estimate the impacts of the electronic prescriber on medication safety, as well as to better understand medication errors in the overall care process. The article highlights the importance of simplifying the acknowledgment, transmission, and transcription steps by implementing a CPOE. Improving the usability of the electronic medication administration record (eMAR) could further reduce medication errors.
These two articles explore the relationship between the characteristics of the CPOE and their impact on medication safety, specifically at the prescribing step and throughout the entire medication management process. Recommendations on system usability and other prevention strategies are presented to improve medication safety.
|
Page generated in 0.0573 seconds