Spelling suggestions: "subject:"multisites"" "subject:"multipartites""
1 |
Contribution à l'optimisation de la chaîne logistique pharmaceutique dans un contexte multi-sites : application au groupe hospitalier de la région Mulhouse et sud Alsace / Contribution to optimization of the pharmaceutical supply chain in a multiple-site context : application to the hospital center of the region Mulhouse and sud AlsaceBeroule, Benoit 10 July 2018 (has links)
Le présent travail de thèse a pour but d’étudier et d’améliorer la logistique du groupement hospitalier de Mulhouse sud-Alsace (GHRMSA). Notre étude se focalise sur les problématiques liées à la pharmacie à usage interne de l’hôpital Émile Muller de Mulhouse, car cette dernière est destinée à devenir la pharmacie centrale du groupement. Cette nouvelle considération implique une centralisation de certains processus pharmaceutiques tels que la gestion et la stérilisation des dispositifs médicaux nécessaires au bon déroulement des interventions chirurgicales pratiquées quotidiennement dans les différents centres de soins du groupement.Ce travail est donc divisé en deux parties distinctes ayant pour dénominateur commun la gestion des dispositifs médicaux.En effet, dans un premier temps nous envisageons l’optimisation des méthodes d'implantation pour le stockage de ces dispositifs. Les particularités du milieu hospitalier par rapport au milieu industriel nous permettent de mettre en place des méthodes d’agencement de stock dans le but de minimiser la distance moyenne parcourue par les agents lors de la phase de collecte. Tout d'abord, nous proposons un modèle mathématique linéaire, puis nous présentons une heuristique dédiée, mais aussi des méthodes hybridées combinant cette heuristique avec un algorithme génétique puis un branch and bound. Afin d’affiner ce travail, et de se projeter dans l’avenir, nous proposons ensuite une méthode d'optimisation de la collecte d’une liste de dotations au sein du stock prenant en compte des contraintes liées à l’utilisation d’un véhicule de transport et d’un stockage multi niveau, à savoir : l’impossibilité de faire des demi-tours, le respect du sens de circulation et le respect de la charge maximale transportable. Chacune de ces contraintes peut être prise en compte ou ignorée pour représenter au mieux la réalité.Dans un second temps, nous proposons des méthodes d’ordonnancement des interventions chirurgicales pratiquées par le GHRMSA. La particularité de ce travail et de se focaliser d’avantage sur l’assignation des ressources, c’est à dire des boites de dispositifs médicaux. Le but est de renforcer les liens décisionnels existants entre la pharmacie et les différents blocs opératoires de chaque site afin de lisser la charge de travail du service de stérilisation et d’assurer une meilleure réactivité en cas d’urgences ou d’imprévus. Pour résoudre ce problème d’ordonnancement avec affectation de ressources, nous définissons un modèle mathématique linéaire et proposons un algorithme d’optimisation par essaim particulaire pour minimiser le nombre de boites de dispositifs médicaux nécessaires. Enfin, nous étendons le problème initial avec la prise en compte du transport inter-sites. Nous détaillons alors une méthode pour définir des plannings d’interventions et de livraison des dispositifs médicaux pour minimiser le coût global en fonction des caractéristiques du système de transport. / The purpose of this thesis is to study and improve the logistical aspects of the hospitals group named "Groupement Hospitalier de Mulhouse Sud-Alsace" (GHRMSA). Our study focuses on the problematics of the pharmacy of the Emile Muller hospital at Mulhouse in France, which is dedicated to become the central pharmacy of the group. This new consideration implies to centralize several pharmaceutical processes such as the medical devices management which are mandatory for surgical operations. This work is divided into two different parts on the management of surgical devices.Indeed, as a first step we study the optimization of the layout to store surgical devices. The special characteristics of the pharmaceutical environment compared to the industrial one are used to propose methods to design layouts of the warehouse in order to minimize the average distance traveled by the employees during the picking phase. First, we define a linear mathematical model and a dedicated heuristic but also two other methods hybridizing the latter with genetic algorithms and branch and bounds. In order to improve this work and prepare the future, we also propose methods to optimise the routing of the employees to completes endowment lists using a transport vehicle with a multi level storing policy. The use of such a vehicle implies the following constraints: u-turn impossibility, imposed traffic direction and respect of the transport capacity. Any of theses constraints can be considered or not in order to create a model as near as possible of the real world.As a second step, we propose surgical operations scheduling methods. This work focuses on the assignment of the needed surgical devices boxes. The purpose is to improve the decision between the operating theaters of each site of the hospital group and the sterilization service in order to smooth the sterilization workload and to improve the reactivity in case of emergencies or any other unexpected problems. To solve the scheduling problem, we define a linear mathematical model as well as a particle swarm optimization algorithm to create surgical operations plannings which minimize the number of needed surgical devices boxes. Moreover, we extend the initial problem with the transport between hospital locations, and present a method to create plannings for surgical operations and for the delivery of the surgical boxes to minimize the global cost considering the parameters of the transport system.
|
2 |
Interactions dans un système césium, strontium/matière organique naturelle/argiles des sols / Interaction between cesium, strontium, natural organic matter and clay mineralsSiroux, Brice 07 November 2017 (has links)
Le projet de thèse s’inscrit dans le Projet Investissement d’Avenir (PIA) DEMETERRES, dont l’objectif est le développement de méthodes et de technologies pour la décontamination et la remédiation des sols et effluents contaminés après un accident nucléaire. L’objectif de cette thèse est de mieux appréhender les interactions de 137Cs et 90Sr avec les différentes composantes des terres agricoles et ainsi être capable de prédire l’état chimique dans lequel ces éléments se trouveraient dans les sols en cas d’accident nucléaire. Une base de données dans le formalisme des échangeurs d’ions multi-sites a été mise en place, représentant les comportements d’adsorption de Cs+ et Sr2+ dans les illites et smectites (deux des principaux minéraux argileux) vis-à-vis des cations majeurs environnementaux H+, Na+ et Ca2+. Cette base de données a par la suite été utilisée pour tenter de prédire le comportement d’adsorption de Cs+ et Sr2+ dans des échantillons de sols agricoles français (Pusignan, Etoile-sur-Rhône et Herqueville). De bonnes simulations du comportement d’adsorption de Cs+ et Sr2+ ont été obtenues sur Pusignan et Etoile-sur-Rhône. Dans le cas d’Herqueville, la suppression de la MON n’a pas amélioré l’accord entre les simulations et les expériences, tandis que l’élimination de l’aluminium échangeable a lui permis une meilleure simulation de l’adsorption de Sr2+, mais pas de Cs+. Ces travaux permettent de simuler efficacement le comportement d’adsorption de Cs et Sr dans des sols et ainsi d’appuyer les stratégies de décontamination et remédiation après un accident nucléaire / This study is part of the DEMETERRES project, which aims to develop new methods and technologies in the field of decontamination and remediation of contaminated soils and effluents after a nuclear accident. The objective of this PhD is to obtain a better knowledge of 137Cs and 90Sr interactions onto agricultural soils and to better predict the chemical state of these elements in soils after a nuclear accident. A database in the multi-sites ion exchanger formalism has been built, reflecting the adsorption behaviours of Cs+ and Sr2+ onto illite and smectite (two major clay minerals) with regards to major environmental cations: i.e. H+, Na+, and Ca2+. It was used to predict the adsorption of Cs+ and Sr2+ onto French agricultural soil samples (Pusignan, Etoile-sur-Rhône and Herqueville). Good simulations of the adsorption of Cs+ and Sr2+ onto Pusignan and Etoile-sur-Rhône are obtained. In the case of Herqueville, the removal of NOM does not improve the agreement between experimental results and simulations, but the removal of exchangeable aluminum allows a better representation of the adsorption results of Sr2+ onto Herqueville, but not for Cs+. This work allows efficiently simulating the adsorption of Cs and Sr onto soils and support decontamination and remediation strategies after a nuclear accident
|
3 |
Recommandation diversifiée et distribuée pour les données scientifiques / Diversified and Distributed Recommendation for Scientific DataServajean, Maximilien 16 December 2014 (has links)
Dans de nombreux domaines, les nouvelles technologies d'acquisition de l'information ou encore de mesure (e.g. serres de phénotypage robotisées) ont engendré une création phénoménale de données. Nous nous appuyons en particulier sur deux cas d'application réels: les observations de plantes en botanique et les données de phénotypage en biologie. Cependant, nos contributions peuvent être généralisées aux données du Web. Par ailleurs, s'ajoute à la quantité des données leur distribution. Chaque utilisateur stocke en effet ses données sur divers sites hétérogènes (e.g. ordinateurs personnels, serveurs, cloud), données qu'il souhaite partager. Que ce soit pour les observations de botanique ou pour les données de phénotypage en biologie, des solutions collaboratives, comprenant des outils de recherche et de recommandation distribués, bénéficieraient aux utilisateurs. L'objectif général de ce travail est donc de définir un ensemble de techniques permettant le partage et la découverte de données, via l'application d'approches de recherche et de recommandation, dans un environnement distribué (e.g. sites hétérogènes).Pour cela, la recherche et la recommandation permettent aux utilisateurs de se voir présenter des résultats, ou des recommandations, à la fois pertinents par rapport à une requête qu'ils auraient soumise et par rapport à leur profil. Les techniques de diversification permettent de présenter aux utilisateurs des résultats offrant une meilleure nouveauté tout en évitant de les lasser par des contenus redondants et répétitifs. Grâce à la diversité, une distance entre toutes les recommandations est en effet introduite afin que celles-ci soient les plus représentatives possibles de l'ensemble des résultats pertinents. Peu de travaux exploitent la diversité des profils des utilisateurs partageant les données. Dans ce travail de thèse, nous montrons notamment que dans certains scénarios, diversifier les profils des utilisateurs apporte une nette amélioration en ce qui concerne la qualité des résultats~: des sondages montrent que dans plus de 75% des cas, les utilisateurs préfèrent la diversité des profils à celle des contenus. Par ailleurs, afin d'aborder les problèmes de distribution des données sur des sites hétérogènes, deux approches sont possibles. La première, les réseaux P2P, consiste à établir des liens entre chaque pair (noeud du réseau): étant donné un pair p, ceux avec lesquels il a établi un lien représentent son voisinage. Celui-ci est utilisé lorsque p soumet une requête q, pour y répondre. Cependant, dans les solutions de l'état de l'art, la redondance des profils des pairs présents dans les différents voisinages limitent la capacité du système à retrouver des résultats pertinents sur le réseau, étant donné les requêtes soumises par les utilisateurs. Nous montrons, dans ce travail, qu'introduire de la diversité dans le calcul du voisinage, en augmentant la couverture, permet un net gain en termes de qualité. En effet, en tenant compte de la diversité, chaque pair du voisinage a une plus forte probabilité de retourner des résultats nouveaux à l'utilisateur courant: lorsqu'une requête est soumise par un pair, notre approche permet de retrouver jusqu'à trois fois plus de bons résultats sur le réseau. La seconde approche de la distribution est le multisite. Généralement, dans les solutions de l'état de l'art, les sites sont homogènes et représentés par de gros centres de données. Dans notre contexte, nous proposons une approche permettant la collaboration de sites hétérogènes, tels que de petits serveurs d'équipe, des ordinateurs personnels ou de gros sites dans le cloud. Un prototype est issu de cette contribution. Deux versions du prototype ont été réalisées afin de répondre aux deux cas d'application, en s'adaptant notamment aux types des données. / In many fields, novel technologies employed in information acquisition and measurement (e.g. phenotyping automated greenhouses) are at the basis of a phenomenal creation of data. In particular, we focus on two real use cases: plants observations in botany and phenotyping data in biology. Our contributions can be, however, generalized to Web data. In addition to their huge volume, data are also distributed. Indeed, each user stores their data in many heterogeneous sites (e.g. personal computers, servers, cloud); yet he wants to be able to share them. In both use cases, collaborative solutions, including distributed search and recommendation techniques, could benefit to the user.Thus, the global objective of this work is to define a set of techniques enabling sharing and discovery of data in heterogeneous distributed environment, through the use of search and recommendation approaches.For this purpose, search and recommendation allow users to be presented sets of results, or recommendations, that are both relevant to the queries submitted by the users and with respect to their profiles. Diversification techniques allow users to receive results with better novelty while avoiding redundant and repetitive content. By introducing a distance between each result presented to the user, diversity enables to return a broader set of relevant items.However, few works exploit profile diversity, which takes into account the users that share each item. In this work, we show that in some scenarios, considering profile diversity enables a consequent increase in results quality: surveys show that in more than 75% of the cases, users would prefer profile diversity to content diversity.Additionally, in order to address the problems related to data distribution among heterogeneous sites, two approaches are possible. First, P2P networks aim at establishing links between peers (nodes of the network): creating in this way an overlay network, where peers directly connected to a given peer p are known as his neighbors. This overlay is used to process queries submitted by each peer. However, in state of the art solutions, the redundancy of the peers in the various neighborhoods limits the capacity of the system to retrieve relevant items on the network, given the queries submitted by the users. In this work, we show that introducing diversity in the computation of the neighborhood, by increasing the coverage, enables a huge gain in terms of quality. By taking into account diversity, each peer in a given neighborhood has indeed, a higher probability to return different results given a keywords query compared to the other peers in the neighborhood. Whenever a query is submitted by a peer, our approach can retrieve up to three times more relevant items than state of the art solutions.The second category of approaches is called multi-site. Generally, in state of the art multi-sites solutions, the sites are homogeneous and consist in big data centers. In our context, we propose an approach enabling sharing among heterogeneous sites, such as small research teams servers, personal computers or big sites in the cloud. A prototype regrouping all contributions have been developed, with two versions addressing each of the use cases considered in this thesis.
|
4 |
A hybrid decision aid approach for supply networks of multi-site enterprises redesign and strategic planing / Une démarche hybride d'aide à la décision pour la reconfiguration et la planification stratégique des réseaux logistiques des entreprises multi-sitesPirard, Florence 20 September 2005 (has links)
This thesis presents a hybrid decision aid approach for supply networks redesign and planning int the context of multi-site enterprises. This approach is iterative and integrates a mixed integer programming model and a simulation model being at different decisional levels : the mathematical model is a strategic/tactical model and the simulation model is a tactical/operational model. These two models are based on the same modelling of the supply network. First, we describe the elements constituting the decision aid approach. We present two generic mixed integer programming models, multi-product, multi-echelon and multi-period, which search to maximize the profit of the multi-site enterprise. We propose a heuristic approach to solve one of these programs. We describe the developed simulation model. It reproduces the behaviour of the whole supply chain and takes into account the management policies. then, we present the adopted integration methodology. For a problem based on industrial cases, we show that the two models have their role in the decision aid approach and that they contribute both in the search of a good quality network design.
|
5 |
Analyse des tendances d'évolution de peuplements de macroinvertébrés benthiques dans un contexte de réchauffement des eaux / Long-term trends in benthic macroinvertebrate communities in a global warming contextFloury, Mathieu 14 March 2013 (has links)
Les effets du changement climatique sur la biodiversité à l’échelle du globe sont maintenant sans équivoque. Parmi les écosystèmes affectés, les cours d’eau sont particulièrement vulnérables aux fluctuations du climat. Les modifications de structure et de composition des communautés aquatiques constituent alors un signal intégrateur des réponses écologiques à ces changements climatiques. Dans certaines circonstances, ce signal peut également être exacerbé, modéré ou potentiellement masqué par d’autres variations abiotiques.L’objectif de ce travail de thèse était donc d’évaluer l’effet relatif de différents facteurs de forçage sur les tendances d’évolution à long-terme des communautés de macroinvertébrés benthiques de grands cours d’eau, dans un contexte de changement climatique global. Nos investigations ont ciblé plus spécifiquement la Loire moyenne car, en tant que grande rivière de plaine, elle est particulièrement concernée par les problèmes liés aux stress multiples. En ce qui concerne le choix du compartiment biologique, la faune benthique a été sélectionnée pour son intérêt reconnu en bioévaluation des cours d’eau, notamment grâce à une grande diversité de réponses potentielles aux perturbations environnementales et à un certain nombre d’avantages méthodologiques.Dans un premier temps, nous nous sommes appliqués à caractériser les modifications temporelles de dix paramètres abiotiques majeurs sur trois décennies (1977-2008). Nous avons notamment mis en évidence le réchauffement graduel de la Loire (c. +1,2°C en moyenne annuelle sur les trois décades), couplé à une réduction significative du débit moyen (c. -25%), les deux tendances étant exacerbées en période chaude (mai-août). Dans le même temps, alors que ces modifications étaient susceptibles de provoquer une augmentation du niveau trophique du fleuve, nous avons souligné l’existence d’un effet confondant de l’amélioration des traitements d’épuration (i.e. réduction des apports en phosphore), se traduisant principalement par la baisse des concentrations en phosphates et la limitation des organismes phytoplanctoniques.Dans un second temps, nous nous sommes intéressés aux réponses structurelles et fonctionnelles long-terme (i.e. 30 ans) des invertébrés de la Loire à ces deux évolutions concomitantes majeures. En premier lieu, nous avons constaté que le réchauffement et, dans une moindre mesure, la réduction du débit sont impliqués dans la disparition ou le déclin progressif de taxons rhéophiles et psychrophiles (e.g. Chloroperlidae). En parallèle, ces modifications hydroclimatiques expliquent une majeure partie de l’apparition et de la colonisation de taxons limnophiles et thermophiles, comprenant certaines espèces invasives (e.g. Corbicula sp.). En termes de réponses fonctionnelles, ces changements s’illustrent par une évolution adaptative des profils de traits biologiques cohérente avec les prédictions a priori qu’il est possible de faire dans un cadre théorique. Toutefois, cette dérive progressive vers un assemblage généraliste et polluotolérant est partiellement confondue par l’amélioration de la qualité d’eau, qui explique l’apparition de nouveaux taxons polluo-sensibles lors des dernières années (e.g. Philopotamidae). Bien qu’aucune résilience taxonomique ou fonctionnelle ne soit constatée, cette tendance se manifeste, via les traits biologiques, par un transfert probable des ressources trophiques depuis les organismes phytoplanctoniques vers des biofilms épibenthiques et des macrophytes.Pour finir, nous avons exploré la variabilité spatiale multi-sites de ces tendances biotiques et abiotiques et montré que l’ensemble de ces résultats, qui corrobore déjà un certain nombre d’observations en Europe, constitue également un patron homogène le long de la Loire moyenne (sur près de 300 km) et entre différents hydrosystèmes (e.g. Loire, Seine, Meuse). / Evidence for climate change effects on biodiversity at global scale is now unequivocal. Among impaired ecosystems, running waters are particularly vulnerable to climate fluctuations. Changes in aquatic community structure and composition are then considered as integrative signals of the ecological responses to these climate changes. Under certain circumstances, these signals can be also exacerbated, confounded or potentially obscured by other abiotic variations.Therefore, the aim of this PhD was to assess the relative effect of different drivers on longterm trends in benthic macroinvertebrate communities, in the context of global climate change. Our investigations were focused more precisely on the Middle Loire River since, as lowland large river, it is particularly concerned by the potential impact of multiple stressors. Regarding the choice of the biological model, benthic fauna has been selected according to its acknowledged interest in bioassessment of running waters, especially thanks to a great diversity of potential responses to environmental disturbances and a number of methodological advantages.First, we investigated the temporal changes of ten major abiotic parameters over three decades (1977-2008). We highlighted the gradual warming of the Loire River (c. +1.2°C in the mean annual temperature over the three decades), coupled with a significant drop in mean discharge (c. -25%), both trends being exacerbated during the warm period (May-August). In the same time, although these changes were expected to induce a rise in the trophic level of the river, we emphasized a confounding effect of the wastewater treatment improvement (i.e. phosphorus input reduction), leading mainly to a drop in phosphate concentrations and a phytoplankton limitation.Second, we assessed the long-term structural and functional responses (i.e. over a 30-year period) of invertebrates of the Loire River to both major concomitant trends. On the one hand, we highlighted that water warming and to a lesser extent discharge reduction were significantly involved in the disappearance or decrease in rheophilic and psychrophilic taxa (e.g. Chloroperlidae). On the other hand, they explained also a major part of the appearance and increase of limnophilic and thermophilic taxa, including invasive species (e.g. Corbicula sp.). In terms of functional responses, these changes were illustrated by an adaptive evolution of the biological trait profiles in agreement with a priori predictions that is possible to make in a theoretical framework. However, this shift towards a generalist and pollution tolerant assemblage was partially confounded by improvement in water quality, explaining the settlement of new pollution-sensitive taxa during the last years (e.g. Philopotamidae). Although no taxonomic or functional resilience was observed, this trend was translated, via biological traits, into a probable transfer of trophic resources from phytoplankton to periphytic biofilms and macrophytes.Finally, we explored the multi-site spatial variability of these biotic and abiotic trends and we showed that our results as a whole, which supported already a number of observations in Europe, exhibited also a strong homogeneous pattern along the Middle Loire River (on nearly 300 km) and among different hydrosystems (e.g. Loire, Seine, Meuse).
|
6 |
Analyse des tendances d'évolution de peuplements de macroinvertébrés benthiques dans un contexte de réchauffement des eauxFloury, Mathieu 14 March 2013 (has links) (PDF)
Les effets du changement climatique sur la biodiversité à l'échelle du globe sont maintenant sans équivoque. Parmi les écosystèmes affectés, les cours d'eau sont particulièrement vulnérables aux fluctuations du climat. Les modifications de structure et de composition des communautés aquatiques constituent alors un signal intégrateur des réponses écologiques à ces changements climatiques. Dans certaines circonstances, ce signal peut également être exacerbé, modéré ou potentiellement masqué par d'autres variations abiotiques.L'objectif de ce travail de thèse était donc d'évaluer l'effet relatif de différents facteurs de forçage sur les tendances d'évolution à long-terme des communautés de macroinvertébrés benthiques de grands cours d'eau, dans un contexte de changement climatique global. Nos investigations ont ciblé plus spécifiquement la Loire moyenne car, en tant que grande rivière de plaine, elle est particulièrement concernée par les problèmes liés aux stress multiples. En ce qui concerne le choix du compartiment biologique, la faune benthique a été sélectionnée pour son intérêt reconnu en bioévaluation des cours d'eau, notamment grâce à une grande diversité de réponses potentielles aux perturbations environnementales et à un certain nombre d'avantages méthodologiques.Dans un premier temps, nous nous sommes appliqués à caractériser les modifications temporelles de dix paramètres abiotiques majeurs sur trois décennies (1977-2008). Nous avons notamment mis en évidence le réchauffement graduel de la Loire (c. +1,2°C en moyenne annuelle sur les trois décades), couplé à une réduction significative du débit moyen (c. -25%), les deux tendances étant exacerbées en période chaude (mai-août). Dans le même temps, alors que ces modifications étaient susceptibles de provoquer une augmentation du niveau trophique du fleuve, nous avons souligné l'existence d'un effet confondant de l'amélioration des traitements d'épuration (i.e. réduction des apports en phosphore), se traduisant principalement par la baisse des concentrations en phosphates et la limitation des organismes phytoplanctoniques.Dans un second temps, nous nous sommes intéressés aux réponses structurelles et fonctionnelles long-terme (i.e. 30 ans) des invertébrés de la Loire à ces deux évolutions concomitantes majeures. En premier lieu, nous avons constaté que le réchauffement et, dans une moindre mesure, la réduction du débit sont impliqués dans la disparition ou le déclin progressif de taxons rhéophiles et psychrophiles (e.g. Chloroperlidae). En parallèle, ces modifications hydroclimatiques expliquent une majeure partie de l'apparition et de la colonisation de taxons limnophiles et thermophiles, comprenant certaines espèces invasives (e.g. Corbicula sp.). En termes de réponses fonctionnelles, ces changements s'illustrent par une évolution adaptative des profils de traits biologiques cohérente avec les prédictions a priori qu'il est possible de faire dans un cadre théorique. Toutefois, cette dérive progressive vers un assemblage généraliste et polluotolérant est partiellement confondue par l'amélioration de la qualité d'eau, qui explique l'apparition de nouveaux taxons polluo-sensibles lors des dernières années (e.g. Philopotamidae). Bien qu'aucune résilience taxonomique ou fonctionnelle ne soit constatée, cette tendance se manifeste, via les traits biologiques, par un transfert probable des ressources trophiques depuis les organismes phytoplanctoniques vers des biofilms épibenthiques et des macrophytes.Pour finir, nous avons exploré la variabilité spatiale multi-sites de ces tendances biotiques et abiotiques et montré que l'ensemble de ces résultats, qui corrobore déjà un certain nombre d'observations en Europe, constitue également un patron homogène le long de la Loire moyenne (sur près de 300 km) et entre différents hydrosystèmes (e.g. Loire, Seine, Meuse).
|
7 |
Fouille de données d'usage du Web : Contributions au prétraitement de logs Web Intersites et à l'extraction des motifs séquentiels avec un faible supportTanasa, Doru 03 June 2005 (has links) (PDF)
Les quinze dernières années ont été marquées par une croissance exponentielle du domaine du Web tant dans le nombre de sites Web disponibles que dans le nombre d'utilisateurs de ces sites. Cette croissance a généré de très grandes masses de données relatives aux traces d'usage duWeb par les internautes, celles-ci enregistrées dans des fichiers logs Web. De plus, les propriétaires de ces sites ont exprimé le besoin de mieux comprendre leurs visiteurs afin de mieux répondre à leurs attentes. Le Web Usage Mining (WUM), domaine de recherche assez récent, correspond justement au processus d'extraction des connaissances à partir des données (ECD) appliqué aux données d'usage sur le Web. Il comporte trois étapes principales : le prétraitement des données, la découverte des schémas et l'analyse (ou l'interprétation) des résultats. Un processus WUM extrait des patrons de comportement à partir des données d'usage et, éventuellement, à partir d'informations sur le site (structure et contenu) et sur les utilisateurs du site (profils). La quantité des données d'usage à analyser ainsi que leur faible qualité (en particulier l'absence de structuration) sont les principaux problèmes en WUM. Les algorithmes classiques de fouille de données appliqués sur ces données donnent généralement des résultats décevants en termes de pratiques des internautes (par exemple des patrons séquentiels évidents, dénués d'intérêt). Dans cette thèse, nous apportons deux contributions importantes pour un processus WUM, implémentées dans notre bo^³te à outils AxisLogMiner. Nous proposons une méthodologie générale de prétraitement des logs Web et une méthodologie générale divisive avec trois approches (ainsi que des méthodes concrètes associées) pour la découverte des motifs séquentiels ayant un faible support. Notre première contribution concerne le prétraitement des données d'usage Web, domaine encore très peu abordé dans la littérature. L'originalité de la méthodologie de prétraitement proposée consiste dans le fait qu'elle prend en compte l'aspect multi-sites du WUM, indispensable pour appréhender les pratiques des internautes qui naviguent de fa»con transparente, par exemple, sur plusieurs sites Web d'une même organisation. Outre l'intégration des principaux travaux existants sur ce thème, nous proposons dans notre méthodologie quatre étapes distinctes : la fusion des fichiers logs, le nettoyage, la structuration et l'agrégation des données. En particulier, nous proposons plusieurs heuristiques pour le nettoyage des robots Web, des variables agrégées décrivant les sessions et les visites, ainsi que l'enregistrement de ces données dans un modèle relationnel. Plusieurs expérimentations ont été réalisées, montrant que notre méthodologie permet une forte réduction (jusqu'à 10 fois) du nombre des requêtes initiales et offre des logs structurés plus riches pour l'étape suivante de fouille de données. Notre deuxième contribution vise la découverte à partir d'un fichier log prétraité de grande taille, des comportements minoritaires correspondant à des motifs séquentiels de très faible support. Pour cela, nous proposons une méthodologie générale visant à diviser le fichier log prétraité en sous-logs, se déclinant selon trois approches d'extraction de motifs séquentiels au support faible (Séquentielle, Itérative et Hiérarchique). Celles-ci ont été implémentées dans des méthodes concrètes hybrides mettant en jeu des algorithmes de classification et d'extraction de motifs séquentiels. Plusieurs expérimentations, réalisées sur des logs issus de sites académiques, nous ont permis de découvrir des motifs séquentiels intéressants ayant un support très faible, dont la découverte par un algorithme classique de type Apriori était impossible. Enfin, nous proposons une boite à outils appelée AxisLogMiner, qui supporte notre méthodologie de prétraitement et, actuellement, deux méthodes concrètes hybrides pour la découverte des motifs séquentiels en WUM. Cette boite à outils a donné lieu à de nombreux prétraitements de fichiers logs et aussi à des expérimentations avec nos méthodes implémentées.
|
Page generated in 0.4155 seconds