Spelling suggestions: "subject:"prétraitement"" "subject:"prétraitements""
41 |
Comparaison du processus d'information sur support papier et sur support électronique : contribution à une nouvelle pédagogie de l'information pour l'orientation scolaire et professionnelle / Comparison of the information process on paper and electronically : contribution to a new pedagogy of information for educational and vocational guidanceEben Rhouma, Ammar 17 December 2014 (has links)
L'objectif le plus global des approches éducatives de l'orientation est d'organiser l'information et l'orientation des élèves dans un processus éducatif continu. Il ne s'agit pas d'orienter les élèves ; mais de les aider à concevoir et à conduire de manière progressivement autonome, une démarche de projet scolaire, puis professionnel. Dans ce cadre, il paraît judicieux de développer chez tous les élèves les compétences qui leur permettront de gérer leur processus d'information, or aujourd'hui encore, ceci ne fait pas l'objet d'une formation systématique au collège. Avec la convergence des formats hypertexte et multimédia un renouvellement des problématiques pédagogiques de l'auto information s'impose. Pourquoi, malgré tous les efforts de l'institution, le niveau d'information des élèves en matière d'orientation reste-t-il toujours insatisfaisant ? Après une phase de modélisation théorique du processus d'information pour identifier les causes de dysfonctionnement du système, nous avons entrepris une recherche-action dans le but d'éprouver les solutions induites de nos résultats théoriques sur le savoir s'informer en ligne. L'intérêt de cette démarche est de sensibiliser l'équipe éducative aux difficultés spécifiques de la lecture des informations en ligne, de concevoir l'accompagnement pédagogique d'une démarche autonome de l'élève et d'aider les concepteurs de nouveaux dispositifs à prendre en compte ces spécificités. / The most overall objective of educational approaches the orientation is to organize the information and guidance of students in an ongoing educational process. It does not refer students; but to help them to design and lead gradually autonomously approach to school project and professional. In this context, it makes sense to develop in all students the skills to manage their information process, or even today, this is not the subject of systematic training in college. With the convergence of hypertext and multimedia formats renewal of educational problems of auto information is required. Why, despite all the institution's efforts, the level of information in guidance students he remains unsatisfactory? After a theoretical modeling phase of the information process to identify the causes of system malfunction, we undertook an action research in order to test the induced solutions of our theoretical results on the know go online. The advantage of this approach is to raise the educational team to the specific difficulties of reading information online, designing educational support an autonomous process of the student and help designers of new devices to take these specificities into account.
|
42 |
Fouille de données d'usage du Web : Contributions au prétraitement de logs Web Intersites et à l'extraction des motifs séquentiels avec un faible supportTanasa, Doru 03 June 2005 (has links) (PDF)
Les quinze dernières années ont été marquées par une croissance exponentielle du domaine du Web tant dans le nombre de sites Web disponibles que dans le nombre d'utilisateurs de ces sites. Cette croissance a généré de très grandes masses de données relatives aux traces d'usage duWeb par les internautes, celles-ci enregistrées dans des fichiers logs Web. De plus, les propriétaires de ces sites ont exprimé le besoin de mieux comprendre leurs visiteurs afin de mieux répondre à leurs attentes. Le Web Usage Mining (WUM), domaine de recherche assez récent, correspond justement au processus d'extraction des connaissances à partir des données (ECD) appliqué aux données d'usage sur le Web. Il comporte trois étapes principales : le prétraitement des données, la découverte des schémas et l'analyse (ou l'interprétation) des résultats. Un processus WUM extrait des patrons de comportement à partir des données d'usage et, éventuellement, à partir d'informations sur le site (structure et contenu) et sur les utilisateurs du site (profils). La quantité des données d'usage à analyser ainsi que leur faible qualité (en particulier l'absence de structuration) sont les principaux problèmes en WUM. Les algorithmes classiques de fouille de données appliqués sur ces données donnent généralement des résultats décevants en termes de pratiques des internautes (par exemple des patrons séquentiels évidents, dénués d'intérêt). Dans cette thèse, nous apportons deux contributions importantes pour un processus WUM, implémentées dans notre bo^³te à outils AxisLogMiner. Nous proposons une méthodologie générale de prétraitement des logs Web et une méthodologie générale divisive avec trois approches (ainsi que des méthodes concrètes associées) pour la découverte des motifs séquentiels ayant un faible support. Notre première contribution concerne le prétraitement des données d'usage Web, domaine encore très peu abordé dans la littérature. L'originalité de la méthodologie de prétraitement proposée consiste dans le fait qu'elle prend en compte l'aspect multi-sites du WUM, indispensable pour appréhender les pratiques des internautes qui naviguent de fa»con transparente, par exemple, sur plusieurs sites Web d'une même organisation. Outre l'intégration des principaux travaux existants sur ce thème, nous proposons dans notre méthodologie quatre étapes distinctes : la fusion des fichiers logs, le nettoyage, la structuration et l'agrégation des données. En particulier, nous proposons plusieurs heuristiques pour le nettoyage des robots Web, des variables agrégées décrivant les sessions et les visites, ainsi que l'enregistrement de ces données dans un modèle relationnel. Plusieurs expérimentations ont été réalisées, montrant que notre méthodologie permet une forte réduction (jusqu'à 10 fois) du nombre des requêtes initiales et offre des logs structurés plus riches pour l'étape suivante de fouille de données. Notre deuxième contribution vise la découverte à partir d'un fichier log prétraité de grande taille, des comportements minoritaires correspondant à des motifs séquentiels de très faible support. Pour cela, nous proposons une méthodologie générale visant à diviser le fichier log prétraité en sous-logs, se déclinant selon trois approches d'extraction de motifs séquentiels au support faible (Séquentielle, Itérative et Hiérarchique). Celles-ci ont été implémentées dans des méthodes concrètes hybrides mettant en jeu des algorithmes de classification et d'extraction de motifs séquentiels. Plusieurs expérimentations, réalisées sur des logs issus de sites académiques, nous ont permis de découvrir des motifs séquentiels intéressants ayant un support très faible, dont la découverte par un algorithme classique de type Apriori était impossible. Enfin, nous proposons une boite à outils appelée AxisLogMiner, qui supporte notre méthodologie de prétraitement et, actuellement, deux méthodes concrètes hybrides pour la découverte des motifs séquentiels en WUM. Cette boite à outils a donné lieu à de nombreux prétraitements de fichiers logs et aussi à des expérimentations avec nos méthodes implémentées.
|
Page generated in 0.0767 seconds