Global ETD Search

1	Une représentation visuelle avancée pour l'apprentissage sémantique dans les bases d'images / A Higher-level Visual Representation for Semantic Learning in Image Databases El Sayad, Ismail 18 July 2011 (has links) Avec l'augmentation exponentielle de nombre d'images disponibles sur Internet, le besoin en outils efficaces d'indexation et de recherche d'images est devenu important. Dans cette thèse, nous nous baserons sur le contenu visuel des images comme source principale d'informations pour leur représentation. Basés sur l'approche des sacs de mots visuels, nous proposons une représentation visuelle avancée. Chaque image est modélisée par un mélange de catégories visuelles sémantiques, reliées à des catégories de haut niveau. Dans un premier temps, nous améliorons l'approche des sacs de mots visuels en caractérisant la constitution spatio-colorimétrique d'une image par le biais d'un mélange de n Gaussiennes dans l'espace de caractéristiques. Cela permet de proposer un nouveau descripteur de contour qui joue un rôle complémentaire avec le descripteur SURF. Cette proposition nous permet de résoudre le problème lié à la perte d'informations spatiales des sacs de mots visuels, et d'incorporer différentes informations relatives au contenu de l'image. Dans un deuxième temps, nous introduisons un nouveau modèle probabiliste basé sur les catégories : le modèle MSSA (Multilayer Semantic Significance Analysis ou Analyse multi-niveaux de la pertinence sémantique) dans le but d'étudier la sémantique des mots visuels construits. Ce modèle permet de construire des mots visuels sémantiquement cohérents (SSVW - Semantically Significant Visual Word). Ensuite, nous renforçons la capacité de catégorisation des SSVW en construisant des phrases visuelles sémantiquement cohérentes (SSVP - Semantically Significant Visual Phrase), à partir des SSVW qui apparaissent fréquemment. Nous améliorons également l'invariance intra-classes des SSVW et des SSVP en les indexant en fonction de leur répartition, ce qui nous amène à générer une représentation d'un glossaire visuel invariant et sémantiquement cohérent (SSVIG - Semantically Significant Visual Glossary). Enfin, nous proposons un nouveau schéma de pondération spatiale ainsi qu'un classifieur multi-classes basé sur un vote. Nos résultats expérimentaux extensifs démontrent que la représentation visuelle proposée permet d'atteindre de meilleures performances comparativement aux représentations traditionnelles utilisées dans le domaine de la recherche, la classification et de la reconnaissance d'objets. / With the availability of massive amounts of digital images in personal and on-line collections, effective techniques for navigating, indexing and searching images become more crucial. In this thesis, we rely on the image visual content as the main source of information to represent images. Starting from the bag of visual words (BOW) representation, a higher-level visual representation is learned where each image is modeled as a mixture of visual topics depicted in the image and related to high-level topics. First, we enhance the BOW representation by characterizing the spatial-color constitution of an image with a mixture of n Gaussians in the feature space. This leads to propose a novel descriptor, the Edge Context, which plays a role as a complementary descriptor in addition to the SURF descriptor. Such enhancements incorporate different image content information. Second, we introduce a new probabilistic topic model, Multilayer Semantic Significance Analysis (MSSA) model, in order to study a semantic inference of the constructed visual words. Consequently, we generate the Semantically Significant Visual Words (SSVWs). Third, we strengthen the discrimination power of SSVWs by constructing Semantically Significant Visual Phrases (SSVPs) from frequently co-occurring SSVWs that are semantically coherent. We partially bridge the intra-class visual diversity of the images by re-indexing the SSVWs and the SSVPs based on their distributional clustering. This leads to generate a Semantically Significant Invariant Visual Glossary (SSVIG) representation. Finally, we propose a new spatial weighting scheme and a Multiclass Vote-Based Classifier (MVBC) based on the proposed SSVIG representation. The large-scale extensive experimental results show that the proposed higher-level visual representation outperforms the traditional part-based image representations in retrieval, classification and object recognition. Pondération spatiale
2	Feature selection and term weighting beyond word frequency for calls for tenders documents Ma, Qing January 2006 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Classification Pondération Sélection de caractéristiques Appel d'offre
3	Contribution à l’économétrie spatiale et l’analyse de données fonctionnelles / Contribution to spatial econometric and functional data analysis Gharbi, Zied 24 June 2019 (has links) Ce mémoire de thèse touche deux champs de recherche importants en statistique inférentielle, notamment l’économétrie spatiale et l’analyse de données fonctionnelles. Plus précisément, nous nous sommes intéressés à l’analyse de données réelles spatiales ou spatio-fonctionnelles en étendant certaines méthodes inférentielles pour prendre en compte une éventuelle dépendance spatiale. Nous avons d’abord considéré l’estimation d’un modèle autorégressif spatiale (SAR) ayant une variable dépendante fonctionnelle et une variable réponse réelle à l’aide d’observations sur une unité géographique donnée. Il s’agit d’un modèle de régression avec la spécificité que chaque observation de la variable indépendante collectée dans un emplacement géographique dépend d’observations de la même variable dans des emplacements voisins. Cette relation entre voisins est généralement mesurée par une matrice carrée nommée matrice de pondération spatiale et qui mesure l’effet d’interaction entre les unités spatiales voisines. Cette matrice est supposée exogène c’est-à-dire la métrique utilisée pour la construire ne dépend pas des mesures de variables explicatives du modèle. L’apport de cette thèse sur ce modèle réside dans le fait que la variable explicative est de nature fonctionnelle, à valeurs dans un espace de dimension infinie. Notre méthodologie d’estimation est basée sur une réduction de la dimension de la variable explicative fonctionnelle, par l’analyse en composantes principales fonctionnelles suivie d’une maximisation de la vraisemblance tronquée du modèle. Des propriétés asymptotiques des estimateurs, des illustrations des performances des estimateurs via une étude de Monte Carlo et une application à des données réelles environnementales ont été considérées. Dans la deuxième contribution, nous reprenons le modèle SAR fonctionnel étudié dans la première partie en considérant une structure endogène de la matrice de pondération spatiale. Au lieu de se baser sur un critère géographique pour calculer les dépendances entre localisations voisines, nous calculons ces dernières via un processus endogène, c’est-à-dire qui dépend des variables à expliquées. Nous appliquons la même approche d’estimation à deux étapes décrite ci-dessus, nous étudions aussi les performances de l’estimateur proposé pour des échantillons à taille finie et discutons le cadre asymptotique. Dans la troisième partie de cette contribution, nous nous intéressons à l’hétéroscédasticité dans les modèles partiellement linéaires pour variables exogènes réelles et variable réponse binaire. Nous proposons un modèle Probit spatial contenant une partie non-paramétrique. La dépendance spatiale est introduite au niveau des erreurs (perturbations) du modèle considéré. L’estimation des parties paramétrique et non paramétrique du modèle est récursive et consiste à fixer d’abord les composants paramétriques et à estimer la partie non paramétrique à l’aide de la méthode de vraisemblance pondérée puis utiliser cette dernière estimation pour construire un profil de la vraisemblance pour estimer la partie paramétrique. La performance de la méthode proposée est étudiée via une étude Monte Carlo. La contribution finit par une étude empirique sur la relation entre la croissance économique et la qualité environnementale en Suède à l’aide d’outils de l’économétrie spatiale. / This thesis covers two important fields of research in inferential statistics, namely spatial econometrics and functional data analysis. More precisely, we have focused on the analysis of real spatial or spatio-functional data by extending certain inferential methods to take into account a possible spatial dependence. We first considered the estimation of a spatial autoregressive model (SAR) with a functional dependent variable and a real response variable using observations on a given geographical unit. This is a regression model with the specificity that each observation of the independent variable collected in a geographical location depends on observations of the same variable in neighboring locations. This relationship between neighbors is generally measured by a square matrix called the spatial weighting matrix, which measures the interaction effect between neighboring spatial units. This matrix is assumed to be exogenous, i.e. the metric used to construct it does not depend on the explanatory variable. The contribution of this thesis to this model lies in the fact that the explanatory variable is of a functional nature, with values in a space of infinite dimension. Our estimation methodology is based on a dimension reduction of the functional explanatory variable through functional principal component analysis followed by maximization of the truncated likelihood of the model. Asymptotic properties of the estimators, illustrations of the performance of the estimators via a Monte Carlo study and an application to real environmental data were considered. In the second contribution, we use the functional SAR model studied in the first part by considering an endogenous structure of the spatial weighting matrix. Instead of using a geographical criterion to calculate the dependencies between neighboring locations, we calculate them via an endogenous process, i.e. one that depends on explanatory variables. We apply the same two-step estimation approach described above and study the performance of the proposed estimator for finite or infinite-tending samples. In the third part of this thesis we focus on heteroskedasticity in partially linear models for real exogenous variables and binary response variable. We propose a spatial Probit model containing a non-parametric part. Spatial dependence is introduced at the level of errors (perturbations) of the model considered. The estimation of the parametric and non-parametric parts of the model is recursive and consists of first setting the parametric parameters and estimating the non-parametric part using the weighted likelihood method and then using the latter estimate to construct a likelihood profile to estimate the parametric part. The performance of the proposed method is investigated via a Monte-Carlo study. An empirical study on the relationship between economic growth and environmental quality in Sweden using some spatial econometric tools finishes the document. Données fonctionnelles Matrice de pondération spatiale Estimateur à noyau Hétéroscédasticité spatiale 519.536
4	Données probantes ou feuilles de thé ? : de l'importance du principe d'ignorabilité dans la correction du biais de sélection Poirier, William 19 January 2024 (has links) Titre de l'écran-titre (visionné le 16 janvier 2024) / Ce mémoire mobilise l'interdisciplinarité des sciences sociales computationnelles afin d'étudier les conséquences d'une approche non probabiliste aux sondages. Spécifiquement, il a pour objectif d'illustrer ce en quoi les sondages « opt-in » sont problématiques et à quel point il est possible de les corriger. Le chapitre 1 aborde les origines du débat concernant le biais de sélection, et établit les bases théoriques et statistiques requises à sa compréhension. Le chapitre 2 est le cœur du mémoire et applique concrètement le principe d'ignorabilité à l'aide de données simulées. On y apprend qu'il n'y a pas de limites théoriques à la capacité de correction de la pondération. Le chapitre 3 mobilise des données réelles afin d'explorer les limites rencontrées en pratiques. Ce dernier développe également le prototype d'une méthode d'analyse de sensibilité des quantités descriptives afin de tester la performance de la correction. / This Master's thesis mobilizes the interdisciplinarity of computational social science to study the consequences of a non-probabilistic approach to surveys. Specifically, it illustrates why opt-in surveys are problematic and how they can be corrected. Chapter 1 addresses the origins of the debate regarding selection bias, and establishes the theoretical and statistical understanding required. Chapter 2 is the heart of the thesis and concretely applies the ignorability principle using simulated data. We learn that there are no theoretical limits to the correction capacity of weighting techniques. Chapter 3 uses real data to explore the limits encountered in practice. The latter also develops a tentative method for sensibility analysis of descriptive quantities in order to test the performance of the correction. Biais algorithmiques. Échantillonnage (Statistique) Sciences sociales numériques. Plans de pondération.
5	La saillance des promesses électorales : ses outils, ses mesures et sa validité Tremblay-Antoine, Camille 25 March 2024 (has links) Thèse ou mémoire avec insertion d'articles. / Les outils de suivi des promesses électorales (OSPÉ) produisent un score de complétion des engagements électoraux en considérant chaque promesse comme étant égales. Mais la littérature sur le mandat démocratique montre que chaque promesse n'a pas la même importance dans la société. Cette thèse vise à développer un indice automatisé de pondération des promesses en fonction de leur importance dans la sphère publique. Une étude de la portée de la littérature est menée et montre que plusieurs défis se posent au niveau de l'opérationnalisation de cette importance. Basé sur la littérature existante cette thèse identifie les différentes approches utilisées pour mesurer l'importance par la saillance dans notre société, teste leur fiabilité et les applique au cas du Polimètre, un OSPÉ canadien. Cette recherche prend la forme d'une thèse par articles où le concept de saillance est central. L'article How Can We Size Your Core Issue : Assessing Salience Validity using Psychophysiology compare les résultats de la saillance d'enjeux obtenus à partir de mesures traditionnellement utilisées en science politique avec des résultats issus de mesures physiologiques. Un devis expérimental en laboratoire est déployé afin de déterminer les correspondances entre différentes mesures de saillance personnelle et les réactions émotionnelles des répondants mesurées avec la conduction cutanée et la dilatation pupillaire. Les résultats montrent une forte corrélation entre toutes les mesures testées et valident donc les approches d'enquête conventionnelles utilisées en science politique pour mesurer la saillance des enjeux. L'article Weighting Pledge Trackers Scores : A Measure Based on Pledge Salience est construit sur les conclusions de l'étude de la portée de la littérature ainsi que sur les résultats obtenus par la validation, dans le premier article, des mesures de saillance individuelle. À partir des dimensions de la saillance utilisés dans la littérature - dans l'opinion publique, dans la sphère politique, dans les médias et dans les groupes d'intérêts - une mesure agrégée de la saillance des promesses pondérée est conceptualisée, opérationnalisée puis testée. L'OSPÉ Polimètre Trudeau est utilisé pour comparer son score non pondéré d'accomplissement d'engagement électoraux avec le score pondéré en fonction de la saillance. Le score global de réalisation des promesses pondéré en fonction de la saillance est inférieur à celui non pondéré du Polimètre Trudeau. Finalement, l'article Who cares about pledges ? A conjoint analysis of factors influencing political parties' perception and vote choice in Canada présente les résultats d'un devis de recherche expérimental par analyse conjointe qui évalue l'importance perçue par les citoyens de la complétion des engagements électoraux par les partis élus. Les théories du comportement de vote offrent un aperçu de la façon dont le respect des engagements est considéré par les citoyens lorsqu'ils votent, mais n'aborde pas cette variable en lien avec celles de l'entonnoir de causalité. Cet article mesure l'importance pour les citoyens du respect des engagements en la comparant aux variables de l'entonnoir de causalité. Les résultats montrent que le fait qu'un parti politique respecte ses engagements électoraux et qu'il priorise les enjeux importants pour les répondants sont les prédicteurs les plus forts de la perception qu'ont les répondants de ce parti, et même du choix de vote. Les résultats montrent que parmi l'idéologie, l'attachement émotionnel au parti, les enjeux traités par le parti, l'image du candidat et la réalisation des promesses électorales, cette dernière caractéristique est l'une des plus influentes sur la perception d'un parti par les Canadiens. En somme, les résultats de cette thèse permettent de mieux conceptualiser et opérationnaliser la saillance des promesses électorales. Puisque les perceptions des citoyens par rapport à la complétion des promesses électorales présente une importance dans leur choix de vote, les résultats de cette thèses incitent à considérer les OSPÉ avec prudence. Ces outils présentent un grand potentiel d'impact en termes d'éducation politique, d'information, de construction par les citoyens de leur évaluation des performances gouvernementales ou encore de leur choix de vote. Cet impact potentiel devrait motiver la communauté académique à étudier les méthodologies sous-jacentes à l'établissement de pronostics sur le respect des engagements électoraux de ces outils. Les résultats incitent également à recommander aux développeurs actuels et futurs d'OSPÉ d'intégrer l'indice de pondération des promesses développé dans cette recherche afin de produire un score de complétion plus précis. / Campaign pledge evaluation tools (CPETs) track the congruence between election pledges and their completion and produce a completion score by considering each pledge as equal. But the literature on the democratic mandate shows that not every promise has the same importance in the public arena. This thesis aims to develop a pledge automated weighting index according to each pledge's importance in the society. A scoping review of the literature is conducted and shows that several challenges arise in operationalizing this salience. Based on the existing literature, this thesis identifies the different approaches used to measure importance by salience in our society, tests their reliability and applies them to the case of the Polimeter, a Canadian CPET. This research takes the form of a thesis by articles where the concept of salience is central. The paper How Can We Size Your Core Issue : Assessing Salience Validity using Psychophysiology compare results of society stakes salience obtained with conventional measurements used in political science with physiological measures. An experimental design in laboratory is deployed in order to assess the correspondences between different measures of personal salience and the emotional reactions of respondents measured with skin conduction and pupillary dilation. Results show a strong correlation between all the measures tested and therefore validate the conventional survey approaches used in political science to measure issue salience. The paper Weighting Pledge Fulfillment : A Measure Based on Pledge Salience is built on the conclusions of the scoping review as well as on the results obtained by the validation, in the first article, of the individual salience measurements. From the dimensions of salience used in the literature - in public opinion, in the political arena, in the media and in interest groups - a weighted aggregate measure of pledge salience is conceptualized, operationalized, and tested. The CPET Trudeau Polimeter is used to compare its unweighted electoral commitment achievement score with the weighted score. The overall salience-weighted promise fulfillment score is lower than the unweighted Trudeau Polimeter score. Finally, the paper Who Cares About Pledges ? A Conjoint Analysis of Factors Influencing Political Parties' Perception and Vote Choice in Canada presents results from an experimental research design using conjoint analysis that assess the importance perceived by citizens of the fulfillment of electoral commitments by elected parties. Voting behavior theories offer insight into how fulfillment of commitments is viewed by citizens when they vote, but do not address this variable in relation with the causal funnel variables. This research measures the importance citizens place in governments respecting their commitments by comparing it to the variables of the causal funnel. Results show that the fact that a political party respects its electoral commitments and that it prioritizes the issues that are important to respondents are the strongest predictors of the perception that respondents have of this party, and even of the vote choice. Results also show that among the ideology, the emotional attachment to the party, the issues dealt with by the party, the image of the candidate and the fulfillment of electoral promises, this last characteristic is one of the most influential on the perception of a party by Canadians. In all, the results of this thesis make it possible to better conceptualize and operationalize the salience of electoral promises. Since citizens' perceptions of electoral pledge fulfillment is important in their choice of vote, the results of this thesis encourage to consider CPETs cautiously. These tools have great potential for impact in terms of political education, information, construction by citizens of their evaluation of government performance or their choice of vote. This potential impact should motivate the academic community to study the methodologies underlying CPETs scores. Results also encourage us to recommend that current and future CPETs developers integrate the promise weighting index based on salience developed in this research in order to produce a more accurate completion scores. Promesses électorales -- Évaluation. Plans de pondération.
6	Techniques d'optimisation non convexe basée sur la programmation DC et DCA et méthodes évolutives pour la classification non supervisée / Non convex optimization techniques based on DC programming and DCA and evolution methods for clustering Ta, Minh Thuy 04 July 2014 (has links) Nous nous intéressons particulièrement, dans cette thèse, à quatre problèmes en apprentissage et fouille de données : clustering pour les données évolutives, clustering pour les données massives, clustering avec pondération de variables et enfin le clustering sans connaissance a priori du nombre de clusters avec initialisation optimale des centres de clusters. Les méthodes que nous décrivons se basent sur des approches d’optimisation déterministe, à savoir la programmation DC (Difference of Convex functions) et DCA (Difference of Convex Algorithms), pour la résolution de problèmes de clustering cités précédemment, ainsi que des approches évolutionnaires élitistes. Nous adaptons l’algorithme de clustering DCA–MSSC pour le traitement de données évolutives par fenêtres, en appréhendant les données évolutives avec deux modèles : fenêtres fixes et fenêtres glissantes. Pour le problème du clustering de données massives, nous utilisons l’algorithme DCA en deux phases. Dans la première phase, les données massives sont divisées en plusieurs sous-ensembles, sur lesquelles nous appliquons l’algorithme DCA–MSSC pour effectuer un clustering. Dans la deuxième phase, nous proposons un algorithme DCA-Weight pour effectuer un clustering pondéré sur l’ensemble des centres obtenues à la première phase. Concernant le clustering avec pondération de variables, nous proposons également deux approches: clustering dur avec pondération de variables et clustering floue avec pondération de variables. Nous testons notre approche sur un problème de segmentation d’image. Le dernier problème abordé dans cette thèse est le clustering sans connaissance a priori du nombre des clusters. Nous proposons pour cela une approche évolutionnaire élitiste. Le principe consiste à utiliser plusieurs algorithmes évolutionnaires (EAs) en même temps, de les faire concourir afin d’obtenir la meilleure combinaison de centres initiaux pour le clustering et par la même occasion le nombre optimal de clusters. Les différents tests réalisés sur plusieurs ensembles de données de grande taille sont très prometteurs et montrent l’efficacité des approches proposées / This thesis focus on four problems in data mining and machine learning: clustering data streams, clustering massive data sets, weighted hard and fuzzy clustering and finally the clustering without a prior knowledge of the clusters number. Our methods are based on deterministic optimization approaches, namely the DC (Difference of Convex functions) programming and DCA (Difference of Convex Algorithm) for solving some classes of clustering problems cited before. Our methods are also, based on elitist evolutionary approaches. We adapt the clustering algorithm DCA–MSSC to deal with data streams using two windows models: sub–windows and sliding windows. For the problem of clustering massive data sets, we propose to use the DCA algorithm with two phases. In the first phase, massive data is divided into several subsets, on which the algorithm DCA–MSSC performs clustering. In the second phase, we propose a DCA–Weight algorithm to perform a weighted clustering on the obtained centers in the first phase. For the weighted clustering, we also propose two approaches: weighted hard clustering and weighted fuzzy clustering. We test our approach on image segmentation application. The final issue addressed in this thesis is the clustering without a prior knowledge of the clusters number. We propose an elitist evolutionary approach, where we apply several evolutionary algorithms (EAs) at the same time, to find the optimal combination of initial clusters seed and in the same time the optimal clusters number. The various tests performed on several sets of large data are very promising and demonstrate the effectiveness of the proposed approaches. Apprentissage Fouille de données Clustering Données évolutives Données massives Pondération de variables Optimisation 006.312
7	De nouveaux facteurs pour l'exploitation de la sémantique d'un texte en Recherche d'Information Mallak, Ihab 11 July 2011 (has links) (PDF) Les travaux présentés dans ce mémoire se situent dans le contexte de la recherche d'information. Plus précisément, nous proposons de nouveaux facteurs " centralité, fréquence conceptuelle" permettant à notre sens, de mieux caractériser la dimension sémantique du contenu des textes, allant au-delà des méthodes d'indexation classiques basées exclusivement sur les statistiques. Ces facteurs devraient tirer parti de l'identification de différents types de relations telles que -est-une partie-de, liés à, synonymie, domaine, etc.- qui existent entre les mots d'un texte. RI Relations Sémantiques Contenu Sémantique Ontologies Facteurs de pondération
8	Modélisation hybride RANS / LES temporelle des écoulements turbulents Friess, Christophe 07 December 2010 (has links) (PDF) En situation industrielle, le calcul des caractéristiques instationnaires et tridimensionnelles d' écoulements complexes, est souvent nécessaire. La simulation des grandes échelles requiert un coût de calcul prohibitif surtout près de parois. L'un des objectifs des méthodes hybrides est d'optimiser le coût de calcul, en simulant certaines zones d'un écoulement en mode RANS et d'autres en mode LES. Cette dernière s'articule en géné́ral autour du filtrage spatial, alors que dans la plupart des écoulements, l'opérateur RANS correspond à une moyenne temporelle. L'approche PITM (Partially Integrated Transport Model ), conçue en turbulence homogène, est une méthode hybride justifié́e thé́oriquement. Sa transposition au contexte temporel (turbulence stationnaire) a déjà été explorée précédemment, montrant que, sous certaines hypothèses, les versions spatiale et temporelle sont formellement identiques. La méthode PITM présente toutefois une certaine difficulté à piloter le niveau de résolution. La présente thèse propose une approche dynamique pour corriger ce point. Dans un second temps, la version temporelle du PITM, le T -PITM, est comparé à la DES (Detached Eddy Simulation), une méthode hybride populaire, mais empirique. Il est montré que les deux méthodes produisent des résultats similaires, conférant une justification théorique par procuration, à la DES. Le modèle RANS sous-jacent est la pondération elliptique, permettant la prise en compte des effets induits par une paroi, sans utiliser de fonctions d'amortissement ni de lois de paroi. [SPI] Engineering Sciences hybride RANS LES temporel PITM DES approche dynamique pondération elliptique
9	Vers des systèmes de recommandation robustes pour la navigation Web : inspiration de la modélisation statistique du langage Bonnin, Geoffray 23 November 2010 (has links) (PDF) Le but de cette thèse est d'améliorer la qualité des systèmes de recommandation pour la navigation Web en utilisant la séquentialité des actions de navigation des utilisateurs. La notion de séquentialité a déjà été étudiée dans ce contexte. De telles études tentent habituellement de trouver un bon compromis entre précision, complexité en temps et en mémoire, et couverture. De plus, le Web a cela de particulier que du bruit peut être contenu au sein des navigations (erreurs de navigation, apparition de pop-ups, etc.), et que les utilisateurs peuvent effectuer des navigations parallèles. La plupart des modèles qui ont été proposés dans la littérature exploitent soit des suites contiguës de ressources et ne sont pas résistants au bruit, soit des suites discontiguës de ressources et induisent une complexité en temps et en mémoire importantes. Cette complexité peut être réduite en effectuant une sélection sur les séquences, mais cela engendre alors des problèmes de couverture. Enfin à notre connaissance, le fait que les utilisateurs puissent effectuer des navigations parallèles n'a jamais été étudié du point de vue de la recommandation. La problématique de cette thèse est donc de proposer un nouveau modèle séquentiel ayant les cinq caractéristiques suivantes : (1) une bonne précision de recommandation, (2) une bonne résistance au bruit, (3) la prise en compte des navigations parallèles, (4) une bonne couverture (5) et une faible complexité en temps et en mémoire. Afin de répondre à cette problématique, nous nous inspirons de la Modélisation Statistique du Langage (MSL), qui a des caractéristiques très proches de celles de la navigation Web. La MSL est étudiée depuis beaucoup plus longtemps que les systèmes de recommandation et a largement prouvé sa précision et son efficacité. De plus, la plupart des modèles statistiques de langage qui ont été proposés prennent en compte des séquences. Nous avons donc étudié la possibilité d'exploiter les modèles utilisés en MSL et leur adaptation aux contraintes spécifiques de la navigation Web. [INFO] Computer Science Systèmes de recommandation navigation Web modèles statistiques de langage skipping pondération anytime tabbing
10	Fiabilité des systèmes embarqués Voiculescu, Sorin 03 July 2009 (has links) (PDF) Les travaux présentés dans cette thèse abordent la problématique de l'estimation de la fiabilité des systèmes qui est devenue un enjeu majeur pour les entreprises et ce dès les premières phases de développement. En effet, plus tôt les caractéristiques d'un produit ou d'un système sont appréhendées dans son cycle de vie et moins les risques ( financiers ou liés à la sécurité des installations ), dus à la non réalisation des performances attendues sont élevés. Dans un contexte exigeant des systèmes de plus en plus fiables et sûrs, et de durées de garanties croissantes, il est impératif de vérifier le plus rapidement possible que les performances des systèmes soient conformes au cahier des charges. La démarche idéale pour identifier la fiabilité d'un produit ou d'un système avant sa fabrication en série, est de procéder à des séries d'essais sur des prototypes, quand ils existent. Cette démarche nécessite un investissement trop important en temps en nombre de prototypes, car ces derniers étant de plus en plus fiables, l'observation de défaillances est de moins en moins probable . [SPI] Engineering Sciences fiabilité modèle de vie accelérée estimation Bayésienne pondération environnement aléatoire

Search results