Global ETD Search

21	Estimating the probability of a fleet vehicle accident : a deep learning approach using conditional variational auto-encoders Malette-Campeau, Marie-Ève 08 1900 (has links) Le risque est la possibilité d'un résultat négatif ou indésirable. Dans nos travaux, nous évaluons le risque d'accident d'un véhicule de flotte à partir des données de 1998 et 1999 fournies par la Société d'assurance automobiles du Québec (SAAQ), où chaque observation correspond à un camion transporteur de marchandises, et pour lequel le nombre d'accidents qu'il a eues l'année suivante est connue. Pour chaque véhicule, nous avons des informations telles que le nombre et le type d'infractions qu'il a eues, ainsi que certaines de ses caractéristiques comme la taille ou le nombre de cylindres. Avec notre objectif à l'esprit, nous proposons une nouvelle approche utilisant des auto-encodeurs variationnels conditionnels (CVAE) en considérant deux hypothèses de distribution, Binomiale Négative et Poisson, pour modéliser la distribution d'un accident de véhicule de flotte. Notre motivation principale pour l'utilisation d'un CVAE est de capturer la distribution conjointe entre le nombre d'accidents d'un véhicule de flotte et les variables prédictives de tels accidents, et d'extraire des caractéristiques latentes qui aident à reconstruire la distribution du nombre d'accidents de véhicules de flotte. Nous comparons ainsi la CVAE avec d'autres méthodes probabilistes, comme un modèle MLP qui apprend la distribution du nombre d'accidents de véhicules de flotte sans extraire de représentations latentes significatives. Nous avons constaté que le CVAE surpasse légèrement le modèle MLP, ce qui suggère qu'un modèle capable d'apprendre des caractéristiques latentes a une valeur ajoutée par rapport à un autre qui ne le fait pas. Nous avons également comparé le CVAE avec un autre modèle probabiliste de base, le modèle linéaire généralisé (GLM), ainsi qu'avec des modèles de classification. Nous avons constaté que le CVAE et le GLM utilisant la distribution binomiale négative ont tendance à montrer de meilleurs résultats. De plus, nous développons de nouvelles variables prédictives qui intègrent des caractéristiques liées à l'ensemble de la flotte en plus des caractéristiques individuelles pour chaque véhicule. L'utilisation de ces nouvelles variables prédictives se traduit par une amélioration des performances de tous les modèles mis en œuvre dans nos travaux utilisés pour évaluer la probabilité d'un accident de véhicule de flotte. / Risk is the possibility of a negative or undesired outcome. In our work, we evaluate the risk of a fleet vehicle accident using the 1998 and 1999 records from the files of the Societe d'assurance automobiles du Quebec (SAAQ), where each observation in the data set corresponds to a truck carrier of merchandise, and where the number of accidents during the following year it had. For each vehicle, we have useful information such as the number and type of violations it had, as well as some of its characteristics like the number of axles or the number of cylinders. With our objective in mind, we propose a new approach using conditional variational auto-encoders (CVAE) considering two distributional assumptions, Negative Binomial and Poisson, to model the distribution of a fleet vehicle accident. Our main motivation for using a CVAE is to capture the joint distribution between the number of accidents of a fleet vehicle and the predictor variables of such accidents, and to extract latent features that help reconstruct the distribution of the number of fleet vehicle accidents. We compare the CVAE with other probabilistic methods, such as a simple MLP model that learns the distribution of the number of fleet vehicle accidents without extracting meaningful latent representations. We found that the CVAE marginally outperforms the MLP model, which suggests that a model able to learn latent features has added value over one that does not. We also compared the CVAE with another basic probabilistic model, the generalized linear model (GLM), as well as with classification models. We found that the CVAE and GLM using the Negative Binomial distribution tend to show better results. Moreover, we provide a feature engineering scheme that incorporates features related to the whole fleet in addition to individual features for each vehicle that translates into improved performances of all the models implemented in our work used to evaluate the probability of a fleet vehicle accident. Assurance Insurance Deep learning Apprentissage profond Conditional variational auto-encoders
22	Neural probabilistic path prediction : skipping paths for acceleration Peng, Bowen 10 1900 (has links) La technique de tracé de chemins est la méthode Monte Carlo la plus populaire en infographie pour résoudre le problème de l'illumination globale. Une image produite par tracé de chemins est beaucoup plus photoréaliste que les méthodes standard tel que le rendu par rasterisation et même le lancer de rayons. Mais le tracé de chemins est coûteux et converge lentement, produisant une image bruitée lorsqu'elle n'est pas convergée. De nombreuses méthodes visant à accélérer le tracé de chemins ont été développées, mais chacune présente ses propres défauts et contraintes. Dans les dernières avancées en apprentissage profond, en particulier dans le domaine des modèles génératifs conditionnels, il a été démontré que ces modèles sont capables de bien apprendre, modéliser et tirer des échantillons à partir de distributions complexes. Comme le tracé de chemins dépend également d'un tel processus sur une distribution complexe, nous examinons les similarités entre ces deux problèmes et modélisons le processus de tracé de chemins comme un processus génératif. Ce processus peut ensuite être utilisé pour construire un estimateur efficace avec un réseau neuronal afin d'accélérer le temps de rendu sans trop d'hypothèses sur la scène. Nous montrons que notre estimateur neuronal (NPPP), utilisé avec le tracé de chemins, peut améliorer les temps de rendu d'une manière considérable sans beaucoup compromettre sur la qualité du rendu. Nous montrons également que l'estimateur est très flexible et permet à un utilisateur de contrôler et de prioriser la qualité ou le temps de rendu, sans autre modification ou entraînement du réseau neuronal. / Path tracing is one of the most popular Monte Carlo methods used in computer graphics to solve the problem of global illumination. A path traced image is much more photorealistic compared to standard rendering methods such as rasterization and even ray tracing. Unfortunately, path tracing is expensive to compute and slow to converge, resulting in noisy images when unconverged. Many methods aimed to accelerate path tracing have been developed, but each has its own downsides and limitiations. Recent advances in deep learning, especially with conditional generative models, have shown to be very capable at learning, modeling, and sampling from complex distributions. As path tracing is also dependent on sampling from complex distributions, we investigate the similarities between the two problems and model the path tracing process itself as a conditional generative process. It can then be used to build an efficient neural estimator that allows us to accelerate rendering time with as few assumptions as possible. We show that our neural estimator (NPPP) used along with path tracing can improve rendering time by a considerable amount without compromising much in rendering quality. The estimator is also shown to be very flexible and allows a user to control and prioritize quality or rendering time, without any further training or modifications to the neural network. path tracing global illumination deep learning conditional generative models tracé de chemins illumination globale apprentissage profond modèles génératifs conditionnels
23	Aid effectiveness, performance and vulnerability : new perspectives Wagner, Laurent 28 March 2013 (has links) La question de l’efficacité de l’aide publique au développement est complexe et protéiforme. L’aide se présente sous de nombreuses formes et implique de nombreux instruments et acteurs, dont les objectifs et mêmes les philosophies diffèrent fortement entre les pays et les organisations. De cet enchevêtrement, les économistes ont jusqu’alors échoué dans leurs recherches de relations macroéconomiques robustes censées guider l’action publique. Ainsi, aucun consensus ne semble pour l’instant émerger de ce débat. Dès lors, l’orientation des politiques de développement a essentiellement été influencée par des hypothèses contestables reposant sur des fondements empiriques fragiles. Ce travail tente d’apporter de nouveaux éléments au débat sur l’efficacité de l’aide au travers de sept essais. Les trois premiers chapitres se consacrent à la question de la relation entre aide et croissance du point de vue statistique. Les nouvelles approches qui y sont proposées tentent de surmonter la plupart des défauts de la littérature empirique existante. Nous y montrons que la relation entre aide et croissance est extrêmement complexe et qu’il est difficile de l’appréhender à l’aide des méthodes économétriques usuelles. De plus, bien que l’aide semble globalement efficace en termes de croissance du PIB, son efficacité dépend de différents facteurs révélés par la présence de seuils aussi bien conditionnels que non-Conditionnels. Parmi ces facteurs, la vulnérabilité économique semble jouer un rôle primordial et sa prise en compte s’avère indispensable pour une compréhension globale du lien entre l’aide et la croissance économique. Dans une seconde partie, les deux chapitres suivants s’intéressent plus particulièrement à l’aide sectorielle, à travers l’étude de l’efficacité de deux initiatives largement reconnues que sont l’aide à la scolarisation primaire universelle et l’aide au commerce. Leur efficacité sera alors déterminée non plus en termes de croissance du PIB mais en termes de scolarisation et de performance à l’exportation. A l’instar des trois premiers chapitres, nos résultats semblent confirmer la présence d’une relation significative entre l’aide et les objectifs visés. Nos conclusions, notamment celles en termes d’éducation, vont clairement à l’encontre de l’idée selon laquelle l’aide aurait fait plus de mal que de bien. Enfin, en se basant sur les résultats précédents, les chapitres six et sept explorent, dans une troisième partie, les possibilités d’amélioration des stratégies actuelles d’allocation de l’aide mises en œuvre notamment par les grands bailleurs multilatéraux. Une de nos principales observations est que la vulnérabilité économique est un facteur important devant être pris en compte dans le design des méthodes d’allocation de l’aide. / Aid effectiveness is a complex issue. Aid comes in many instruments, has many targets and involves many stakeholders whose objectives, methods and philosophy greatly differ across countries and institutions. From this mixed bag, economists have struggled finding strong regularities at the macroeconomic level to guide the political debate and consensus have failed to emerge. Hence, political stances have often been influenced by strong assumptions based on weak or at least hotly debated evidence. This work is an attempt to provide new perspectives on the aid effectiveness debate through seven essays. The first three chapters address the technical question of the aid/growth relationship issue using new approaches and new statistical instruments in an attempt to overcome most of the caveats of the aid empirical literature. We show that the aid/growth relationship is complex and difficult to measure using common statistical methods. Moreover, while aid is globally effective, its effectiveness depends on different factors reflected by the existence of conditional and unconditional thresholds. Among those factors, economic vulnerability seems to be a key component that has to be taken into account in order to identify this relationship. In a second part, we try to assess the effectiveness of two flagship initiatives which are Aid for Trade and Universal Primary Education with regards to the outcomes they ultimately target, namely, export performance for the former and school enrolment, gender parity and repetition rate in primary school for the later. As in the first three chapters, our results support the existence of a significant relationship between aid and the targeted outcomes. Those results, notably for the education sector, clearly argue against the idea that aid has done more bad then good. Finally, based on previous results, in a third part, chapters six and seven explore the mean to improve the current aid allocation strategies used notably by the Multilateral Development Banks. One of the main conclusions is that economic vulnerability is a central factor to be taken into account in the design of aid allocation strategies. Aide publique au développement Efficacité de l’aide Vulnérabilité économique Accélérations de croissance Durée des épisodes de croissance Aide au commerce Scolarisation primaire universelle Stratégies d’allocation de l’aide Allocation basée sur la performance Official development assistance Aid effectiveness Conditional and unconditional thresholds Economic vulnerability Growth accelerations Growth spells duration Aid for trade Infrastructure Universal primary education Aid allocation strategies Performance based allocation Multilateral development banks 338.9
24	Segmentation d'images de documents manuscrits composites : application aux documents de chimie / Heterogenous handwritten document image segmentation : application to chemistry document Ghanmi, Nabil 30 September 2016 (has links) Cette thèse traite de la segmentation structurelle de documents issus de cahiers de chimie. Ce travail est utile pour les chimistes en vue de prendre connaissance des conditions des expériences réalisées. Les documents traités sont manuscrits, hétérogènes et multi-scripteurs. Bien que leur structure physique soit relativement simple, une succession de trois régions représentant : la formule chimique de l’expérience, le tableau des produits utilisés et un ou plusieurs paragraphes textuels décrivant le déroulement de l’expérience, les lignes limitrophes des régions portent souvent à confusion, ajouté à cela des irrégularités dans la disposition des cellules du tableau, rendant le travail de séparation un vrai défi. La méthodologie proposée tient compte de ces difficultés en opérant une segmentation à plusieurs niveaux de granularité, et en traitant la segmentation comme un problème de classification. D’abord, l’image du document est segmentée en structures linéaires à l’aide d’un lissage horizontal approprié. Le seuil horizontal combiné avec une tolérance verticale avantage le regroupement des éléments fragmentés de la formule sans trop fusionner le texte. Ces structures linéaires sont classées en Texte ou Graphique en s’appuyant sur des descripteurs structurels spécifiques, caractéristiques des deux classes. Ensuite, la segmentation est poursuivie sur les lignes textuelles pour séparer les lignes du tableau de celles de la description. Nous avons proposé pour cette classification un modèle CAC qui permet de déterminer la séquence optimale d’étiquettes associées à la séquence des lignes d’un document. Le choix de ce type de modèle a été motivé par sa capacité à absorber la variabilité des lignes et à exploiter les informations contextuelles. Enfin, pour le problème de la segmentation de tableaux en cellules, nous avons proposé une méthode hybride qui fait coopérer deux niveaux d’analyse : structurel et syntaxique. Le premier s’appuie sur la présence des lignes graphiques et de l’alignement de texte et d’espaces ; et le deuxième tend à exploiter la cohérence de la syntaxe très réglementée du contenu des cellules. Nous avons proposé, dans ce cadre, une approche contextuelle pour localiser les champs numériques dans le tableau, avec reconnaissance des chiffres isolés et connectés. La thèse étant effectuée dans le cadre d’une convention CIFRE, en collaboration avec la société eNovalys, nous avons implémenté et testé les différentes étapes du système sur une base conséquente de documents de chimie / This thesis deals with chemistry document segmentation and structure analysis. This work aims to help chemists by providing the information on the experiments which have already been carried out. The documents are handwritten, heterogeneous and multi-writers. Although their physical structure is relatively simple, since it consists of a succession of three regions representing: the chemical formula of the experiment, a table of the used products and one or more text blocks describing the experimental procedure, several difficulties are encountered. In fact, the lines located at the region boundaries and the imperfections of the table layout make the separation task a real challenge. The proposed methodology takes into account these difficulties by performing segmentation at several levels and treating the region separation as a classification problem. First, the document image is segmented into linear structures using an appropriate horizontal smoothing. The horizontal threshold combined with a vertical overlapping tolerance favor the consolidation of fragmented elements of the formula without too merge the text. These linear structures are classified in text or graphic based on discriminant structural features. Then, the segmentation is continued on text lines to separate the rows of the table from the lines of the raw text locks. We proposed for this classification, a CRF model for determining the optimal labelling of the line sequence. The choice of this kind of model has been motivated by its ability to absorb the variability of lines and to exploit contextual information. For the segmentation of table into cells, we proposed a hybrid method that includes two levels of analysis: structural and syntactic. The first relies on the presence of graphic lines and the alignment of both text and spaces. The second tends to exploit the coherence of the cell content syntax. We proposed, in this context, a Recognition-based approach using contextual knowledge to detect the numeric fields present in the table. The thesis was carried out in the framework of CIFRE, in collaboration with the eNovalys campany.We have implemented and tested all the steps of the proposed system on a consequent dataset of chemistry documents Document de chimie Structures linéaires Séparation texte/graphique Classification Extraction de tableaux Champs aléatoires conditionnels Extraction de numériques Chemistry document Linear structure Text/Graphic separation Classification Table extraction Conditional Random Fields Numeric extraction 006.32 006.4
25	L’État et ses pauvres : la naissance et la montée en puissance des politiques de transferts conditionnels au Brésil et au Mexique / The State and its Poor : the birth and rise of conditional cash transfer programs in Brazil and Mexico / O Estado e seus pobres : origem e ascensão das políticas de transferências de renda condicionadas no Brasil e no México Guerra Tomazini, Carla 29 March 2016 (has links) Les années 1990 ont vu naître de nouvelles politiques sociales, les « transferts monétaires conditionnels » : allocations attribuées aux familles pauvres à condition qu’elles incitent leurs enfants à poursuivre leur scolarité ou qu’elles les conduisent dans les centres de santé, avec pour objectif de réduire la pauvreté et d’assurer un meilleur avenir aux « pauvres » de demain. Avec leur développement, ces politiques ont créé un nouveau champ de protection sociale, dont les principes et les manières de faire s’éloignent du fonctionnement traditionnel de l’assistance. Ces politiques ont fait leur apparition au Brésil et au Mexique dans les années 1990. L’analyse de leur genèse met en évidence une structuration progressive, marquée par des contextes institutionnels et des trajectoires distincts qui se soldent néanmoins par des résultats semblables. Comment expliquer ce parallélisme ? L’objectif de cette étude a consisté à dégager une ou plusieurs variables permettant d’expliquer l’émergence et l’expansion des programmes de transferts monétaires conditionnels dans ces pays et à mettre en évidence la manière dont l’évolution de ces politiques a pu susciter des oppositions plus ou moins fortes de la part de certains acteurs, ainsi que les contraintes institutionnelles auxquelles ces politiques se sont confrontées. On peut observer la structuration de groupes défendant des causes diverses autour de ces politiques, et qui ont déterminé largement leur élaboration et mise en oeuvre, rentrant tantôt en concurrence tantôt en alliance. C’est, notamment, la coalition dominante « pro-capital humain » qui entend définir et encadrer l’ensemble des politiques menées. L’apport de cette recherche est donc de nuancer l’idée d’une réforme consensuelle des politiques de lutte contre la pauvreté au Mexique et au Brésil, sans pour autant nier l’ampleur des transformations intervenues. Il en résulte que le changement institutionnel au Brésil s’est opéré par l'ajout de nouveaux dispositifs aux institutions existantes ; et au Mexique, en première instance, le processus de changement et de consolidation de la politique de transfert monétaire s’est produit sous la forme d'un déplacement et, par la suite, afin de maintenir le statu quo, les acteurs défenseurs des institutions ont modifié de façon marginale le programme pour maintenir leurs intérêts. Les instruments monétaires qui visent à lutter contre la pauvreté sont, en effet, l’objet d’un consensus ambigu, plusieurs acteurs issus de différentes coalitions finissant par le revendiquer. Enfin, la variable intérêt, nécessaire à différents moments, s’est constituée comme une variable essentielle pour comprendre la permanence de ces politiques par l’intermédiaire des phénomènes de verrouillage. / The 1990s saw the birth of so-called 'conditional cash transfers', assistance programs for poor families on the condition that they encourage their children to seek education and attend health centers. In order to reduce poverty and ensure a better future for tomorrow's « poor », these policies represent a new type of social protection with different principles and modes of operation for traditional programs. The analysis of their origins reveals a progressive structuring marked by institutional contexts and different paths that have generated similar results. The objective of this study is to identify one or more variables that might explain their emergence and expansion in Brazil and Mexico in the 1990s and 2000s and to highlight how the evolution of these policies could generate more or less strong opposition from some actors as well as the institutional constraints these policies face. We can observe group structures centred on "causes" - notably the cause of human capital - that have largely determined the development and implementation of these policies. This paper seeks to show the nuances of the idea of consensual reforms in Mexico and Brazil, without denying the extent to which these transformations have occurred. This means that institutional change in Brazil is operated by adding new features to existing institutions; while in Mexico, in the first instance, the process of change and consolidation of conditional cash transfer programs has occurred as an institutional shift and then the defenders of the status quo actors marginally modified the program to keep their interests. As monetary instruments to combat poverty, these programs are the subject of an ambiguous consensus and actors from different coalitions end up supporting them. Finally, "interests", necessary at different times, were constituted as a key variable to understand the permanence and strengthening of these policies through locking phenomena. / A década de 1990 assistiu ao nascimento das chamadas « transferências condicionadas de renda » : programas assistenciais para famílias pobres à condição de que elas incentivem seus filhos a prosseguirem os estudos e que frequentem centros de saúde. Com o objetivo de reduzir a pobreza e assegurar um futuro melhor para os « pobres » de amanhã, essas políticas representam um novo tipo de proteção social com princípios e modos de operaçäo diferentes dos programas tradicionais. A análise de suas origens revela uma estruturação progressiva marcada por contextos institucionais e trajetórias distintas que geraram resultados semelhantes. O objetivo deste estudo é identificar uma ou mais variáveis que possam explicar a emergência e expansão no Brasil e no México nas décadas de 1990 e 2000, examinando a maneira como suas evoluções suscitaram oposições mais ou menos fortes de atores e os constrangimentos institucionais enfrentados. Nós podemos observar uma estruturação de grupos reunidos em torno a « causas » - notadamente a causa do capital humano - que influem na elaboração e na implementação dessas políticas. Esse trabalho busca matizar a ideia de reformas consensuais no México e no Brasil, sem negar a dimensão das transformações ocorridas. A mudança institucional no Brasil é operada por meio da adição de novos recursos às instituições existentes; e no México, em primeira instância, o processo de mudança e consolidação da política de transferência de renda ocorreu como um deslocamento institucional e, posteriormente, os atores defensores do status quo modificam marginalmente o programa para manter os seus interesses. Assim, esses programas são objeto de um consenso ambíguo, uma vez que atores de diferentes coalizões passam a reivindicar eventualmente esses instrumentos. Finalmente, os « interesses » constituíram-se como uma variável chave para entender a permanência e o reforço das condicionalidades dessas políticas por meio de fenômenos de lock- in. Pauvreté Politiques Publiques Brésil Mexique Transferts monétaires conditionnels Politique sociale Poverty Public policies Brazil Mexico Conditional cash transfers Pobreza Políticas Públicas Brasil México Transferências condicionadas de renda Bolsa Família Bolsa Escola Progresa-Oportunidades Fome Zero Política Social
26	Reconnaissance d’activités humaines à partir de séquences vidéo / Human activity recognition from video sequences Selmi, Mouna 12 December 2014 (has links) Cette thèse s’inscrit dans le contexte de la reconnaissance des activités à partir de séquences vidéo qui est une des préoccupations majeures dans le domaine de la vision par ordinateur. Les domaines d'application pour ces systèmes de vision sont nombreux notamment la vidéo surveillance, la recherche et l'indexation automatique de vidéos ou encore l'assistance aux personnes âgées. Cette tâche reste problématique étant donnée les grandes variations dans la manière de réaliser les activités, l'apparence de la personne et les variations des conditions d'acquisition des activités. L'objectif principal de ce travail de thèse est de proposer une méthode de reconnaissance efficace par rapport aux différents facteurs de variabilité. Les représentations basées sur les points d'intérêt ont montré leur efficacité dans les travaux d'art; elles ont été généralement couplées avec des méthodes de classification globales vue que ses primitives sont temporellement et spatialement désordonnées. Les travaux les plus récents atteignent des performances élevées en modélisant le contexte spatio-temporel des points d'intérêts par exemple certains travaux encodent le voisinage des points d'intérêt à plusieurs échelles. Nous proposons une méthode de reconnaissance des activités qui modélise explicitement l'aspect séquentiel des activités tout en exploitant la robustesse des points d'intérêts dans les conditions réelles. Nous commençons par l'extractivité des points d'intérêt dont a montré leur robustesse par rapport à l'identité de la personne par une étude tensorielle. Ces primitives sont ensuite représentées en tant qu'une séquence de sac de mots (BOW) locaux: la séquence vidéo est segmentée temporellement en utilisant la technique de fenêtre glissante et chacun des segments ainsi obtenu est représenté par BOW des points d'intérêt lui appartenant. Le premier niveau de notre système de classification séquentiel hybride consiste à appliquer les séparateurs à vaste marge (SVM) en tant que classifieur de bas niveau afin de convertir les BOWs locaux en des vecteurs de probabilités des classes d'activité. Les séquences de vecteurs de probabilité ainsi obtenues sot utilisées comme l'entrées de classifieur séquentiel conditionnel champ aléatoire caché (HCRF). Ce dernier permet de classifier d'une manière discriminante les séries temporelles tout en modélisant leurs structures internes via les états cachés. Nous avons évalué notre approche sur des bases publiques ayant des caractéristiques diverses. Les résultats atteints semblent être intéressant par rapport à celles des travaux de l'état de l'art. De plus, nous avons montré que l'utilisation de classifieur de bas niveau permet d'améliorer la performance de système de reconnaissance vue que le classifieur séquentiel HCRF traite directement des informations sémantiques des BOWs locaux, à savoir la probabilité de chacune des activités relativement au segment en question. De plus, les vecteurs de probabilités ont une dimension faible ce qui contribue à éviter le problème de sur apprentissage qui peut intervenir si la dimension de vecteur de caractéristique est plus importante que le nombre des données; ce qui le cas lorsqu'on utilise les BOWs qui sont généralement de dimension élevée. L'estimation les paramètres du HCRF dans un espace de dimension réduite permet aussi de réduire le temps d'entrainement / Human activity recognition (HAR) from video sequences is one of the major active research areas of computer vision. There are numerous application HAR systems, including video-surveillance, search and automatic indexing of videos, and the assistance of frail elderly. This task remains a challenge because of the huge variations in the way of performing activities, in the appearance of the person and in the variation of the acquisition conditions. The main objective of this thesis is to develop an efficient HAR method that is robust to different sources of variability. Approaches based on interest points have shown excellent state-of-the-art performance over the past years. They are generally related to global classification methods as these primitives are temporally and spatially disordered. More recent studies have achieved a high performance by modeling the spatial and temporal context of interest points by encoding, for instance, the neighborhood of the interest points over several scales. In this thesis, we propose a method of activity recognition based on a hybrid model Support Vector Machine - Hidden Conditional Random Field (SVM-HCRF) that models the sequential aspect of activities while exploiting the robustness of interest points in real conditions. We first extract the interest points and show their robustness with respect to the person's identity by a multilinear tensor analysis. These primitives are then represented as a sequence of local "Bags of Words" (BOW): The video is temporally fragmented using the sliding window technique and each of the segments thus obtained is represented by the BOW of interest points belonging to it. The first layer of our hybrid sequential classification system is a Support Vector Machine that converts each local BOW extracted from the video sequence into a vector of activity classes’ probabilities. The sequence of probability vectors thus obtained is used as input of the HCRF. The latter permits a discriminative classification of time series while modeling their internal structures via the hidden states. We have evaluated our approach on various human activity datasets. The results achieved are competitive with those of the current state of art. We have demonstrated, in fact, that the use of a low-level classifier (SVM) improves the performance of the recognition system since the sequential classifier HCRF directly exploits the semantic information from local BOWs, namely the probability of each activity relatively to the current local segment, rather than mere raw information from interest points. Furthermore, the probability vectors have a low-dimension which prevents significantly the risk of overfitting that can occur if the feature vector dimension is relatively high with respect to the training data size; this is precisely the case when using BOWs that generally have a very high dimension. The estimation of the HCRF parameters in a low dimension allows also to significantly reduce the duration of the HCRF training phase Reconnaissance des activités Points d’intérêt Points denses Analyse tensorielle multilinéaire Séparateurs à vaste marge Champs aléatoires conditionnels cachés Human activity recognition Interest points Dense points Multilinear tensor analysis Classification of sequential data Support vector machines Hidden conditional random fields
27	Alignement temporel musique-sur-partition par modèles graphiques discriminatifs Joder, Cyril 29 September 2011 (has links) (PDF) Cette thèse étudie le problème de l'alignement temporel d'un enregistrement musical et de la partition correspondante. Cette tâche peut trouver de nombreuses applications dans le domaine de l'indexation automatique de documents musicaux. Nous adoptons une approche probabiliste et nous proposons l'utilisation de modèles graphiques discriminatifs de type champs aléatoires conditionnels pour l'alignement, en l'exprimant comme un problème d'étiquetage de séquence. Cette classe de modèles permet d'exprimer des modèles plus flexibles que les modèles de Markov cachés ou les modèles semi-markoviens cachés, couramment utilisés dans ce domaine. En particulier, elle rend possible l'utilisation d'attributs (ou descripteurs acoustiques) extraits de séquences de trames audio qui se recouvrent, au lieu d'observations disjointes. Nous tirons parti de cette propriété pour introduire des attributs qui réalisent une modélisation implicite du tempo au plus bas niveau du modèle. Nous proposons trois structures de modèles différentes de complexité croissant, correspondant à différents niveaux de précision dans la modélisation de la durées des évènements musicaux. Trois types de descripteurs acoustiques sont utilisés, pour caractériser localement l'harmonie, les attaques de notes et le tempo de l'enregistrement. Une série d'expériences réalisées sur une base de données de piano classique et de musique pop permet de valider la grande précision de nos modèles. En effet, avec le meilleur des systèmes proposés, plus de 95 % des attaques de notes sont détectées à moins de 100 ms de leur position réelle. Plusieurs attributs acoustiques classiques, calculés à partir de différentes représentation de l'audio, sont utiliser pour mesurer la correspondance instantanée entre un point de la partition et une trame de l'enregistrement. Une comparaison de ces descripteurs est alors menée sur la base de leurs performances d'alignement. Nous abordons ensuite la conception de nouveaux attributs, grâce à l'apprentissage d'une transformation linéaire de la représentation symbolique vers une représentation temps-fréquence quelconque de l'audio. Nous explorons deux stratégies différentes, par minimum de divergence et maximum de vraisemblance, pour l'apprentissage de la transformation optimale. Les expériences effectuées montrent qu'une telle approche peut améliorer la précision des alignements, quelle que soit la représentation de l'audio utilisée. Puis, nous étudions différents ajustements à effectuer afin de confronter les systèmes à des cas d'utilisation réalistes. En particulier, une réduction de la complexité est obtenue grâce à une stratégie originale d'élagage hiérarchique. Cette méthode tire parti de la structure hiérarchique de la musique en vue d'un décodage approché en plusieurs passes. Une diminution de complexité plus importante que celle de la méthode classique de recherche par faisceaux est observée dans nos expériences. Nous examinons en outre une modification des modèles proposés afin de les rendre robustes à d'éventuelles différences structurelles entre la partition et l'enregistrement. Enfin, les propriétés de scalabilité des modèles utilisés sont étudiées. Traitement automatique de la musique Alignement musique sur partition Indexation de musique Modèles graphiques Champs aléatoires conditionnels Modèles de Markov Cachés
28	Estimation robuste de courbes de consommmation électrique moyennes par sondage pour de petits domaines en présence de valeurs manquantes / Robust estimation of mean electricity consumption curves by sampling for small areas in presence of missing values De Moliner, Anne 05 December 2017 (has links) Dans cette thèse, nous nous intéressons à l'estimation robuste de courbes moyennes ou totales de consommation électrique par sondage en population finie, pour l'ensemble de la population ainsi que pour des petites sous-populations, en présence ou non de courbes partiellement inobservées.En effet, de nombreuses études réalisées dans le groupe EDF, que ce soit dans une optique commerciale ou de gestion du réseau de distribution par Enedis, se basent sur l'analyse de courbes de consommation électrique moyennes ou totales, pour différents groupes de clients partageant des caractéristiques communes. L'ensemble des consommations électriques de chacun des 35 millions de clients résidentiels et professionnels Français ne pouvant être mesurées pour des raisons de coût et de protection de la vie privée, ces courbes de consommation moyennes sont estimées par sondage à partir de panels. Nous prolongeons les travaux de Lardin (2012) sur l'estimation de courbes moyennes par sondage en nous intéressant à des aspects spécifiques de cette problématique, à savoir l'estimation robuste aux unités influentes, l'estimation sur des petits domaines, et l'estimation en présence de courbes partiellement ou totalement inobservées.Pour proposer des estimateurs robustes de courbes moyennes, nous adaptons au cadre fonctionnel l'approche unifiée d'estimation robuste en sondages basée sur le biais conditionnel proposée par Beaumont (2013). Pour cela, nous proposons et comparons sur des jeux de données réelles trois approches : l'application des méthodes usuelles sur les courbes discrétisées, la projection sur des bases de dimension finie (Ondelettes ou Composantes Principales de l'Analyse en Composantes Principales Sphériques Fonctionnelle en particulier) et la troncature fonctionnelle des biais conditionnels basée sur la notion de profondeur d'une courbe dans un jeu de données fonctionnelles. Des estimateurs d'erreur quadratique moyenne instantanée, explicites et par bootstrap, sont également proposés.Nous traitons ensuite la problématique de l'estimation sur de petites sous-populations. Dans ce cadre, nous proposons trois méthodes : les modèles linéaires mixtes au niveau unité appliqués sur les scores de l'Analyse en Composantes Principales ou les coefficients d'ondelettes, la régression fonctionnelle et enfin l'agrégation de prédictions de courbes individuelles réalisées à l'aide d'arbres de régression ou de forêts aléatoires pour une variable cible fonctionnelle. Des versions robustes de ces différents estimateurs sont ensuite proposées en déclinant la démarche d'estimation robuste basée sur les biais conditionnels proposée précédemment.Enfin, nous proposons quatre estimateurs de courbes moyennes en présence de courbes partiellement ou totalement inobservées. Le premier est un estimateur par repondération par lissage temporel non paramétrique adapté au contexte des sondages et de la non réponse et les suivants reposent sur des méthodes d'imputation. Les portions manquantes des courbes sont alors déterminées soit en utilisant l'estimateur par lissage précédemment cité, soit par imputation par les plus proches voisins adaptée au cadre fonctionnel ou enfin par une variante de l'interpolation linéaire permettant de prendre en compte le comportement moyen de l'ensemble des unités de l'échantillon. Des approximations de variance sont proposées dans chaque cas et l'ensemble des méthodes sont comparées sur des jeux de données réelles, pour des scénarios variés de valeurs manquantes. / In this thesis, we address the problem of robust estimation of mean or total electricity consumption curves by sampling in a finite population for the entire population and for small areas. We are also interested in estimating mean curves by sampling in presence of partially missing trajectories.Indeed, many studies carried out in the French electricity company EDF, for marketing or power grid management purposes, are based on the analysis of mean or total electricity consumption curves at a fine time scale, for different groups of clients sharing some common characteristics.Because of privacy issues and financial costs, it is not possible to measure the electricity consumption curve of each customer so these mean curves are estimated using samples. In this thesis, we extend the work of Lardin (2012) on mean curve estimation by sampling by focusing on specific aspects of this problem such as robustness to influential units, small area estimation and estimation in presence of partially or totally unobserved curves.In order to build robust estimators of mean curves we adapt the unified approach to robust estimation in finite population proposed by Beaumont et al (2013) to the context of functional data. To that purpose we propose three approaches : application of the usual method for real variables on discretised curves, projection on Functional Spherical Principal Components or on a Wavelets basis and thirdly functional truncation of conditional biases based on the notion of depth.These methods are tested and compared to each other on real datasets and Mean Squared Error estimators are also proposed.Secondly we address the problem of small area estimation for functional means or totals. We introduce three methods: unit level linear mixed model applied on the scores of functional principal components analysis or on wavelets coefficients, functional regression and aggregation of individual curves predictions by functional regression trees or functional random forests. Robust versions of these estimators are then proposed by following the approach to robust estimation based on conditional biais presented before.Finally, we suggest four estimators of mean curves by sampling in presence of partially or totally unobserved trajectories. The first estimator is a reweighting estimator where the weights are determined using a temporal non parametric kernel smoothing adapted to the context of finite population and missing data and the other ones rely on imputation of missing data. Missing parts of the curves are determined either by using the smoothing estimator presented before, or by nearest neighbours imputation adapted to functional data or by a variant of linear interpolation which takes into account the mean trajectory of the entire sample. Variance approximations are proposed for each method and all the estimators are compared to each other on real datasets for various missing data scenarios. Arbres de régression Biais conditionnels Données fonctionnelles Données manquantes Estimation sur petits domaines Estimateurs à noyau Forêts aléatoires Modèles linéaires mixtes Plus proches voisins Robustesse Sondage Conditional bias Functional data Kernel estimators Missing data Linear mixed models Nearest neighbours Random forests Regression trees Robustness Small area estimation Survey sampling 510
29	Quelques contributions à l'estimation des modèles définis par des équations estimantes conditionnelles / Some contributions to the statistical inference in models defined by conditional estimating equations Li, Weiyu 15 July 2015 (has links) Dans cette thèse, nous étudions des modèles définis par des équations de moments conditionnels. Une grande partie de modèles statistiques (régressions, régressions quantiles, modèles de transformations, modèles à variables instrumentales, etc.) peuvent se définir sous cette forme. Nous nous intéressons au cas des modèles avec un paramètre à estimer de dimension finie, ainsi qu’au cas des modèles semi paramétriques nécessitant l’estimation d’un paramètre de dimension finie et d’un paramètre de dimension infinie. Dans la classe des modèles semi paramétriques étudiés, nous nous concentrons sur les modèles à direction révélatrice unique qui réalisent un compromis entre une modélisation paramétrique simple et précise, mais trop rigide et donc exposée à une erreur de modèle, et l’estimation non paramétrique, très flexible mais souffrant du fléau de la dimension. En particulier, nous étudions ces modèles semi paramétriques en présence de censure aléatoire. Le fil conducteur de notre étude est un contraste sous la forme d’une U-statistique, qui permet d’estimer les paramètres inconnus dans des modèles généraux. / In this dissertation we study statistical models defined by condition estimating equations. Many statistical models could be stated under this form (mean regression, quantile regression, transformation models, instrumental variable models, etc.). We consider models with finite dimensional unknown parameter, as well as semiparametric models involving an additional infinite dimensional parameter. In the latter case, we focus on single-index models that realize an appealing compromise between parametric specifications, simple and leading to accurate estimates, but too restrictive and likely misspecified, and the nonparametric approaches, flexible but suffering from the curse of dimensionality. In particular, we study the single-index models in the presence of random censoring. The guiding line of our study is a U-statistics which allows to estimate the unknown parameters in a wide spectrum of models. Analyse de Survie Direction révélatrice unique Données censurées Equations de moments conditionnels Fonctionnelles de Kaplan-Meier Lissage par noyau Méthodes itératives Modèles de régression Réduction de la dimension Rééchantillonnage Régression pénalisée U-Statistiques Bootstrap Censoring Conditional moment equations Dimension reduction Iterative methods Kaplan-Meier functionals Kernel smoothing Penalized regression Regression models Single-Index assumptions Survival analysis U-Statistics

Search results