191 |
Estimation multi-robuste efficace en présence de données influentesMichal, Victoire 08 1900 (has links)
No description available.
|
192 |
Analyse numérique et expérimentale de la mise en forme par estampage des renforts composites pour applications aéronautiques / Analyse numérique et expérimentale de la mise en forme par estampage des renforts composites pour applications aéronautiquesNasri, Mondher 23 November 2018 (has links)
Ces travaux de thèse s’inscrivent dans un thème de recherche portant sur l’optimisation de la phase de conception et la préparation de la fabrication par estampage de pièces de formes complexes. Le préformage des renforts tissés secs est un enjeu important pour plusieurs procédés de production de pièces en matériaux composites tel que, par exemple, le procédé RTM (Resin Transfer Molding). Au cours de cette phase, la préforme est soumise à des déformations importantes. La connaissance du comportement du tissu sec est alors un enjeu majeur en vue de l’optimisation des procédés de mise en forme. Pour mettre en œuvre les renforts tissés, il est nécessaire de tenir compte de leurs caractéristiques intrinsèques aux différentes échelles, de leurs très grandes déformations en cisaillement et du comportement fortement orienté de ces matériaux. Un point important réside dans la détermination des orientations des renforts après formage. Face à la complexité de mise au point expérimentale de la mise en forme des renforts tissés, la simulation est un outil important pour l’optimisation de conception de pièces composites. Dans ce travail, une nouvelle approche hybride discrète non linéaire, basée sur l’association d’éléments continus hypoélastiques (comportement en cisaillement non linéaire) avec des connecteurs spécifiques de comportement non linéaire a été abordée. Elle permet de prédire les contraintes au niveau des fibres et de déterminer avec plus de précision, les angles de cisaillement en se basant sur la modification de l’orientation en grande déformation. En outre, elle permet d’analyser et de prévoir le comportement global du tissu à partir de sa structure interne. Le nombre de paramètres à identifier est faible et le temps de calcul est raisonnable. Cette approche a été programmée via une routine VUMAT et implémentée dans le code de calcul élément fini ABAQUS/Explicit. L’identification et la validation du modèle ont été effectuées en utilisant des essais de caractérisation standard des tissus. Les résultats de mise en forme des renforts tissés ont été comparés à des résultats expérimentaux. / This thesis is part of a research theme dealing with the optimization of the design process and thepreparation for a manufacturing process by stamping of complex shaped parts. The preforming ofdry woven reinforcements is one of the most important steps during production of complexcomposite material parts such as RTM (Resin Transfer Molding) process. In this stage, thedeformation of preform (fabric) is quite important. Understand the woven behavior is an essentialstep in the study of shaping processes. In order to use woven reinforcements to produce industrialparts, it is compulsory to take into account their intrinsic characteristics at different scales, theirvery large shear deformations and the high oriented behavior of these materials. Further more, thedetermination of the reinforcement orientations after forming is an important task. The complexityof the experimental development of the shaping of woven reinforcements makes simulation animportant tool for optimizing the design of composite parts. This work presented a new non-lineardiscrete hybrid approach, based on the association of hypoelastic continuous elements (non-linearshear behavior) with specific non-linear behavior connectors. This approach able to predict thestresses at the level of the fiber to determine with more precision, the shear angles based on themodification of the orientation in large de formation. In addition, it allows the overall behavior of thetissue to be analyzed and predicted from its internal structure. The number of parameters to be identified is limited and the calculation time is reasonable. This approach was implemented in the Finite element code ABAQUS/Explicit via a VUMAT routine code. The identification and validationof the model was performed using standard fabric characterization tests. The woven reinforcement forming results were compared with experimental results.
|
193 |
Essais sur la préférence du fils au pakistan / Essays on Son Preference in PakistanJaved, Muhammad Rashid 22 July 2019 (has links)
Ce mémoire regroupe différentes études sur la préférence pour les garçons au Pakistan. Celles-ci analysent la fréquence et l'étendue de la préférence pour les garçons et son effet sur la grossesse des femmes. Le rôle que la préférence pour les garçons joue sur la participation des femmes au niveau des décisions au sein du ménage est examiné, tout comme son effet sur l'espacement des naissances, la probabilité d'une naissance à risque, ou l'impact de l'âge auquel une femme se marie sur l'équilibre entre les sexes et le développement de l'enfant né. Nous trouvons qu'il existe une préférence réelle et déclarée pour la progéniture masculine au Pakistan. La probabilité de poursuivre les grossesses diminue avec le nombre de garçons nés. De plus, les femmes qui ont au moins un garcon ont plus d'influence sur les décisions quotidiennes du ménage mais pas sur les décisions financières. La participation des femmes sur les décisions à prendre au sein du ménage augmente avec le nombre de garçons mais seulement jusqu'à la troisième naissance. D'ailleurs, les femmes ayant au moins un garçon attendent plus longtemps avant d'avoir d'autres enfants. Ce constat est plus particulièrement vrai dans le cadre d'une première naissance et il est moins présent à partir de la deuxième naissance. En outre, le fait de se marier à 18 ans ou plus tard influence de façon positive la préférence des femmes sur la composition de sa famille. Pourtant, peu importe qu’une femme se marie avant ou après 18 ans, cela ne modifie pas le biais en faveur des garçons dans leur investissement parental. A partir de ces résultats, nous proposons des préconisations politiques afin de lutter contre les inégalités entre les sexes au Pakistan. / This thesis is a collection of studies on son preference in Pakistan. The studies analyze the prevalence and strength of son preference and its effects on women’s childbearing. The role son preference plays in determining women's participation in intra-household decisionmaking is examined as are its effect on birth spacing, probability of risky births and role of maternal age at marriage in modifying gender-specific reproduction and development outcomes. We find strong evidence for both the revealed and stated preference for male offspring. The probability of continuing childbearing also decreases with the number of sons born. Furthermore, we find that women with at least one son have more say in ‘routine’ household decisions but not in financial decisions. Female participation in decision-making grows significantly with the number of sons but only up to the third parity. We find that women with at least one son are more likely to delay succeeding births. We obtain strong evidence at parity 1. The impact seems to dissipate beyond the second parity. Moreover, we find that marriage at 18 or later positively influence women’s preference for family’s sex composition. However, whether or not a woman married early or late does little to modify the male gender bias prevalent in parental investment. In light of these findings, we suggest policy measures that could help improve gender equity in the country.
|
194 |
Itération sur les Politiques Optimiste et Apprentissage du Jeu de TetrisThiery, Christophe 25 November 2010 (has links) (PDF)
Cette thèse s'intéresse aux méthodes d'itération sur les politiques dans l'apprentissage par renforcement à grand espace d'états avec approximation linéaire de la fonction de valeur. Nous proposons d'abord une unification des principaux algorithmes du contrôle optimal stochastique. Nous montrons la convergence de cette version unifiée vers la fonction de valeur optimale dans le cas tabulaire, ainsi qu'une garantie de performances dans le cas où la fonction de valeur est estimée de façon approximative. Nous étendons ensuite l'état de l'art des algorithmes d'approximation linéaire du second ordre en proposant une généralisation de Least-Squares Policy Iteration (LSPI) (Lagoudakis et Parr, 2003). Notre nouvel algorithme, Least-Squares λ Policy Iteration (LSλPI), ajoute à LSPI un concept venant de λ-Policy Iteration (Bertsekas et Ioffe, 1996) : l'évaluation amortie (ou optimiste) de la fonction de valeur, qui permet de réduire la variance de l'estimation afin d'améliorer l'efficacité de l'échantillonnage. LSλPI propose ainsi un compromis biais-variance réglable qui peut permettre d'améliorer l'estimation de la fonction de valeur et la qualité de la politique obtenue. Dans un second temps, nous nous intéressons en détail au jeu de Tetris, une application sur laquelle se sont penchés plusieurs travaux de la littérature. Tetris est un problème difficile en raison de sa structure et de son grand espace d'états. Nous proposons pour la première fois une revue complète de la littérature qui regroupe des travaux d'apprentissage par renforcement, mais aussi des techniques de type évolutionnaire qui explorent directement l'espace des politiques et des algorithmes réglés à la main. Nous constatons que les approches d'apprentissage par renforcement sont à l'heure actuelle moins performantes sur ce problème que des techniques de recherche directe de la politique telles que la méthode d'entropie croisée (Szita et Lőrincz, 2006). Nous expliquons enfin comment nous avons mis au point un joueur de Tetris qui dépasse les performances des meilleurs algorithmes connus jusqu'ici et avec lequel nous avons remporté l'épreuve de Tetris de la Reinforcement Learning Competition 2008.
|
195 |
Les interactions gène-environnement dans les études génétiques des maladies complexesKazma, Rémi 17 June 2010 (has links) (PDF)
Les maladies humaines les plus fréquentes sont complexes avec plusieurs facteurs génétiques et environnementaux qui interagissent. Ce travail propose deux nouvelles méthodes statistiques pour étudier les interactions gène-environnement. La première méthode utilise la récurrence familiale de la maladie pour identifier une interaction entre un facteur environnemental et la composante génétique impliquée dans la maladie. La seconde méthode permet de prendre en compte ces interactions dans les études d'associations pangénomiques lorsque l'information sur le facteur d'exposition n'est pas disponible chez les témoins. Cette situation est devenue fréquente avec l'utilisation de panels de témoins de référence. Ces deux méthodes apportent de nouveaux outils pour étudier simultanément les facteurs génétiques et environnementaux dans les maladies complexes. Elles ont été appliquées sur deux jeux de données concernant le diabète de type 2 et les réactions cutanées sévères aux médicaments.
|
196 |
Nouvelle approche pour l'extraction de paramètres géophysiques des mesures en altimétrie radarOllivier, Annabelle 31 March 2006 (has links) (PDF)
Les radars altimètres embarqués à bord de satellites à plus de 800 km d'altitude permettent d'étudier des variations du niveau de la mer de l'ordre du centimètre ! Ils permettent aussi d'estimer la hauteur des vagues et la vitesse du vent le long des traces des satellites.<br />Ces paramètres sont estimés à partir des échos radar qui possèdent une forme caractéristique de la surface sur laquelle ils se réfléchissent.<br />La précision, la résolution et la qualité d'estimation de ces paramètres (hauteur de mer, hauteur des vagues, vitesse du vent...) sont des préoccupations permanentes pour l'exploitation et l'interprétation des mesures altimétriques.<br /><br /> Nous proposons dans cette thèse de réduire le niveau de bruit des mesures avant l'étape d'estimation c'est-à-dire sur les échos altimétriques.<br />Pour cela, nous exploitons leur corrélation spatiale en travaillant sur des matrices formées d'échos consécutifs.<br />Cette approche matricielle constitue une nouveauté dans le traitement du signal altimétrique. Son principal atout est de définir des sous-espaces vectoriels permettant de séparer l'information utile du bruit qui altère le signal.<br />Elle permet de définir des échos très peu bruités sans perdre l'information géophysique et avec une résolution maximale.<br />Nous établissons un traitement optimal au sens des moindres carrés s'appuyant sur des simulations et appliqué sur les données réelles de plusieurs altimètres.<br /><br /> Grâce aux échos débruités obtenus, les paramètres géophysiques sont extraits avec une précision accrue.<br />En réduisant le bruit haute fréquence, nous mettons en évidence une variabilité spatiale à plus fine échelle, jusqu'à présent noyée dans le bruit de mesure.<br />Cette méthode simple et efficace permet d'affiner la précision et la résolution des hauteurs de mer et des vagues estimées le long des traces des satellites.<br /><br /> En affinant la précision et la résolution des mesures le long des traces, on participe à la nouvelle orientation opérationnelle de l'altimétrie, tournée vers des utilisateurs et vers des études de plus en plus locales.
|
197 |
Méthode de simulation avec les variables antithétiquesGatarayiha, Jean Philippe 06 1900 (has links)
Dans ce mémoire, nous travaillons sur une méthode de simulation de Monte-Carlo qui utilise des variables antithétiques pour estimer un intégrale de la fonction f(x) sur un intervalle (0,1] où f peut être une fonction monotone, non-monotone ou une autre fonction difficile à simuler.
L'idée principale de la méthode qu'on propose est de subdiviser l'intervalle (0,1] en m sections dont chacune est subdivisée en l sous intervalles. Cette technique se fait en plusieurs étapes et à chaque fois qu'on passe à l'étape supérieure la variance diminue. C'est à dire que la variance obtenue à la kième étape est plus petite que celle trouvée à la (k-1)ième étape ce qui nous permet également de rendre plus petite l'erreur d’estimation car l'estimateur de l'intégrale de f(x) sur [0,1] est sans biais. L'objectif est de trouver m, le nombre optimal de sections, qui permet de trouver cette diminution de la variance. / In this master thesis, we consider simulation methods based on antithetic variates for estimate integrales of f(x) on interval (0,1] where f is monotonic function, not a monotonic function or a function difficult to integrate.
The main idea consists in subdividing the (0,1] in m sections of which each one is subdivided in l subintervals. This method is done recursively. At each step the variance decreases, i.e. The variance obtained at the kth step is smaller than that is found at the (k-1)th step. This allows us to reduce the error in the estimation because the estimator of integrales of f(x) on interval [0,1] is unbiased. The objective is to optimize m. / Les fichiers qui accompagnent mon document ont été réalisés avec le logiciel Latex et les simulations ont été réalisés par Splus(R).
|
198 |
Développement et validation d’un index de prédiction des risques d’institutionnalisation et de décès pour le contrôle des variables confondantes non-mesurées dans la population âgéeBéland, Sarah-Gabrielle 08 1900 (has links)
Le biais de confusion est un défi majeur des études observationnelles, surtout s'ils sont induits par des caractéristiques difficiles, voire impossibles, à mesurer dans les banques de données administratives de soins de santé. Un des biais de confusion souvent présents dans les études pharmacoépidémiologiques est la prescription sélective (en anglais « prescription channeling »), qui se manifeste lorsque le choix du traitement dépend de l'état de santé du patient et/ou de son expérience antérieure avec diverses options thérapeutiques. Parmi les méthodes de contrôle de ce biais, on retrouve le score de comorbidité, qui caractérise l'état de santé d'un patient à partir de médicaments délivrés ou de diagnostics médicaux rapportés dans les données de facturations des médecins. La performance des scores de comorbidité fait cependant l'objet de controverses car elle semble varier de façon importante selon la population d'intérêt.
Les objectifs de cette thèse étaient de développer, valider, et comparer les performances de deux scores de comorbidité (un qui prédit le décès et l’autre qui prédit l’institutionnalisation), développés à partir des banques de services pharmaceutiques de la Régie de l'assurance-maladie du Québec (RAMQ) pour leur utilisation dans la population âgée. Cette thèse vise également à déterminer si l'inclusion de caractéristiques non rapportées ou peu valides dans les banques de données administratives (caractéristiques socio-démographiques, troubles mentaux ou du sommeil), améliore la performance des scores de comorbidité dans la population âgée.
Une étude cas-témoins intra-cohorte fut réalisée. La cohorte source consistait en un échantillon aléatoire de 87 389 personnes âgées vivant à domicile, répartie en une cohorte de développement (n=61 172; 70%) et une cohorte de validation (n=26 217; 30%). Les données ont été obtenues à partir des banques de données de la RAMQ. Pour être inclus dans l’étude, les sujets devaient être âgés de 66 ans et plus, et être membres du régime public d'assurance-médicaments du Québec entre le 1er janvier 2000 et le 31 décembre 2009. Les scores ont été développés à partir de la méthode du Framingham Heart Study, et leur performance évaluée par la c-statistique et l’aire sous les courbes « Receiver Operating Curves ». Pour le dernier objectif qui est de documenter l’impact de l’ajout de variables non-mesurées ou peu valides dans les banques de données au score de comorbidité développé, une étude de cohorte prospective (2005-2008) a été réalisée. La population à l'étude, de même que les données, sont issues de l'Étude sur la Santé des Aînés (n=1 494). Les variables d'intérêt incluaient statut marital, soutien social, présence de troubles de santé mentale ainsi que troubles du sommeil.
Tel que décrit dans l'article 1, le Geriatric Comorbidity Score (GCS) basé sur le décès, a été développé et a présenté une bonne performance (c-statistique=0.75; IC95% 0.73-0.78). Cette performance s'est avérée supérieure à celle du Chronic Disease Score (CDS) lorsqu'appliqué dans la population à l'étude (c-statistique du CDS : 0.47; IC 95%: 0.45-0.49). Une revue de littérature exhaustive a montré que les facteurs associés au décès étaient très différents de ceux associés à l’institutionnalisation, justifiant ainsi le développement d'un score spécifique pour prédire le risque d'institutionnalisation. La performance de ce dernier s'est avérée non statistiquement différente de celle du score de décès (c-statistique institutionnalisation : 0.79 IC95% 0.77-0.81). L'inclusion de variables non rapportées dans les banques de données administratives n'a amélioré que de 11% la performance du score de décès; le statut marital et le soutien social ayant le plus contribué à l'amélioration observée.
En conclusion, de cette thèse, sont issues trois contributions majeures. D'une part, il a été démontré que la performance des scores de comorbidité basés sur le décès dépend de la population cible, d'où l'intérêt du Geriatric Comorbidity Score, qui fut développé pour la population âgée vivant à domicile. D'autre part, les médicaments associés au risque d'institutionnalisation diffèrent de ceux associés au risque de décès dans la population âgé, justifiant ainsi le développement de deux scores distincts. Cependant, les performances des deux scores sont semblables. Enfin, les résultats indiquent que, dans la population âgée, l'absence de certaines caractéristiques ne compromet pas de façon importante la performance des scores de comorbidité déterminés à partir de banques de données d'ordonnances. Par conséquent, les scores de comorbidité demeurent un outil de recherche important pour les études observationnelles. / Confounding is an important challenge in observational studies given that they are induced by characteristics difficult, if not impossible, to measure in administrative claims databases. Prescription channelling is a frequent source of confounding in pharmacoepidemiologic studies, and occurs when the selection of one treatment over another is influenced by overall health status and patient's experience with other treatment options. Among the methods available to control for this bias, comorbidity scores are frequently used. Most of the comorbidity scores published in the literature assess the patients’ health status through drug dispensing or diagnostic codes included in physicians’ billings. These comorbidity scores, however, are controversial since their performance appears to vary according to the population of interest ( example: elderly vs. adult).
The objectives of this thesis were to develop, validate and compare the performance of two comorbidity scores (the Geriatric Comorbidity Score based on death, and a comorbidity score based on institutionalization) derived from dispensing data for use in the community-dwelling elderly population. Furthermore, this thesis aimed to evaluate whether the inclusion of characteristics not usually included in administrative claims databases or with a low validity (such as sociodemographic characteristics, sleep or mental disorders) improves the performance of the Geriatric Comorbidity Score.
A nested case-control analysis was conducted within a cohort that consisted of a random sample of 87,389 elderly distributed into a construction cohort (n=61,172; 70%) and a validation cohort (n=26,217; 30%). Sources of data consisted of the databases of the Régie de l’assurance maladie du Québec (RAMQ). To be included in the study, subjects had to be 66 years and older and covered by the public drug insurance program of Quebec between 1st January 2000 and 31st December 2009. Scores were developed using the Framingham Heart Study method, and their performances were assessed using the c-statistics and receiver operating curves (ROC). For the last objective, a prospective cohort study was performed using the participants in the Étude sur la Santé des Aînés (ESA) (n=1,494) which covered the period ranging from 2005 to 2008. Study variables included marital status, social support, mental health as well as sleep disorders.
The comprehensive literature review conducted in the thesis and our results revealed that factors associated with death greatly differed from those associated with institutionalization, which supported the need to develop two distinct scores. Performances of the institutionalization score were, however, not statistically different from the death score (institutionalization c-statistic = 0.79; 95% CI: 0.77-0.81; death c-statistic= 0.75; 95% CI: 0.73-0.78). The Geriatric Comorbidity Score (death score) revealed a better performance than the Chronic Disease Score, which has been widely used in the literature (c-statistic= 0.47; 95%CI: 0.45-0.49). The inclusion of variables not recorded in claims databases yielded an improvement of the death score of only 11%, with marital status and social support being mainly responsible for the improvement.
In terms of achievement, this thesis made three contributions. First, it was shown that the performance of comorbidity scores based on death vary according to the study population, reinforcing the need for specific scores, such as the Geriatric Comorbidity Score which was developed here. Second, factors associated with the risk of institutionalization were different than those associated with the risk of death in the elderly population, which supported the development of an institutionalization score. Even if the performance of death and institutionalization scores were similar, the latter would be preferred in studies that aim at assessing the effect of drugs on institutionalisation in the elderly. Lastly, the results indicate that the absence of some characteristics in the administrative databases do not appear to have a major impact on the performance of scores based on claims data. Consequently, comorbidity scores based on drug dispensing data remain important research tools for pharmacoepidemiologic studies conducted through health claims databases.
|
199 |
Variations spatio-temporelles de la réponse au climat des essences forestières tempérées : quantification du phénomène par approche dendroécologique et influence de la stratégie d'échantillonnageMerian, Pierre 02 March 2012 (has links) (PDF)
En contexte tempéré, les études sur l'instabilité spatio-temporelle de la sensibilité des essences forestières au climat sont rares et souvent conduites à des échelles locales et régionales ; de telles approches ne permettant pas d'obtenir une vision globale de la réponse à l'environnement et à ses variations. La fusion de jeux de données dendrochronologiques (plus de 4500 arbres carottés) a permis d'analyser le comportement de croissance de sept essences européennes tempérées majeures (Quercus petraea, Fagus sylvatica, Abies alba, Picea abies, Pinus sylvestris, Pinus nigra, Pinus uncinata) dans des contextes climatiques variés (océanique à subalpin) et sur l'ensemble du 20ème siècle. Ce travail a également permis de préciser dans quelles mesures les conditions écologiques locales modulaient cette sensibilité au climat. Les relations cerne-climat ont été évaluées par le calcul de fonctions de corrélation. Quelque soit l'essence et le contexte écologique, la sécheresse estivale est le principal facteur limitant la croissance radiale (mais non l'unique), suivie par la sécheresse de l'automne précédent et enfin le froid hivernal. La variabilité spatiale de la réponse dépend plus fortement de la pluviométrie que des températures, une pluviométrie faible conduisant à une sensibilité plus forte au froid hivernal et aux sécheresses estivale et automnale. Ce comportement général est modulé par les conditions écologiques locales, avec une sensibilité à la sécheresse moindre sur sol profond. Les différences interspécifiques s'expriment principalement hors saison de végétation (novembre à mars), même si les corrélations sont rarement significatives. La croissance des résineux est généralement stimulée par des fins d'hiver chauds (février à avril), alors que celle des feuillus est corrélée négativement aux températures et positivement aux précipitations en décembre et janvier. Ces différences entre essences s'avèrent plutôt stables le long des gradients climatiques. Enfin, l'analyse temporelle révèle de fortes instabilités des relations cerne-climat au cours du siècle dernier. Le sens et l'ampleur de ces variations sont homogènes le long des gradients écologiques, mais en revanche peu synchrones avec les instabilités climatiques (automne, hiver, printemps) ou écophysiologiquement peu logiques (été). Cette faible cohérence entre tendances climatiques et instabilité de la sensibilité au climat pourrait s'expliquer par l'absence d'une contrainte climatique de croissance unique en contexte tempéré, où la largeur de cerne est sous le double contrôle du froid hivernal et du stress hydrique estival (et automnal). Elle pourrait également provenir de phénomènes non climatiques, tels que l'effet biologique lié au vieillissement ou l'évolution progressive des pratiques de gestion forestière. Les analyses des variations spatio-temporelles de sensibilité au climat questionnent également sur la précision des relations cerne-climat, estimée le plus souvent au travers du calcul des fonctions de corrélation. En effet, les comparaisons inter-région, inter-site et inter-période des réponses révèlent souvent des variations de corrélations dont les grandeurs pourraient être de l'ordre de la précision liée à l'échantillon considéré. Nous proposons ici de quantifier l'effet de la taille (nombre d'arbres carottés) et des caractéristiques de l'échantillon (nombre de placettes, nombre d'arbres par placette, statuts sociaux couverts) sur la qualité de l'estimation du signal environnemental contenu dans la chronologie moyenne et des fonctions de corrélation. Cette analyse a permis également de préciser dans quelles mesures les différences (1) de traits fonctionnels entre espèces et (2) de contextes climatiques (plus ou moins limitants) modulent cet effet " échantillon ". [...] Suite et fin du résumé dans la thèse.
|
200 |
Sélection de paramètres acoustiques pertinents pour la reconnaissance de la paroleHacine-Gharbi, Abdenour 09 December 2012 (has links) (PDF)
L'objectif de cette thèse est de proposer des solutions et améliorations de performance à certains problèmes de sélection des paramètres acoustiques pertinents dans le cadre de la reconnaissance de la parole. Ainsi, notre première contribution consiste à proposer une nouvelle méthode de sélection de paramètres pertinents fondée sur un développement exact de la redondance entre une caractéristique et les caractéristiques précédemment sélectionnées par un algorithme de recherche séquentielle ascendante. Le problème de l'estimation des densités de probabilités d'ordre supérieur est résolu par la troncature du développement théorique de cette redondance à des ordres acceptables. En outre, nous avons proposé un critère d'arrêt qui permet de fixer le nombre de caractéristiques sélectionnées en fonction de l'information mutuelle approximée à l'itération j de l'algorithme de recherche. Cependant l'estimation de l'information mutuelle est difficile puisque sa définition dépend des densités de probabilités des variables (paramètres) dans lesquelles le type de ces distributions est inconnu et leurs estimations sont effectuées sur un ensemble d'échantillons finis. Une approche pour l'estimation de ces distributions est basée sur la méthode de l'histogramme. Cette méthode exige un bon choix du nombre de bins (cellules de l'histogramme). Ainsi, on a proposé également une nouvelle formule de calcul du nombre de bins permettant de minimiser le biais de l'estimateur de l'entropie et de l'information mutuelle. Ce nouvel estimateur a été validé sur des données simulées et des données de parole. Plus particulièrement cet estimateur a été appliqué dans la sélection des paramètres MFCC statiques et dynamiques les plus pertinents pour une tâche de reconnaissance des mots connectés de la base Aurora2.
|
Page generated in 0.0356 seconds