Spelling suggestions: "subject:"inférence"" "subject:"conférence""
41 |
Inférence grammaticale en situations bruitéesTantini, Frédéric 09 June 2009 (has links) (PDF)
L'inférence grammaticale s'intéresse à l'apprentissage automatique de langages formels. Ces derniers sont organisés en plusieurs classes formant la hiérarchie de Chomsky. Parmi elles, les langages réguliers, reconnus par des automates finis déterministes, forment la classe la plus « simple » à apprendre : l'apprentissage des automates a largement été étudié et a donné naissance à plusieurs algorithmes d'inférence grammaticale.<br /><br />Toutefois, un problème concernant les données est devenu crucial : celui du bruit. Des propositions d'algorithmes ont vu le jour pour essayer de résoudre ce problème, mais nous montrons que les résultats ne sont toujours pas satisfaisants, y compris pour les langages réguliers. Or, puisqu'ils forment la base de la hiérarchie de Chomsky, ce sont toutes les classes de la hiérarchie qui ne peuvent être apprises en situations bruitées.<br /><br />Aussi, nous proposons une nouvelle classe de langages qui semble ne pas souffrir de ce handicap : celle des boules de mots. Nous démontrons que cette classe, de prime abord peu orthodoxe mais utilisée dans de nombreuses applications comme la correction orthographique ou la recherche de plus proches voisins, reste identifiable à la limite même lorsque les données d'apprentissage subissent l'influence d'un bruit non statistique.<br /><br />De plus, nous introduisons les requêtes de correction basées sur la distance d'édition et nous présentons un algorithme d'apprentissage des boules de mots à partir de telles requêtes. Nous montrons expérimentalement que de simples heuristiques a posteriori suffisent à le rendre résistant lorsque l'oracle répond approximativement à de telles requêtes. Ceci justifie encore une<br />fois la robustesse des boules de mots au bruit.<br /><br />Contrairement aux idées reçues, le bruit n'est donc pas une malédiction en inférence grammaticale : les langages à base de distance offrent de nouvelles perspectives.
|
42 |
Modélisation de l'impact d'un bloc rocheux sur un terrain naturel, application à la trajectographie des chutes de blocsBourrier, Franck 14 November 2008 (has links) (PDF)
Ce travail de thèse porte sur la caractérisation du rebond d'un bloc sur un terrain naturel dans la perspective d'améliorer les modèles de détermination de l'aléa de chute de blocs. L'impact d'un bloc rocheux sur un sol composé d'éboulis est modélisé par la Méthode des Elements Discrets. La comparaison entre les résultats de simulation et les résultats d'essais à échelle réduite d'impact sur un sol granulaire grossier met en évidence que le modèle numérique développé assure une prédiction pertinente du rebond pour un nombre réduit de paramètres de simulation à calibrer. L'analyse de l'impact à l'aide du modèle numérique montre que l'interaction entre l'impactant et le sol peut être décomposée en trois phases : le transfert énergétique initial du bloc vers le sol, la propagation d'une onde de compression du point d'impact vers l'intérieur du sol et la réflexion de l'onde de compression sur le substratum. L'étude des échanges énergétiques lors de ces trois phases conduit à la définition d'un diagramme d'existence du rebond délimitant les domaines d'arrêt et de rebond de l'impactant et à l'identification de trois régimes d'impact. Le traitement statistique des résultats de simulation par des méthodes statistiques basées sur l'inférence Bayésienne permet également de définir une loi d'impact stochastique. Cette loi est représentative de la variabilité des vitesses du bloc après impact en fonction des paramètres cinématiques incidents et de l'arrangement géométrique des particules du sol au voisinage du point d'impact. Enfin, suite à l'intégration de la loi stochastique d'impact dans le contexte de l'analyse trajectographique, une approche probabiliste globale permettant la caractérisation détaillée de l'aléa de chute de bloc ainsi que l'implantation et le dimensionnement d'ouvrages de protection est proposée.
|
43 |
Syntaxe, raisonnement et génomesNicolas, Jacques 13 May 2008 (has links) (PDF)
J'ai travaillé sur les problèmes de modélisation du vivant avec l'hypothèse fondamentale qu'il s'agit de machines symboliques et la volonté d'aider le chercheur en biologie à traiter avec le bon niveau d'abstraction ces machines. Le cœur de mes travaux considère les ensembles de séquences que forment les macromolécules du vivant comme des langages formels et cherche à approfondir les concepts nécessaires pour mener à bien leur analyse linguistique. Il faut tout d'abord étudier le contenu lexical des séquences génomiques, son vocabulaire. Au niveau élémentaire, les facteurs répétés fournissent les unités de sens de la séquence. Cependant, la notion naturelle de répétition dans l'ADN est beaucoup plus complexe et nécessite à la fois d'être formalisée et d'être accompagnée d'une algorithmique de recherche spécialisée. J'ai particulièrement développé cet aspect dans l'étude d'éléments génétiques mobiles à l'intérieur d'un génome ou entre deux génomes. J'ai également travaillé sur le niveau syntaxique, ce qui a mené à l'élaboration d'un langage, Logol, qui permet au biologiste de construire un modèle grammatical hypothétique puis de le tester sur des séquences génomiques. Le langage défini autorise en particulier une notion de variable de chaîne avec une face abstraite qui représente la chaîne d'origine et une face concrète pour les différentes instances copies de cette chaîne d'origine. Ce cadre a été validé sur plusieurs problèmes biologiques de recherche de protéines ou d'éléments génétiques, dont la découverte de récepteurs olfactifs chez le chien et la découverte de défensines humaines. Lorsqu'aucun modèle n'est disponible, il faut tenter de l'inférer à partir d'exemples de séquences. J'ai lancé une série de recherches tant théoriques que pratiques sur ce thème. Au niveau théorique, le problème difficile de l'inférence de grammaires algébriques a été abordé à partir d'ordres partiels sur les non-terminaux ou les arbres de dérivation. La classe mieux maîtrisable des langages réguliers a fait l'objet des travaux les plus approfondis, sur une représentation par automates d'états finis. L'inférence devient alors un problème d'optimisation par gestion d'un ensemble de contraintes dynamiques sur les équivalences d'états. Du point de vue pratique, nous avons tout particulièrement étudié ces problèmes d'inférence sur des séquences de protéines, par exemple en étudiant la prédiction de certaines liaisons (ponts disulfures) entre des sites distants sur la séquence. Enfin, je propose à la fin de mon document d'habilitation un projet pour aborder de façon plus transdisciplinaire la modélisation du vivant en tant que machine symbolique. Les questions que pose la biologie, science expérimentale par excellence, s'expriment majoritairement en termes de raisonnement hypothétique. Je propose de mener des recherches en vue de la mise au point d'un assistant d'expérimentation biochimique sur puce sur cultures cellulaires. Le but global est le développement d'un environnement permettant de relier en boucle expérimentation, observations et acquisition de connaissances, en utilisant un système complet de raisonnement automatique (apprentissage abductif et inductif et planification).
|
44 |
Statistique asymptotique dans des modèles à variables latentesMatias, Catherine 17 October 2008 (has links) (PDF)
Je présente dans ce manuscrit mes travaux de recherche effectués depuis la thèse. Mes thèmes de recherche sont principalement motivés par des applications en génomique ou post-génomique. Mon domaine de recherche est assez vaste, mais le dénominateur commun de mes travaux est la présence de variables latentes (non observées) dans les modèles étudiés. Mes préoccupations sont majoritairement théoriques : éudes asymptotiques, convergence des estimateurs, vitesses, identifiabilité... Les modèles considérés peuvent être aussi bien paramétriques que semi ou non paramétriques, et les outils statistiques utilisés sont donc relativement variés.<br /><br />Ma présentation s'organise en trois grandes thématiques : les travaux portant sur des séquences, notamment sur la modélisation de leur distribution et des processus d'évolution sous-jacents ; les travaux de statistique semi ou non paramétrique portant sur des signaux observés avec du bruit ; et enfin les travaux (en partie en cours) portant sur les graphes aléatoires.
|
45 |
Inférence parallèle et processus communicants pour les clauses de Horn : extension au premier ordre par la méthode de connexionIbañez, Maria Blanca 12 March 1990 (has links) (PDF)
Dans cette thèse, nous avons décrit une machine a inférence parallèle pour les clauses de Horn qui exploite le parallélisme ou et qui utilise comme mécanisme d'inférence la resolution. Le modèle décrit pour les clauses de Horn part d'un réseau de processus qui représente la structure syntaxique du programme logique. Le fait d'avoir fp2 comme langage pour la spécification des machines nous a permis d'utiliser le mécanisme de communication du langage pour réaliser l'opération de base dans l'inférence: l'unification. L'espace de recherche de la preuve d'une formule des clauses de Horn contient uniquement les axiomes de la preuve plus la résolvante courante. Pour prouver une formule du premier ordre, cet espace est insuffisant. Nous avons présente également une methode correcte, fondée sur la methode de connexion pour calculer les ensembles des pairs de litteraux a résoudre dans une formule de premier ordre. Cela représente le pas le plus difficile a franchir pour la spécification d'une machine a inférence parallèle pour la logique du premier ordre
|
46 |
Les types en Prolog : un système d'inférence de type et ses applicationsAzzoune, Hamid 11 January 1989 (has links) (PDF)
Contribution à l'approche inferentielle pour l'introduction de la notion de type en Prolog. Cette approche consiste à déduire automatiquement d'un programme les types des prédicats. Le programmeur peut ainsi s'assurer de la conformité du programme à ses intentions. Une méthode d'inférence de type pour Prolog est présentée. Elle se base sur une simulation de l'unification et une simulation de la résolution, avec un traitement particulier sur les appels récursifs
|
47 |
Inférences sur l'histoire des populations à partir de leur diversité génétique : étude de séquences démographiques de type fondation-explosionCalmet, Claire 16 December 2002 (has links) (PDF)
L'étude de la démographie dans une perspective historique participe à la compréhension des processus évolutifs. Les données de diversité génétique sont potentiellement informatives quant au passé démographique des populations: en effet, ce passé est enregistré avec perte d'information par les marqueurs moléculaires, par l'intermédiaire de leur histoire généalogique et mutationnelle. L'acquisition de données de diversité génétique est de plus en plus rapide et aisée, et concerne potentiellement n'importe quel organisme d'intérêt. D'où un effort dans la dernière décennie pour développer les outils statistiques permettant d'extraire l'information démographique des données de typage génétique.<br />La présente thèse propose une extension de la méthode d'inférence bayésienne développée en 1999 par M. Beaumont. Comme la méthode originale, (i) elle est basée sur le coalescent de Kingman avec variations d'effectif, (ii) elle utilise l'algorithme de Metropolis-Hastings pour échantillonner selon la loi a posteriori des paramètres d'intérêt et (iii) elle permet de traiter des données de typage à un ou plusieurs microsatellites indépendants. La version étendue généralise les modèles démographique et mutationnel supposés dans la méthode initiale: elle permet d'inférer les paramètres d'un modèle de fondation-explosion pour la population échantillonnée et d'un modèle mutationnel à deux phases, pour les marqueurs microsatellites typés. C'est la première fois qu'une méthode probabiliste exacte incorpore pour les microsatellites un modèle mutationnel autorisant des sauts.<br />Le modèle démographique et mutationnel est exploré. L'analyse de jeux de données simulés permet d'illustrer et de comparer la loi a posteriori des paramètres pour des scénarios historiques: par exemple une stabilité démographique, une croissance exponentielle et une fondation-explosion. Une typologie des lois a posteriori est proposée. Des recommandations sur l'effort de typage dans les études empiriques sont données: un unique marqueur microsatellite peut conduire à une loi a posteriori très structurée. Toutefois, les zones de forte densité a posteriori représentent des scénarios de différents types. 50 génomes haploides typés à 5 marqueurs microsatellites suffisent en revanche à détecter avec certitude (99% de la probabilité a posteriori) une histoire de fondation-explosion tranchée. Les conséquences de la violation des hypothèses du modèle démographique sont discutées, ainsi que les interactions entre processus et modèle mutationnel. En particulier, il est établi que le fait de supposer un processus mutationnel conforme au modèle SMM, alors que ce processus est de type TPM, peut générer un faux signal de déséquilibre génétique. La modélisation des sauts mutationnels permet de supprimer ce faux signal.<br />La méthode est succinctement appliquée à l'étude de deux histoires de fondation-explosion: l'introduction du chat Felis catus sur les îles Kerguelen et celle du surmulot Rattus norvegicus sur les îles du large de la Bretagne. Il est d'abord montré que la méthode fréquentiste développée par Cornuet et Luikart (1996) ne permet pas de détecter les fondations récentes et drastiques qu'ont connu ces populations. Cela est vraisemblablement dû à des effets contraires de la fondation et de l'explosion, sur les statistiques utilisées dans cette méthode.<br />La méthode bayésienne ne détecte pas non plus la fondation si l'on force une histoire démographique en marche d'escalier, pour la même raison. La fondation et l'explosion deviennent détectables si le modèle démographique les autorise. Toutefois, les dépendances entre les paramètres du modèle empêchent de les inférer marginalement avec précision. Toute information a priori sur un paramètre contraint fortement les valeurs des autres paramètres. Ce constat confirme le potentiel de populations d'histoire documentée pour l'estimation indirecte des paramètres d'un modèle de mutation des marqueurs.
|
48 |
Programmation Bayésienne des RobotsLebeltel, Olivier 08 October 1999 (has links) (PDF)
Cette thèse propose une méthode originale de programmation de robot fondée sur l'inférence et l'apprentissage bayésien. Cette méthode traite formellement des problèmes d'incertitude et d'incomplétude inhérents au domaine considéré. En effet, la principale difficulté de la programmation des robots vient de l'inévitable incomplétude des modèles utilisés. Nous exposons le formalisme de description d'une tâche robotique ainsi que les méthodes de résolutions. Ce formalisme est inspiré de la théorie du calcul des probabilités, proposée par le physicien E.T. Jaynes : "Probability as Logic". L'apprentissage et les techniques de maximum d'entropie traduisent l'incomplétude en incertitude. L'inférence bayésienne offre un cadre formel permettant de raisonner avec cette incertitude. L'apport principal de cette thèse est la définition d'un système générique de programmation pour la robotique et son application expérimentale. Nous l'illustrons en utilisant ce système pour programmer une application de surveillance pour un robot mobile : le Khepera. Pour cela, nous utilisons des ressources génériques de programmation appelées "descriptions". Nous montrons comment définir et utiliser de manière incrémentale ces ressources (comportements réactifs, fusion capteur, reconnaissance de situations et séquences de comportements) dans un cadre systématique et unifié. Nous discutons des différents avantages de notre approche : expression des connaissances préalables, prise en compte et restitution de l'incertitude, programmation directe et inverse. Nous proposons des perspectives à ce travail : choix d'architecture et planification. Nous situons notre travail dans un cadre épistémologique plus vaste en opposant, dans le cadre de la robotique autonome, l'approche "classique" relevant de la "cognition de haut niveau" et l'approche "réactive" associée à une "cognition de bas niveau". Nous montrons finalement comment nos travaux proposent de faire le lien entre ces deux extrêmes.
|
49 |
Aide à la décision dans la gestion des parcs de compteurs d'eau potablePasanisi, Alberto 01 1900 (has links) (PDF)
La métrologie des compteurs d'eau se dégrade au long de leur vie opérationnelle, entraînant, pour la plupart des compteurs actuellement utilisés en France, une sous-estimation du volume d'eau facturé. Ce phénomène est source de problèmes pour les distributeurs d'eau: il se traduit en un manque à gagner non négligeable et détermine une situation d'inégalité entre les usagers. En outre, une réglementation, de plus en plus exigeante, obligera bientôt les distributeurs à limiter la proportion d'appareils à métrologie imparfaite en dessous d'une valeur fixée. La planification des renouvellements des compteurs est, par conséquent, un problème complexe qui demande la mise en place d'une stratégie optimale. N'importe quelle méthode de planification nécessite la connaissance préliminaire de la métrologie des compteurs en conditions réelles d'exploitation. Le but de cette thèse est de fournir des éléments utiles à la mise en place des règles de gestion optimale adoptées par la Compagnie Générale des Eaux. L'étude de la dégradation de la métrologie se fait avec un modèle dynamique (markovien) à quatre états discrets à métrologie de plus en plus dégradée. Les calculs d'inférence sont réalisés dans un cadre bayésien avec des techniques MCMC (Markov Chain Monte Carlo). Cette méthode d'estimation est une alternative, plus que valide, aux procédures basées sur la recherche du maximum de la vraisemblance sous contraintes. Finalement, on montre que le modèle est capable de fournir des prévisions directement utilisables par les décideurs: l'estimation du sous-comptage et de la probabilité de non-conformité, en fonction de l'âge, de l'agressivité du site et de la consommation annuelle.
|
50 |
Modéliser l'acquisition de la syntaxe du langage naturel via l'hypothèse de la primauté du sensTellier, Isabelle 08 December 2005 (has links) (PDF)
L'objet de ce travail est la modélisation informatique de la capacité d'apprentissage de la syntaxe de leur langue naturelle par les enfants. Une synthèse des connaissances psycho-linguistiques sur la question est donc tout d'abord proposée. Le point de vue adopté pour la modélisation accorde une place privilégiée à la sémantique, qui est supposée acquise avant la syntaxe. Le Principe de compositionnalité, éventuellement adapté, est mis à contribution pour formaliser les liens entre syntaxe et sémantique, et le modèle d'apprentissage ''à la limite'' par exemples positifs de Gold est choisi pour régir les conditions de l'apprentissage. Nous présentons dans ce contexte divers résultats d'apprenabilité de classes de grammaires catégorielles à partir de divers types de données qui véhiculent des informations sémantiques. Nous montrons que, dans tous les cas, la sémantique contribue à spécifier les structures sous-jacentes aux énoncés, et à réduire ainsi l'espace de recherche des algorithmes d'apprentissage.
|
Page generated in 0.0564 seconds