11 |
DeLLIS débogage de programmes par localisation de fautes avec un système d'information logique /Cellier, Peggy Ducassé, Mireille. Ridoux, Olivier January 2008 (has links) (PDF)
Thèse doctorat : Informatique : Rennes 1 : 2008. / Titre provenant de la page du titre du document électronique. Bibliogr. p. 177-189. Index.
|
12 |
Les facteurs de succès ou d'échec des Jeunes Entreprises Innovantes françaises selon leurs modes de financement et de gouvernance / The factors of success on failure of the French start-ups, according to their financing and their governanceKouamé, Diane Saty 03 April 2012 (has links)
Après avoir évalué la réussite des Jeunes Entreprises Innovantes (JEI) françaises, notre recherche porte sur l'identification des facteurs de succès ou d'échec. Parmi ceux-ci, nous nous focalisons en priorité sur l'émergence de facteurs-clés liés aux modalités de financement et de gouvernance. Notre champ d'étude est circonscrit à la France métropolitaine. Notre base de données est constituée par 488 petites ou moyennes entreprises (PME), présentant de fortes similarités avec les JEI statutaires1, notamment dans la prédominance dans leurs activités de R&D hautement risquées. Leur date de création oscille entre 1996 et 1998.Dans un premier temps, nous retenons la survie comme critère de succès. Nous constatons que moins du tiers de ces sociétés ont fait faillite, que seulement six entreprises ont été rachetées par un grand groupe industriel et que plus de la moitié d'entre elles ont survécu. Dans un second temps, nous analysons l'évolution des performances économique et financière de ces dernières sociétés, deux ans après leur création et pendant six années consécutives, à partir d'une classification automatique. Cette seconde approche permet d'identifier deux groupes. De façon générale, ces entreprises ont des performances mitigées. Quand bien même la quasi-totalité des JEI simulées2 parviennent à assurer leur autonomie financière, seulement près du quart d'entre elles sont profitables. L'analyse des facteurs qui contribuent au succès de ces firmes est fondée sur une modélisation économétrique faisant essentiellement appel aux techniques de régressions logistiques binomiale et multinomiale. Les premiers résultats de cette analyse soulignent l'influence positive de la présence de salariés dans l'actionnariat des entreprises, à l'exception de celles recevant des fonds de capital-risque. Ils démontrent également l'impact positif d'un fort taux d'endettement initial de la société. Les seconds résultats sont plus controversés : notre étude démontre que les exonérations de cotisations sociales3, bien que décriées dans le débat public,sont un facteur déterminant de la réussite de JEI étudiées. [...] Cependant, ces résultats ne doivent être appréciés qu'en fonction des limites de l'étude, notamment en termes de disponibilité de données. La présence d'un grand nombre de valeurs manquantes pour certains indicateurs, qui si elles étaient renseignées, pourraient améliorer l'identification et la description des JEI à succès. Une seconde limite est l'existence d'un biais de sélection puisque l'identification des firmes à succès, selon le critère de performance, ne porte que sur le groupe des JEI simulées qui ont survécu. Autre facteur aggravant, la période de notre analyse couvre la crise des NTIC (Nouvelles Technologies de l'Information et de laCommunication) survenue en 2001 ; ce qui peut biaiser les résultats dans un sens défavorable à leur succès. Enfin, la dernière limite porte sur l'extension des résultats trouvés sur les JEI simulées aux JEI actuelles4. Les premières n'ont pas bénéficié d'une réglementation fiscale et sociale aussi favorable que le dispositif JEI des secondes. Dans cette perspective, il faut considérer cette étude comme une première étape vers une meilleure connaissance dans l'évaluation du succès des JEI françaises et dans l'identification des facteurs de réussite. [...] / The main objective of this study is to expose the underlying causes of success for hightechnology start-ups, in particular those operating under the regime "Jeunes Entreprises Innovantes" (JEI) in the French context. We narrow down the factors to those related to financing and governance. We surveyed 488 technology firms created between 1996 and 1998. We use as a proxy the features of the JEI law enacted in 2004. Technically speaking, our sample is not part of the JEI cohorts so we back tested databases to extract firms meeting the conditions of the law. Wecall this sample the simulated JEI. We retain a two-step approach. To discriminate our sample, we first use survival - firms operating as an ongoing concern - as a proxy for success. Results show that at the end of the period six companies were acquired by a larger company, less than a third of these companies went bankrupt but more than half survived. Second, we have recourse to a technique of automatic classification called taxonomy. To that end, we start assessing economic and financial performances of the companies still alive over the period. This second approach yields two separate groups. Overall, the performances of these firms are at best mixed. Although almost all of the simulated JEI are capable of sustaining themselves financially, only about a quarter of them are profitable. Identifying factors of success or failure factors requires an econometric approach centeredon binomial and multinomial logistic regressions. The most important findings are thefollowing. First, the fact that employees own shares of their firms has a positive influence on performance, except for those backed by venture capital. Second, high levels of debt at the inception impact positively the outcome of the firm. Finally, the results shed a positive light on the controversial payroll tax exemptions. Our models show that they are keys to early success of the simulated JEI. [...]However, these results should be interpreted in the light of evident limitations. We were constrained by the lack of reliable data, having lots of missing values for some of key indicators. We also face a survival bias since the identification of efficient firms can only be applied to existing concerns in our sample. Likewise, we can't reject the hypothesis that the historical context might play a role since the period of our analysis covers the bust of the ICT (Information Technology and Communication) bubble occurring in 2001. Last limitation concerns the conditions of the simulation of our sample. Obviously, the simulated JEI firms had not benefited as much as the real ones from the substantial tax allowances brought up by the legislation. So we consider this study as a first step towards a better understanding of the factors of success of French High Tech Start-ups. [...]
|
13 |
Régression avec copules pour des données hiérarchiquesAkpo, Talagbe Gabin 09 November 2022 (has links)
Dans cette thèse, nous proposons un modèle multivarié pour la modélisation des données en grappes. Le modèle proposé, que nous nommons "d-copule échangeable", permet d'écrire la distribution jointe de nd variables aléatoires mesurées sur n unités de la grappe. Le modèle de d-copule échangeable fait intervenir trois copules et d lois marginales. Il possède des propriétés de flexibilité et de maniabilité dues à sa forme explicite. Nous montrons que la d-copule échangeable est une généralisation du modèle linéaire mixte avec ordonnées à l'origine aléatoires. En effet, lorsque les copules sont toutes normales et les lois marginales sont normales, alors les deux modèles sont équivalents. Nous utilisons le modèle de d-copule échangeable pour faire de la prédiction. Ensuite, nous nous intéressons particulièrement au cas de d=2 variables pour étudier ses propriétés. Nous expliquons la procédure séquentielle pour sélectionner les cinq éléments entrant dans la construction du modèle de 2-copule échangeable. L'estimation des paramètres du modèle de 2-copule échangeable se fait en utilisant deux méthodes d'estimation : la méthode IFM généralisée ou la méthode du maximum de vraisemblance. Nous démontrons que les estimateurs associés aux paramètres du modèle de 2-copule échangeable sont convergents et asymptotiquement normaux que l'on utilise la méthode IFM généralisée ou celle par maximum de vraisemblance. Nous comparons ces deux méthodes d'estimation par le biais d'une étude Monte-Carlo. Finalement, nous montrons la modélisation de données en utilisant un modèle de 2-copule échangeable. Les données proviennent d'une étude effectuée au centre de Londres, dans le cadre du "Junior School Project (JSP)". Nous construisons des courbes de prédiction en utilisant la méthode de 2-copule échangeable que nous comparons à celles obtenues avec le modèle linéaire mixte et le modèle de régression ordinaire avec une copule. / In this thesis, we propose a multivariate model for modeling clustered data. The proposed model, which we name "d-copula", allows us to write the joint distribution of nd random variables measured on n units of the cluster. The exchangeable d-copula model involves three copulas and d marginal laws. It has properties of flexibility and handiness due to its explicit form. We show that the exchangeable d-copula is a generalization of the linear mixed model with random intercepts. Indeed, when the copulas are all normal and the marginal laws are normal, then the two models are equivalent. We use the exchangeable d-copula model to make predictions. Then, we focus on the case of d=2 variables to study its properties. We explain the sequential procedure for selecting the five elements that go into the construction of the exchangeable 2-copula model. The estimation of the parameters of the exchangeable 2-copula model is done using two estimation methods : the generalized IFM method or the maximum likelihood method. We show that the estimators associated with the parameters of the exchangeable d-copula model are convergent and asymptotically normal whether using the generalized IFM or the maximum likelihood method. We compare these two estimation methods by means of a Monte-Carlo study. Finally, we show the construction of an exchangeable 2-copula model from observed data. The data come from a study in central London, as part of the «Junior School Project (JSP)». We construct prediction curves using the exchangeable 2-copula method and compare them to those obtained with the mixed linear model and the ordinary regression model with one copula.
|
14 |
Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetésRéhel, Simon 12 April 2018 (has links)
Ayant pour objectif de rendre un programme informatique capable d’assigner de façon autonome des documents textuels à leur classe d’appartenance, la catégorisation automatique de textes est rendue possible grâce à l’apprentissage supervisé. Un entraînement du programme est effectué sur un ensemble de documents auxquels des étiquettes de catégorie ont déjà été assignées par des humains. Or, la constitution de cet ensemble d’entraînement se révèle un processus long et coûteux. Ce mémoire propose une façon d’améliorer la capacité d’un classificateur à bien accomplir sa tâche dans des situations où un entraînement sur un nombre suffisant de textes n’aura pas été possible. L’approche suggérée consiste à étudier une forme d’association, la cooccurrence, entre les mots provenant d’un ensemble de textes libellés et ceux provenant d’un ensemble de textes non libellés, plus volumineux. On espère ainsi augmenter à faible coût le vocabulaire utile à la classification de textes, en minimisant le nombre de documents à étiqueter. / Automated text categorization consists of developing computer programs able to autonomously assign texts to predefined categories, on the basis of their content. Such applications are possible thanks to supervised learning, which implies a training phase on manually labeled documents. However, the construction of a training set is long and expensive. This study suggests a way to assist text classifiers in the gathering of the vocabulary when the size of the training set is limited. So, it is proposed to analyze word cooccurrence inside a text collection of many non-labeled documents, to augment the vocabulary produced by the analysis of the labeled texts. The representation of new documents to classify can then be modified in order to better match the vocabulary used by the classifier. What is expected, of course, is an improvement of its ability to categorize texts.
|
15 |
Régression avec copules pour des données hiérarchiquesAkpo, Talagbe Gabin 12 November 2023 (has links)
Dans cette thèse, nous proposons un modèle multivarié pour la modélisation des données en grappes. Le modèle proposé, que nous nommons "d-copule échangeable", permet d'écrire la distribution jointe de nd variables aléatoires mesurées sur n unités de la grappe. Le modèle de d-copule échangeable fait intervenir trois copules et d lois marginales. Il possède des propriétés de flexibilité et de maniabilité dues à sa forme explicite. Nous montrons que la d-copule échangeable est une généralisation du modèle linéaire mixte avec ordonnées à l'origine aléatoires. En effet, lorsque les copules sont toutes normales et les lois marginales sont normales, alors les deux modèles sont équivalents. Nous utilisons le modèle de d-copule échangeable pour faire de la prédiction. Ensuite, nous nous intéressons particulièrement au cas de d=2 variables pour étudier ses propriétés. Nous expliquons la procédure séquentielle pour sélectionner les cinq éléments entrant dans la construction du modèle de 2-copule échangeable. L'estimation des paramètres du modèle de 2-copule échangeable se fait en utilisant deux méthodes d'estimation : la méthode IFM généralisée ou la méthode du maximum de vraisemblance. Nous démontrons que les estimateurs associés aux paramètres du modèle de 2-copule échangeable sont convergents et asymptotiquement normaux que l'on utilise la méthode IFM généralisée ou celle par maximum de vraisemblance. Nous comparons ces deux méthodes d'estimation par le biais d'une étude Monte-Carlo. Finalement, nous montrons la modélisation de données en utilisant un modèle de 2-copule échangeable. Les données proviennent d'une étude effectuée au centre de Londres, dans le cadre du "Junior School Project (JSP)". Nous construisons des courbes de prédiction en utilisant la méthode de 2-copule échangeable que nous comparons à celles obtenues avec le modèle linéaire mixte et le modèle de régression ordinaire avec une copule. / In this thesis, we propose a multivariate model for modeling clustered data. The proposed model, which we name "d-copula", allows us to write the joint distribution of nd random variables measured on n units of the cluster. The exchangeable d-copula model involves three copulas and d marginal laws. It has properties of flexibility and handiness due to its explicit form. We show that the exchangeable d-copula is a generalization of the linear mixed model with random intercepts. Indeed, when the copulas are all normal and the marginal laws are normal, then the two models are equivalent. We use the exchangeable d-copula model to make predictions. Then, we focus on the case of d=2 variables to study its properties. We explain the sequential procedure for selecting the five elements that go into the construction of the exchangeable 2-copula model. The estimation of the parameters of the exchangeable 2-copula model is done using two estimation methods : the generalized IFM method or the maximum likelihood method. We show that the estimators associated with the parameters of the exchangeable d-copula model are convergent and asymptotically normal whether using the generalized IFM or the maximum likelihood method. We compare these two estimation methods by means of a Monte-Carlo study. Finally, we show the construction of an exchangeable 2-copula model from observed data. The data come from a study in central London, as part of the «Junior School Project (JSP)». We construct prediction curves using the exchangeable 2-copula method and compare them to those obtained with the mixed linear model and the ordinary regression model with one copula.
|
16 |
Apprentissage automatique de relations d'équivalence sémantique à partir du WebDuclaye, Florence 18 November 2003 (has links) (PDF)
Cette thèse s'inscrit dans le contexte d'un système de Questions-Réponses, capable de trouver automatiquement sur le Web la réponse à des questions factuelles traitant de n'importe quel sujet. L'une des manières d'améliorer la qualité des réponses fournies consiste à augmenter le taux de rappel du système. Pour cela, il est nécessaire de pouvoir identifier les réponses sous de multiples formulations possibles. A titre illustratif, la réponse à la question "Quelle est la hauteur de la Tour Eiffel ?" peut non seulement être exprimée de la même manière que dans la question ("la hauteur de la Tour Eiffel est 300 mètres"), mais également sous d'autres formes lexico-syntaxiques ("la Tour Eiffel culmine à 300 mètres", "la Tour Eiffel fait 300 mètres de haut", etc). On parle alors de paraphrases de la réponse. Le recensement manuel de ces paraphrases étant un travail long et coûteux, l'objectif de cette thèse est de concevoir et développer un mécanisme capable d'apprendre de façon automatique et faiblement supervisée les paraphrases possibles d'une réponse. Inscrite dans le vaste domaine de l'acquisition automatique de connaissances sémantiques, la méthode d'apprentissage présentée fait du Web son corpus privilégié, en particulier par la redondance et la variété linguistique des informations qu'il contient. Considéré comme un gigantesque graphe biparti représenté, d'une part, par des formulations (expressions d'une relation sémantique, comme "culmine à" ou "fait ... de haut") et d'autre part par des couples d'arguments (entités nommées régies par ces formulations, comme "Tour Eiffel - 300 mètres"), le Web s'avère propice à l'application de la citation de Firth, selon laquelle le sens d'un terme (respectivement d'une formulation, dans notre cas) est lié aux termes (respectivement aux arguments) avec lesquels il cooccurre. Ainsi, par un mécanisme itératif, le Web est échantillonné: les formulations (paraphrases potentielles) sont extraites par ancrage des arguments sur le Web et, inversement, de nouveaux arguments sont extraits par ancrages des formulations acquises. Afin de permettre à l'apprentissage de converger, une étape intermédiaire de classification statistique des données échantillonnées est nécessaire. Les résultats obtenus ont fait l'objet d'une évaluation empirique, ce qui permet en particulier de montrer la valeur ajoutée des paraphrases apprises sur le système de Questions-Réponses. De plus, ces résultats mettent en évidence quelques perspectives exploratoires qui permettront d'améliorer le processus d'apprentissage et de l'utiliser dans d'autres contextes applicatifs.
|
17 |
Vers de nouvelles approches discriminantes pour la reconnaissance automatique de visagesVisani, Muriel 25 November 2005 (has links) (PDF)
Les travaux effectués dans le cadre de cette thèse portent sur l'identification automatique de visages dans des images numériques. L'objectif est d'assigner à des visages-requêtes une identité parmi celles d'un ensemble de personnes connues. Pour cela, on cherche à extraire, pour chaque visage, un ensemble de descripteurs appelé signature qui lui soit spécifique, puis à définir un schéma de classification des signatures adapté à l'application visée. De nombreuses méthodes ont été proposées dans la littérature. Parmi les plus efficaces, on compte les techniques de projection statistique, dont le but est de fournir, par le biais d'une analyse multidimensionnelle des données, un espace de représentation plus adapté à la classification que l'espace initial des données. Ce travail reprend ce principe et propose de nouvelles techniques d'extraction de signatures basées sur l'Analyse Discriminante Linéaire qui, contrairement à la plupart des approches existantes, prennent en compte la structure bidimensionnelle des images de visages. Les méthodes proposées permettent de pallier les principaux désavantages des techniques usuelles. Elles contournent le problème de la singularité sans nécessiter l'ajout d'aucun paramètre et leur construction est moins coûteuse et instable. Un schéma original de classification des signatures ainsi obtenues, en monde fermé ou ouvert, est également introduit. Les techniques proposées sont évaluées et comparées aux approches usuelles selon des protocoles expérimentaux rigoureux. Les résultats ainsi obtenus montrent leurs très bonnes performances, et notamment une robustesse accrue vis-à-vis de changements de pose ou d'expression faciale et d'occultations partielles.
|
18 |
Constitution d'une base de références phonétiques pour la reconnaissance de mots isolés pour un système multi-locuteursDelia, Christine 28 September 1984 (has links) (PDF)
Système de reconnaissance de parole dont le principe a été propose par la société Texas Instrument France. Le procédé d'analyse est indépendant du locuteur. Les autres caractéristiques du système sont la reconnaissance de mots isolés parmi un vocabulaire donné, ces mots sont représentes sous forme phonétique et l'apprentissage du système réalisé pour l'ensemble des mots d'une langue donnée.
|
19 |
Approche neuro-mimétique au service du dépistage du cancer du seinNaoum, Hanae January 2009 (has links) (PDF)
Les méthodes de classification automatiques sont un outil important de nos jours pour identifier différentes données et étudier leurs propriétés. On retrouve aujourd'hui l'utilisation des réseaux de neurones en tant que classifieurs dans plusieurs domaines d'application, notamment, le dépistage du cancer du sein. En effet, dans cet axe de recherche, beaucoup de travaux ont été réalisés en employant une approche neuronale pour la reconnaissance de formes et ont abouti à des résultats intéressants. Ceci étant, chaque modèle de réseau de neurones diffère d'un autre de par ses paramètres expérimentaux, sa complexité d'implantation et son domaine d'applicabilité. Ainsi, chaque modèle possède ses avantages et ses inconvénients, faisant qu'il soit plus approprié pour une tâche donnée qu'un autre. Dans (Freeman 1987, Freeman et al., 1988) des expérimentations electrophysiologiques ont été réalisées sur des lapins prouvant l'existence de la dynamique chaotique dans les neurones réels. Depuis les années quatre-vingts, les réseaux de neurones chaotiques ont été le centre d'intérêt de plusieurs travaux en raison de leur dynamique complexe et leur application potentielle dans la dynamique associative, l'optimisation, et le traitement de l'information (Adachi et Aihara, 1997 ; Aihara et al., 1990 ; Tokuda et al., 1997). Dans cette optique, on s'intéresse dans ce travail à étudier la performance d'un modèle de réseau de neurones chaotique sur une tâche de classification reliée à la détection du cancer du sein. À cet effet, on procède dans un premier temps à la revue critique de certains travaux portant sur le sujet et qui ont été rapportés dans la littérature, de manière à situer le travail par rapport à ces travaux et mettre en évidence les contributions qu'il permet. Une étude comparative est ensuite établie où l'on met en avant les avantages d'utiliser une mémoire associative bidirectionnelle chaotique pour le travail de classification, relativement à deux modèles de réseau de neurones classiques, à savoir, une mémoire associative bidirectionnelle standard et un réseau multicouche à rétropropagation d'erreur.
|
20 |
Métaheuristiques pour l'extraction de connaissances application à la génomique /Jourdan, Laetitia Talbi, El-Ghazali Dhaenens, Clarisse. January 2003 (has links) (PDF)
Thèse doctorat : Informatique : Lille 1 : 2003. / N° d'ordre (Lille 1) : 3368. Résumé en français et en anglais. Bibliogr. p. 167-186.
|
Page generated in 0.1892 seconds