Spelling suggestions: "subject:"discriminant""
111 |
Modelos de classificação de risco de crédito para financiamentos imobiliários: regressão logística, análise discriminante, árvores de decisão, bagging e boostingLopes, Neilson Soares 08 August 2011 (has links)
Made available in DSpace on 2016-03-15T19:25:35Z (GMT). No. of bitstreams: 1
Neilson Soares Lopes.pdf: 983372 bytes, checksum: 2233d489295cd76cb2d8dcbd78e1e5de (MD5)
Previous issue date: 2011-08-08 / Fundo Mackenzie de Pesquisa / This study applied the techniques of traditional parametric discriminant analysis and logistic regression analysis of credit real estate financing transactions where borrowers may or may not have a payroll loan transaction. It was the hit rate compared these methods with the non-parametric techniques based on classification trees, and the methods of meta-learning bagging and boosting that combine classifiers for improved accuracy in the algorithms.In a context of high housing deficit, especially in Brazil, the financing of real estate can still be very encouraged. The impacts of sustainable growth in the mortgage not only bring economic benefits and social. The house is, for most individuals, the largest source of expenditure and the most valuable asset that will have during her lifetime.At the end of the study concluded that the computational techniques of decision trees are more effective for the prediction of payers (94.2% correct), followed by bagging (80.7%) and boosting (or arcing , 75.2%). For the prediction of bad debtors in mortgages, the techniques of logistic regression and discriminant analysis showed the worst results (74.6% and 70.7%, respectively). For the good payers, the decision tree also showed the best predictive power (75.8%), followed by discriminant analysis (75.3%) and boosting (72.9%). For the good paying mortgages, bagging and logistic regression showed the worst results (72.1% and 71.7%, respectively).
Logistic regression shows that for a borrower with payroll loans, the chance to be a bad credit is 2.19 higher than if the borrower does not have such type of loan.The presence of credit between the payroll operations of mortgage borrowers also has relevance in the discriminant analysis. / Neste estudo foram aplicadas as técnicas paramétricas tradicionais de análise discriminante e regressão logística para análise de crédito de operações de financiamento imobiliário. Foi comparada a taxa de acertos destes métodos com as técnicas não-paramétricas baseadas em árvores de classificação, além dos métodos de meta-aprendizagem BAGGING e BOOSTING, que combinam classificadores para obter uma melhor precisão nos algoritmos.Em um contexto de alto déficit de moradias, em especial no caso brasileiro, o financiamento de imóveis ainda pode ser bastante fomentado. Os impactos de um crescimento sustentável no crédito imobiliário trazem benefícios não só econômicos como sociais. A moradia é, para grande parte dos indivíduos, a maior fonte de despesas e o ativo mais valioso que terão durante sua vida.
Ao final do estudo, concluiu-se que as técnicas computacionais de árvores de decisão se mostram mais efetivas para a predição de maus pagadores (94,2% de acerto), seguida do BAGGING (80,7%) e do BOOSTING (ou ARCING, 75,2%). Para a predição de maus pagadores em financiamentos imobiliários, as técnicas de regressão logística e análise discriminante apresentaram os piores resultados (74,6% e 70,7%, respectivamente). Para os bons pagadores, a árvore de decisão também apresentou o melhor poder preditivo (75,8%), seguida da análise discriminante (75,3%) e do BOOSTING (72,9%). Para os bons pagadores de financiamentos imobiliários, BAGGING e regressão logística apresentaram os piores resultados (72,1% e 71,7%, respectivamente).A regressão logística mostra que, para um tomador com crédito consignado, a chance se ser um mau pagador é 2,19 maior do que se este tomador não tivesse tal modalidade de empréstimo. A presença de crédito consignado entre as operações dos tomadores de financiamento imobiliário também apresenta relevância na análise discriminante.
|
112 |
Estimation et sélection en classification semi-superviséeVandewalle, Vincent 09 December 2009 (has links) (PDF)
Le sujet de cette thèse est la classification semi-supervisée qui est considérée d'un point de vue décisionnel. Nous nous intéressons à la question de choix de modèles dans ce contexte où les modèles sont estimés en utilisant conjointement des données étiquetées et des données non étiquetées plus nombreuses. Nous concentrons notre recherche sur les modèles génératifs où la classification semi-supervisée s'envisage sans difficulté, contrairement au cadre prédictif qui nécessite des hypothèses supplémentaires peu naturelles. Après avoir dressé un état de l'art de la classification semi-supervisée, nous décrivons l'estimation des paramètres d'un modèle de classification à l'aide de données étiquetées et non étiquetées par l'algorithme EM. Nos contributions sur la sélection de modèles font l'objet des deux chapitres suivants. Au chapitre 3, nous présentons un test statistique où les données non étiquetées sont utilisées pour mettre à l'épreuve le modèle utilisé. Au chapitre 4 nous présentons un critère de sélection de modèles AIC_cond, dérivé du critère AIC d'un point de vue prédictif. Nous prouvons la convergence asymptotique de ce critère particulièrement bien adapté au contexte semi-supervisé et ses bonnes performances pratiques comparé à la validation croisée et à d'autres critères de vraisemblance pénalisée. Une deuxième partie de la thèse, sans rapport direct avec le contexte semi-supervisé, présente des modèles multinomiaux pour la classification sur variables qualitatives. Nous avons conçu ces modèles pour répondre à des limitations des modèles multinomiaux parcimonieux proposés dans le logiciel MIXMOD. À cette occasion, nous proposons un critère type BIC qui prend en compte de manière spécifique la complexité de ces modèles multinomiaux contraints.
|
113 |
Recherche du Rayonnement Gamma Diffus Galactique Autour de 100 GeV dans l'Expérience à Effet Tcherenkov Atmosphérique CELESTEBritto, Richard 19 December 2006 (has links) (PDF)
L'étude de l'émission diffuse galactique est un sujet d'intérêt majeur en astronomie gamma au-delà du GeV pour l'étude des rayonnements cosmiques chargés de notre Galaxie. Face au peu de mesures au-dessus de 10 GeV, nous avons recherché la composante gamma diffuse dans les données hors-source (OFF) de CELESTE, premier télescope à effet Tcherenkov atmosphérique à avoir un seuil en énergie en-dessous de 100 GeV. La production et l'étude de simulations Monte-Carlo de gamma ont permis de valider l'accord entre les simulations et les données, et d'estimer la sensibilité de CELESTE aux gamma diffus. Afin de rechercher le rayonnement gamma diffus, essentiellement localisé aux faibles latitudes galactiques, nous avons entrepris une analyse de lots de données OFF, réalisant ainsi une association par paires OFF / OFF. Une première étape a consisté à vérifier l'absence d'effet systématique significatif en comparant paire par paire deux OFF pris à des dates différentes dans des régions de hautes latitudes galactiques où aucun signal gamma diffus n'était décelable, et sélectionnés selon des critères de stabilité de l'acquisition et de l'atmosphère, pour des pointés identiques. La deuxième étape, visant à rechercher un excès d'événements dans le plan galactique, a consisté à associer en paires les OFF de la nébuleuse du Crabe dont l'un des membres est situé à une latitude |l| < 2°, et l'autre à une latitude |l| = 10°. La soustraction OFF-OFF des données après coupures d'analyse sur des variables construites sur des propriétés géométriques et temporelles du front d'onde Tcherenkov, permettait ainsi la discrimination entre les candidats électromagnétiques et hadroniques. La région sondée était donc celle de l'anticentre galactique. Nous avons obtenu 7 paires, soit 108 min de données. Une limite supérieure à 95 % de niveau de confiance a été établie à 100 GeV, correspondant au flux limite intégral phi (E=100 GeV) = 6,6 x 10^-3 m^-2 s^-1 sr^-1.
|
114 |
Contributions à l'analyse de sensibilité et à l'analyse discriminante généraliséeJacques, Julien 05 December 2005 (has links) (PDF)
Deux thèmes sont abordés dans cette thèse : l'analyse de sensibilité et l'analyse discriminante généralisée.<br /><br />L'analyse de sensibilité globale d'un modèle mathématique étudie comment les variables de sortie de ce dernier réagissent à des perturbations de ses entrées. Les méthodes basées sur l'étude de la variance quantifient les parts de variance de la réponse du modèle dues à chaque variable d'entrée et chaque sous-ensemble de variables d'entrée. Le premier problème abordé est l'impact d'une incertitude de modèle sur les résultats d'une analyse de sensibilité. Deux formes particulières d'incertitude sont étudiées : celle due à une mutation du modèle de référence, et celle due à l'utilisation d'un modèle simplifié à la place du modèle de référence. Un second problème relatif à l'analyse de sensibilité a été étudié au cours de cette thèse, celui des modèles à entrées corrélées. En effet, les indices de sensibilité classiques n'ayant pas de signification (d'un point de vue interprétation) en présence de corrélation des entrées, nous proposons une approche multidimensionnelle consistant à exprimer la sensibilité de la sortie du modèle à des groupes de variables corrélées. Des applications dans le domaine de l'ingénierie nucléaire illustrent ces travaux.<br /><br />L'analyse discriminante généralisée consiste à classer les individus d'un échantillon test en groupes, en utilisant l'information contenue dans un échantillon d'apprentissage, lorsque ces deux échantillons ne sont pas issus d'une même population. Ce travail étend les méthodes existantes dans un cadre gaussien au cas des données binaires. Une application en santé publique illustre l'utilité des modèles de discrimination généralisée ainsi définis.
|
115 |
Reconstruction et étude des baryons multi-étranges dans les collisions d'ions lourds ultra-relativistes à $\sqrt(S_(NN))$ = GeVFaivre, Julien 01 October 2004 (has links) (PDF)
L'étude de la production d'étrangeté est essentielle pour la compréhension du scénario des collisions d'ions lourds ultra-relativistes. Elle est donc directement nécessaire à l'étude de la phase de partons déconfinés qui résulterait de ces collisions : le plasma de quarks et de gluons. STAR, l'une des quatre expériences du collisionneur RHIC, constitue un outil idéal pour l'observation des particules multi-étranges Xi et Oméga. Nous avons créé un code de reconstruction des Xi et Oméga utilisant les traces de la chambre à projection temporelle de STAR. Nous avons ensuite mis au point une méthode multivariables de sélection du signal par rapport au fond combinatoire, l'analyse discriminante linéaire, permettant d'optimiser l'efficacité de la sélection et le rapport signal sur bruit en prenant en compte les corrélations entre variables. Nous l'avons appliquée aux données Au-Au prises à 200 GeV dans le centre de masse afin d'améliorer la précision des résultats précédents. Le taux de production de Oméga et anti-Oméga a été obtenu pour trois classes de centralité, ainsi que leur flot radial et leur température de découplage cinétique. Le gain sur l'incertitude relative est de 15 à 30 % selon les observables. Notre analyse permet en outre de distinguer la fonction modélisant le mieux le spectre en masse transverse des Oméga. La vitesse moyenne du flot radial 0,50 ± 0,02 c et la température de découplage cinétique 132 ± 20 MeV ainsi mesurées semblent notamment indiquer que les baryons multi-étranges se découplent plus tôt du milieu hadronique que les particules plus légères que sont le pion, le kaon et le proton. Les barres d'erreur restent cependant trop grandes pour tirer des conclusions fortes.
|
116 |
Analyses factorielles des distributions marginales de processusBoumaza, Rachid 04 January 1999 (has links) (PDF)
On définit la mesure d'affinité de deux densités de probabilité de p-vecteurs aléatoires par le produit scalaire de ces deux densités dans l'espace des fonctions de carré intégrable. On la calcule pour différents types de densités. On présente les propriétés asymptotiques de cette mesure d'affinité dans le cas de densités gaussiennes ; on montre en particulier la normalité asymptotique de cette mesure lorsque les paramètres de ces densités sont estimés par le maximum de vraisemblance. On utilise cette mesure d'affinité pour définir l'analyse en composantes principales de T densités de probabilité (ou des fonctions caractéristiques associées) avec l'objectif d'apprécier l'évolution de ces densités en les visualisant dans des espaces de dimension réduite. On en montre les liens avec la méthode Statis Dual (sur matrices de variance) et on en propose une estimation convergente. On montre les représentations obtenues sur des données de cardiologie et sur des données de processus gaussiens en en faisant varier les paramètres. Aux densités précédentes indicées par t (t=1,...,T) on ajoute une variable qualitative Y définie sur l'ensemble des indices. Cette variable engendrant une partition des densités en Q catégories, on définit l'analyse discriminante de ces densités et on propose quatre règles d'affectation d'une nouvelle densité gaussienne à l'une des Q catégories. Deux règles sont de type probabiliste (vraisemblance maximale) et s'appuient sur le caractère asymptotiquement gaussien de la mesure d'affinité ; deux règles sont de type géométrique (distance minimale) et s'appuient sur la distance induite par la mesure d'affinité. On applique cette méthode à des données archéologiques (mesures de pierres de châteaux d'Alsace), l'objectif étant de dater ces châteaux.
|
117 |
Diagnostic et surveillance des processus complexes par réseaux bayésiensVerron, Sylvain 13 December 2007 (has links) (PDF)
Cette thèse porte sur la surveillance (détection et diagnostic) des procédés multivariés par réseaux bayésiens. Ceci permet l'unification dans le même outil, un réseau bayésien, de plusieurs méthodes dédiées à la surveillance des procédés, telles que les cartes de contrôles multivariées, l'analyse discriminante ou bien la méthode MYT. Le premier chapitre expose les différents points clés de la surveillance des procédés, en étudiant les diverses approches permettant de réaliser celle-ci. Des méthodes de surveillance supervisées et non-supervisées sont présentées et une étude de différents classifieurs pour la surveillance est effectuée. Le choix d'un classifieur se porte alors sur les réseaux bayésiens. Le second chapitre est l'objet d'une présentation plus approfondie des réseaux bayésiens et des extensions possibles et intéressantes de ce genre d'outil dans le contexte de la surveillance des procédés. Puis, un état de l'art des méthodes de surveillance ou de diagnostic basées sur les réseaux bayésiens est étudié. Le troisième chapitre expose les contributions apportées au domaine de la surveillance des procédés par réseaux bayésiens. Les contributions apportées se répartissent en trois parties : détection, diagnostic supervisé et diagnostic non-supervisé. En s'appuyant sur ces contributions, la structure complète d'un réseau bayésien dédié à la surveillance des procédés est proposée. Le dernier chapitre présente une application de la méthode proposée sur un exemple classique : le procédé Tennessee Eastman. Les performances du réseau en terme de détection et de diagnostic sont évaluées. Finalement, les conclusions et perspectives de l'approche proposée sont émises.
|
118 |
Estado actual de la degradación de suelos calizos en varias zonas de la Región de MurciaTudela Serrano, Mª Luz 17 July 1993 (has links)
Se presenta una propuesta metodológica de clasificación de la degradación del suelo en ecosistemas semiáridos por pérdida de materia orgánica, basada en el tratamiento estadístico por análisis discriminante y factorial de los parámetros que habitualmente se determinan en los suelos y que influyen de manera decisiva en su degradación biológica y física. Se aplica el estudio a suelos calizos de siete zonas de la Región de Murcia, obteniéndose tres elementos discriminatorios: materia orgánica, textura y clase de productividad, siendo las dos primeras las de mayor peso específico. Con el análisis discriminante se establecen cuatro clases de degradación de suelos, en función del contenido en materia orgánica. A continuación, para evaluar el estado de degradación del suelo se recurre al análisis factorial de las variables estudiadas, presentando los suelos menos degradados un factor fertilidad positivo, mientras que los más degradados tienen un factor fertilidad negativo, tanto más bajo cuanto más intensa es la degradación. Como conclusión, se considera que el Calcisol pétrico, cultivado, procede de la degradación del Kastanosem pétrico, bajo vegetación natural, por degradación biológica de éstos, con la consiguiente disminución de materia orgánica con el transcurso del tiempo. Se calcula que dicha degradación viene operando desde hace unos 100 años. / We presented/displayed in this work a methodologic proposal of classification of the degradation of the ground in semi-arid ecosystems by loss of organic matter, cradle in the statistical treatment by discriminante and factorial analysis of the parameters that habitually determine in grounds and that they influence of decisive way in its biological and physical degradation. It is applied to the study to limestone grounds of seven zones of the Region of Murcia, obtaining itself three discriminatory elements: organic matter, texture and class of productivity, being two first those of greater specific weight. With the discriminante analysis four classes of ground degradation settle down, based on the content in organic matter, of greater to minor, assigning each sample to one of them. Class 1: Calcic Kastanosem, Leptosol and Cambisol. Class 2: Pétrico Kastanosem. Class 3: Pétrico and háplico Calcisol. Class 4: Regosol, Fluvisol and Antrosol. Next, to evaluate the state of degradation of the ground one resorts to the factorial analysis of the studied variables, presenting grounds less degraded a factor positive fertility, whereas the most degraded they have a negative factor fertility, lower as much at the most intense is the degradation. Like conclusion, it is considered that the pétrico Calcisol, cultivated, comes from the degradation of the pétrico Kastanosem, under natural vegetation, by biological degradation of these, with the consequent diminution of organic matter with the course of the time. One calculates that this degradation has been coming operating for about 100 years.
|
119 |
CONTRIBUTIONS A LA MAITRISE STATISTIQUE DES PROCESSUS INDUSTRIELS MULTIVARIESTiplica, Teodor 03 October 2002 (has links) (PDF)
Les travaux présentés dans ce mémoire se situent dans le cadre de la maîtrise statistique des processus (MSP). Les principales cartes de contrôle univariées et multivariées sont présentées dans le chapitre I. Un résumé non-exhaustif des méthodes de détection de la cause d'une situation hors contrôle dans un processus multivarié est donné dans le chapitre II. Une nouvelle méthodologie de contrôle et de diagnostic de processus - FNAD (Filtrage Numérique et Analyse Discriminante) - a été proposée dans le chapitre III. Un exemple pratique d'utilisation de la méthode FNAD a été donné pour le diagnostic d'un processus de fabrication du polyéthylène de faible densité. Deux nouvelles cartes de contrôle - la carte de contrôle par filtrage numérique (CCFN) et la carte de contrôle spectrale (CCS) ont été proposées dans le chapitre IV. Le principe de construction de la carte CCFN repose sur l'utilisation des équations récurrentes définissant les filtres numériques RII (Réponse Impulsionnelle Infinie) ou ARMA (AutoRegressive Moving Average). Les limites de contrôle et l'efficacité de la carte CCFN ont été calculées à l'aide de simulations. Le principe de contrôle de la carte de contrôle spectrale (CCS) est basé sur l'analogie temps-fréquence: une fenêtre glissante est déplacée dans le domaine temporel et le contenu spectral de la fenêtre est analysé afin de détecter les changements de la moyenne. La formule analytique de la limite de contrôle a été donnée. Les performances de la carte dans la détection des différents déréglages ont été calculées à partir des simulations et comparées avec celles de la carte EWMA.
|
120 |
Análise discriminante como instrumento para a concessão de créditoMantovanini, João Carlos Labate 12 December 1990 (has links)
Made available in DSpace on 2010-04-20T20:14:52Z (GMT). No. of bitstreams: 0
Previous issue date: 1990-12-12T00:00:00Z / Trata da apresentação da técnica estatística conhecida como Análise Discriminante e sua aplicação na classificação de empresas, quanto à condição de solvência, para fins de concessão de crédito. Aborda aspectos conceituais e teóricos dessa técnica estatística e os recentes estudos sobre sua aplicação e limitações em finanças.
|
Page generated in 0.0811 seconds