Spelling suggestions: "subject:"[een] LOGISTIC REGRESSION"" "subject:"[enn] LOGISTIC REGRESSION""
191 |
Modelos baseados em pseudo-valores e sua aplicabilidade em credit scoring / Models based on pseudo-values with application to credit scoringSilva, Liliane Travassos da 02 August 2010 (has links)
Os modelos de credit scoring têm sido bastante difundidos nos últimos anos como uma importante ferramenta para agilizar e tornar mais confiável o processo de concessão de crédito por parte das instituições financeiras. Esses modelos são utilizados para classificar os clientes em relação a seus riscos de inadimplência. Neste trabalho, é avaliada a aplicabilidade de uma nova metodologia, baseada em pseudo-valores, como alternativa para a construção de modelos de credit scoring. O objetivo é compará-la com abordagens tradicionais como a regressão logística e o modelo de riscos proporcionais de Cox. A aplicação prática é feita para dados de operações de crédito pessoal sem consignação, coletados do Sistema de Informações de Crédito do Banco Central do Brasil. As performances dos modelos são comparadas utilizando a estatística de Kolmogorov-Smirnov e a área sob a curva ROC. / Credit Scoring models have become popular in recent years as an important tool in the credit granting process, making it more expedite and reliable. The models are mainly considered to classify customers according to their default risk. In this work we evaluate the apllicability of a new methodology, based on pseudo-values, as an alternative to constructing credit scoring models. The objective is to compare this novel methodology with traditional approaches such as logistic regression and Cox proportional hazards model. The models are applied to a dataset on personal credit data, collected from the Credit Information System of Central Bank of Brazil. The performances of the models are compared via Kolmogorov-Smirnov statistic and the area under ROC curve.
|
192 |
Modelo preditivo para perda de crédito e sua aplicação em decisão de spread / A model of credit loss and its application in decision of spreadMello, Joao Fernando Serrajordia Rocha de 01 April 2009 (has links)
Métodos analíticos para concessão de crédito vêm apresentando enormes avanços nas últimas décadas, particularmente no que se refere a métodos estatísticos de classificação para identificar grupos de indivíduos com diferentes taxas de inadimplência. A maioria dos trabalhos existentes sugere decisões do tipo conceder o crédito ou não, considerando apenas de forma marginal o resultado esperado da operação. O presente trabalho tem o objetivo de propor um modelo de avaliação de risco de crédito mais complexo que os tradicionais modelos de Credit Scoring, que forneça uma perspectiva mais detalhada acerca do desempenho futuro de um contrato de crédito, e que vá além da classificação entre bom e mau pagador. Aliado a este ganho de informação na previsibilidade oferecida pelo modelo, também é objetivo ampliar o espaço de decisões do problema, saindo de uma resposta binária (como aceitar/rejeitar o crédito) para algo que responda à seguinte pergunta: qual é a taxa justa para cobrir determinado risco?. / Analytical methods for granting credit are presenting enormous advances in recent decades, particularly in the field of statistical methods of classification to identify groups of individuals with different rates of default. Most of the existing work suggests decisions of the type granting credit or not, regarding just marginally the expected outcome of the operation. This work aims to propose a model to evaluate credit risk with more complexity than the traditional \"Credit Scoring\" models, providing a more detailed view about the future performance of a credit agreement, which goes beyond the classification of good and bad payers. Coupled with this improvement of information offered by the model, it is also this works aim to expand the decision space of the problem, leaving a binary response (such as accept/reject the claim) to something that answers the following question: \"what is the fair rate to cover a given risk \".
|
193 |
O efeito disposição e suas motivações comportamentais: um estudo com base na atuação de gestores de fundos de investimento em ações / The disposition effect and its behavioral motivations: a study based on stock fund managers trading activityLucchesi, Eduardo Pozzi 20 May 2010 (has links)
O efeito disposição, originalmente proposto por Shefrin e Statman (1985), preconiza que os investidores tendem a vender ações com lucro em um curto período de tempo e manter ações com prejuízo por um longo período de tempo. A despeito da ampla gama de evidências sobre o assunto, as razões que levariam os investidores a manifestar esse viés comportamental ainda é motivo de uma controvérsia importante entre motivações racionais e comportamentais. Neste trabalho, o objetivo foi testar duas motivações comportamentais concorrentes para explicar o efeito disposição: a teoria perspectiva e o viés da reversão à média. Para cumprir esse objetivo, foi feita uma análise das transações mensais de compra e venda de uma amostra de 51 fundos de investimento em ações brasileiros, no período de 2002 a 2008. A análise envolveu a estimação de dois modelos de regressão de variável dependente qualitativa. O primeiro consistiu em um modelo logit binário cujo propósito foi determinar a probabilidade de um gestor realizar um ganho ou uma perda de capital em razão de variáveis de retorno das ações. O segundo foi um modelo logit ordenado cujo objetivo foi verificar a existência de uma relação entre as variáveis de retorno e o volume monetário vendido das ações. Em ambos os modelos, os parâmetros estimados para as variáveis de retorno das ações foram interpretados como um coeficiente de disposição, sendo que a proposição desse coeficiente consistiu na principal contribuição da pesquisa. Os resultados dos modelos estimados trouxeram evidências de que a teoria perspectiva parece permear o processo decisório dos gestores dos fundos analisados. Já no caso da hipótese de que o efeito disposição é decorrente do viés da reversão à média, não foi possível corroborá-la com base nos resultados aqui relatados. / The disposition effect, originally proposed by Shefrin and Statman (1985), predicts that investors tend to sell winning stocks too soon and ride losing stocks too long. Despite the wide range of research evidence about this issue, the reasons that lead investors to act this way is still subject to much controversy between rational and behavioral explanations. In this thesis, the main goal was to test two competing behavioral motivations to justify the disposition effect: prospect theory and mean reversion bias. To achieve this goal, an analysis of monthly transactions for a sample of 51 Brazilian stock funds from 2002 to 2008 was conducted. The analysis involved the estimation of two regression models with qualitative dependent variable. The first one consisted of a binary logit model whose purpose was to set the probability of a manager to realize a capital gain or loss as a function of the stock return. The second one was an ordered logit model whose objective was to verify the existence of a relationship between stock returns and the monetary volume sold. In both models, the estimated parameters for the stock return variables were interpreted as a disposition coefficient and the proposition of this coefficient was the main contribution of the research. The results of the estimated models brought evidence that prospect theory seems to guide the decision making process of the managers of the analyzed funds. The hypothesis that the disposition effect is due to mean reversion bias could not be confirmed based on the results reported here.
|
194 |
Estratégias para o desenvolvimento de modelos de credit score com inferência de rejeitados. / Strategies for the development of credit score with the inference rejectedAlves, Mauro Correia 03 September 2008 (has links)
Modelos de credit score são usualmente desenvolvidos somente com informações dos proponentes aceitos. Neste trabalho foram consideradas estratégias que podem ser utilizadas para o desenvolvimento de modelos de credit score com a inclusão das informações dos rejeitados. Foram avaliadas as seguintes técnicas de inferência de rejeitados: classificação dos rejeitados como clientes Maus, parcelamento, dados aumentados, uso de informações de mercado e ainda a estratégia de aceitar proponentes rejeitados para acompanhamento e desenvolvimento de novos modelos de risco de crédito. Para a avaliação e comparação dos modelos foram utilizadas as medidas de desempenho: estatística de Kolmogorov-Smirnov (KS), área sob a curva de Lorentz (ROC), área entre as curvas de distribuição acumulada dos escores (AEC), diferença entre as taxas de inadimplência nos intervalos do escore definidos pelos decis e coeficiente de Gini. Concluiu-se que dentre as quatro primeiras técnicas avaliadas, o uso de informaçõoes de mercado foi a que apresentou melhor desempenho. Quanto à estratégia de aceitar proponentes rejeitados, observou-se que há um ganho em relação ao modelo ajustado só com base nos proponentes aceitos. / Credit scoring models are usually built using only information of accepted applicants. This text considered strategies that can be used to develop credit score models with inclusion of the information of the rejects. We evaluated the techniques of reject inference: classification of rejected customers as bad, parceling, augmentation, use of market information and the strategy of accepting rejected proponents for monitoring and developing new models of credit risk. For the evaluation and comparison between models were used performance measures: Kolmogorov-Smirnov statistics (KS), the area under the Lorentz Curve (ROC), area between cumulative distribution curves of the scores (AEC), difference among the delinquency rate in the score buckets based on deciles (DTI) and the Gini coefficient. We concluded that among the first four techniques evaluated, the fourth (use of market information) had the best performance. For the strategy to accept rejected bidders, it was observed that there is a gain in relation to the model that uses only information of accepted applicants.
|
195 |
A systematic evaluation of object detection and recognition approaches with context capabilitiesUnknown Date (has links)
Contemporary computer vision solutions to the problem of object detection aim at incorporating contextual information into the process. This thesis proposes a systematic evaluation of the usefulness of incorporating knowledge about the geometric context of a scene into a baseline object detection algorithm based on local features. This research extends publicly available MATLABRª implementations of leading algorithms in the field and integrates them in a coherent and extensible way. Experiments are presented to compare the performance and accuracy between baseline and context-based detectors, using images from the recently published SUN09 dataset. Experimental results demonstrate that adding contextual information about the geometry of the scene improves the detector performance over the baseline case in 50% of the tested cases. / by Rafael J. Giusti Urbina. / Thesis (M.S.C.S.)--Florida Atlantic University, 2011. / Includes bibliography. / Electronic reproduction. Boca Raton, Fla., 2011. Mode of access: World Wide Web.
|
196 |
Análise discriminante com mistura de variáveis categóricas e contínuas / Discriminant Analysis with Mixed Categorical and Continuous DataSanda, Rene 22 June 1990 (has links)
O objetivo do trabalho é apresentar os métodos mais consagrados de Análise Discriminante quando temos uma mistura de variáveis categóricas e contínuas. / The purpose of this dissertation is to analyze and compare Discriminant Analysis techniques in the presence of mixed categorical and continuous data.
|
197 |
Variáveis relevantes para as empresas de alto crescimento no Brasil / Relevant variables for high growth firms in BrazilBara, Carlos Roberto Francisco 26 April 2018 (has links)
Empreendedorismo tem sido objeto de incentivo no mundo e no Brasil, dada a sua significante contribuição para o desenvolvimento econômico e social de uma nação. Observa-se que a maioria das empresas, existentes ou novas, evolui de forma lenta e gradual; no entanto, reduzida parcela apresenta um padrão diferente, com crescimento elevado em faturamento ou número de colaboradores: são as empresas de alto crescimento (EACs). Tais empresas são as responsáveis por grande parte da geração de empregos (Birch, 1981; Coad, Daunfeldt, Holzl, Johansson, & Nightingale, 2014; Henrekson & Johansson, 2010; OECD, 2010). A presente tese procurou identificar as variáveis que ajudam a explicar o desempenho das EACs no Brasil, classificadas conforme critério da OECD (2007). Foi conduzida uma pesquisa com 470 empresas brasileiras, que coletou mais de 30 variáveis preditoras categóricas ou métricas, utilizadas no modelo Regressão Logística. Foram identificadas algumas variáveis alinhadas com a literatura e outras menos intuitivas e documentadas. Comprovou-se o aumento da probabilidade de EACs quando se relacionavam com aceleradoras, recebiam premiações ou eram spin-offs de outras empresas. Em função das altas taxas de juros bancários e da cultura empreendedora no Brasil, surpreendeu o impacto positivo de empréstimos bancários e a percepção dos empreendedores sobre registrar marcas comerciais, bem como o impacto negativo da percepção sobre propaganda em mídia digital e doações de instituições de fomento, relacionadas às EACs. Análises adicionais com o subgrupo de EACs caracterizadas como gazelas foram feitas. Embora apresente limitações de surveys e outras, a tese confirmou parte dos resultados da literatura sobre empreendedorismo e identificou avenidas para futuras pesquisas. / Entrepreneurship has been object of encouragement in the world and in Brazil, given its significant contribution to the economic and social development of a nation. It is observed that the majority of companies, existing or new, are developing slowly and gradually; however, small share presents a different pattern, with high growth in sales or number of employees: they are the high growth firms (HGFs). These firms are responsible for a large part of job creation (Birch, 1981; Coad, Daunfeldt, Holzl, Johansson, & Nightingale, 2014, Henrekson & Johansson, 2010, OECD, 2010). This thesis aimed to identify the variables that help to explain the performance of HGFs in Brazil, according to OECD (2007) criterion. A survey with 470 Brazilian companies was conducted, collecting more than 30 categorical or metric predictor variables, used in the Logistic Regression model. Some identified variables were aligned to literature, but others less intuitive or documented. It was confirmed the increase in the probability of HGFs when they related to accelerators, received awards, or were spin-offs of other companies. As a consequence of the high banking interest rates and the entrepreneurship culture in Brazil, surprised the positive impact of bank loans and the entrepreneurs\' perception of trademark registration, as well as the negative impact of perception on advertising in digital media and donations from development institutions, related to HGFs. Additional analyzes with the subgroup of HGFs characterized as gazelles were made. Although it presents limitations of surveys and others, the thesis confirmed part of the results of the literature on entrepreneurship and identified avenues for future researches.
|
198 |
Análise desagregada de dados de demanda por transportes através de modelagem geoestatística e tradicional / Disaggregated data analysis on transportation demand through traditional and geostatistical modelingLindner, Anabele 23 February 2015 (has links)
O conhecimento do padrão de deslocamento populacional bem como a estimativa de demanda por transportes são de fundamental importância para a tomada de decisões relativas ao planejamento urbano e de transportes. Em geral, a obtenção destas informações é realizada por modelos tradicionais como o modelo quatro etapas. Entretanto, modelos clássicos não levam em conta a dependência espacial das variáveis . A Geoestatística, valendo-se da utilização de variáveis regionalizadas, apresenta-se como uma ferramenta auxiliar capaz de modelar informações espaciais. Este trabalho tem por objetivo estimar dados desagregados de demanda por transportes através de modelagem geoestatística e tradicional. Neste estudo, a modelagem tradicional e a geoestatística puderam ser comparadas por meio de um banco de dados referente à pesquisa Origem/Destino da Região Metropolitana de São Paulo, realizada em 2007. A abordagem tradicional se baseou em um modelo de regressão enquanto que a abordagem geoestatística consistiu na estimação espacial de variáveis com base na modelagem de semivariogramas e Krigagem. Ao final do trabalho, foi possível realizar a comparação dos resultados da abordagem tradicional e geoestatística em coordenadas de valores conhecidos. Os resultados indicaram que a modelagem tradicional apontou uma taxa de acertos de 96 % pelo modelo de Regressão Logística Múltipla adotada para a variável dicotômica de preferência por modo motorizado (variável objeto de estudo). A abordagem tradicional baseou-se na calibração de um modelo por meio de outras oito variáveis. Entretanto, a modelagem geoestatística, utilizando -se apenas das coordenadas geográficas domiciliares, resultou em 67% de taxa de acertos de previsão da variável. Isso demonstrou que, apesar de possuir menor taxa de acertos, a modelagem geoestatística, por utilizar menor número de informações para previsão da variável, teve um resultado satisfatório e demonstra-se promissora na área de planejamento de transportes , sobretudo considerando sua habilidade de estimação em outras coordenadas geográficas além das amostradas. / The comprehension of population displacement patterns and travel demand forecasting is crucial on making decisions related to urban transportation planning. In order to obtain this information, classic models like the sequential Four -step mo del are applied. However, classic models do not consider spatial location in their approach. Geostatistics is displayed as a suitable complementary instrument able to model spatial information. This work intends to forecast disaggregated data on transportation demand through traditional and geostatistical modeling. The present study compares the results from classic approach and Geostatistics through an Origin-Destination Survey dataset, carried out in São Paulo Metropolitan Area in 2007. The classic approach was based on regression models whereas Geostatistics consisted in variable spatial estimation by semivariograms modeling and Kriging. At the end of the study, a comparison between regression and geostatistical analysis was conducted through results of prediction in locations where the values of the variable are known. Results indicated that classic modeling had a 96% hit rate by Multiple Logistic Regression adopted for the dummy variable preference for motorized travel mode (object of study variable). Classic modeling was based on a training model using other eight predictor variables. Meanwhile, Geostatistics, using only residential geographical coordinate, resulted in a 67% hit rate for predicting the variable object of study. This demonstrates that, even though Geostatiscs had lower hit rate compared to Multiple Logistic Regression, it had satisfactory outcome and proves tobe a promising approach in transport planning, given that it considered less informati on to predict the variable, especially considering its ability of estimating in other geographical coordinates in addition to those sampled.
|
199 |
Análise de influência local no modelo de regressão logística / Analysis of local influence with the logistic regression modelSouza, Édila Cristina de 09 February 2006 (has links)
Uma etapa importante após a formulação e ajuste de um modelo de regressão é a análise de diagnóstico. A regressão logística tem se constituído num dos principais métodos de modelagem estatística de dados; mesmo quando a resposta de interesse não é originalmente do tipo binário, alguns pesquisadores tem dicotomizado a resposta de modo que a probabilidade de sucesso pode ser modelado através da regressão logística. Neste trabalho consideramos um estudo de diagnóstico no modelo da regressão logística, utilizando as medidas proposta por Pregibon (1981) e a técnica de influência local Cook (1986). Investigamos a aplicação da técnica de influência local sob diferentes esquemas de perturbação. Como ilustração, apresentamos a aplicação dos resultados desenvolvidos em dois conjuntos de dados reais. / An important stage after the formularization and adjustment of a regression model is the diagnosis analysis. Logistic regression is one of the main methods for modeling data and even when the response of interest is is not originally of the binary type, some researchers have dichotomized the response in a way that the success probability can be modeled through logistic regression. In this work we consider a study of diagnosis methods with logistic regression, using the measures proposed by Pregibon (1981) and the local influence technique of Cook (1986). We investigate the application of the local influence technique of under different types of disturbance. As as illustration, we show the application of the developed results obtained with real data sets.
|
200 |
Análise desagregada de dados de demanda por transportes através de modelagem geoestatística e tradicional / Disaggregated data analysis on transportation demand through traditional and geostatistical modelingAnabele Lindner 23 February 2015 (has links)
O conhecimento do padrão de deslocamento populacional bem como a estimativa de demanda por transportes são de fundamental importância para a tomada de decisões relativas ao planejamento urbano e de transportes. Em geral, a obtenção destas informações é realizada por modelos tradicionais como o modelo quatro etapas. Entretanto, modelos clássicos não levam em conta a dependência espacial das variáveis . A Geoestatística, valendo-se da utilização de variáveis regionalizadas, apresenta-se como uma ferramenta auxiliar capaz de modelar informações espaciais. Este trabalho tem por objetivo estimar dados desagregados de demanda por transportes através de modelagem geoestatística e tradicional. Neste estudo, a modelagem tradicional e a geoestatística puderam ser comparadas por meio de um banco de dados referente à pesquisa Origem/Destino da Região Metropolitana de São Paulo, realizada em 2007. A abordagem tradicional se baseou em um modelo de regressão enquanto que a abordagem geoestatística consistiu na estimação espacial de variáveis com base na modelagem de semivariogramas e Krigagem. Ao final do trabalho, foi possível realizar a comparação dos resultados da abordagem tradicional e geoestatística em coordenadas de valores conhecidos. Os resultados indicaram que a modelagem tradicional apontou uma taxa de acertos de 96 % pelo modelo de Regressão Logística Múltipla adotada para a variável dicotômica de preferência por modo motorizado (variável objeto de estudo). A abordagem tradicional baseou-se na calibração de um modelo por meio de outras oito variáveis. Entretanto, a modelagem geoestatística, utilizando -se apenas das coordenadas geográficas domiciliares, resultou em 67% de taxa de acertos de previsão da variável. Isso demonstrou que, apesar de possuir menor taxa de acertos, a modelagem geoestatística, por utilizar menor número de informações para previsão da variável, teve um resultado satisfatório e demonstra-se promissora na área de planejamento de transportes , sobretudo considerando sua habilidade de estimação em outras coordenadas geográficas além das amostradas. / The comprehension of population displacement patterns and travel demand forecasting is crucial on making decisions related to urban transportation planning. In order to obtain this information, classic models like the sequential Four -step mo del are applied. However, classic models do not consider spatial location in their approach. Geostatistics is displayed as a suitable complementary instrument able to model spatial information. This work intends to forecast disaggregated data on transportation demand through traditional and geostatistical modeling. The present study compares the results from classic approach and Geostatistics through an Origin-Destination Survey dataset, carried out in São Paulo Metropolitan Area in 2007. The classic approach was based on regression models whereas Geostatistics consisted in variable spatial estimation by semivariograms modeling and Kriging. At the end of the study, a comparison between regression and geostatistical analysis was conducted through results of prediction in locations where the values of the variable are known. Results indicated that classic modeling had a 96% hit rate by Multiple Logistic Regression adopted for the dummy variable preference for motorized travel mode (object of study variable). Classic modeling was based on a training model using other eight predictor variables. Meanwhile, Geostatistics, using only residential geographical coordinate, resulted in a 67% hit rate for predicting the variable object of study. This demonstrates that, even though Geostatiscs had lower hit rate compared to Multiple Logistic Regression, it had satisfactory outcome and proves tobe a promising approach in transport planning, given that it considered less informati on to predict the variable, especially considering its ability of estimating in other geographical coordinates in addition to those sampled.
|
Page generated in 0.1084 seconds