101 |
Les déterminants d'une "bonne gouvernance" et la performance des entreprises Françaises : etudes empiriques. / The determinants of « good governance » and performance of French companies : empirical StudiesLouizi, Amir 13 April 2011 (has links)
Au cours de ces dernières années, la notion de la gouvernance d’entreprise fait l’objet d’un regain d’intérêt en raison de la faillite spectaculaire et des pertes importantes de quelques grandes entreprises (Enron, Worldcom…). Ainsi, le thème de la gouvernance des entreprises a pris, une préoccupation cruciale des chefs d’entreprise ainsi que par les investisseurs institutionnels. En effet, l’intérêt pour les bonnes pratiques de gouvernance d’entreprise a pris une importance de premier rang. Suite à cette attention accordée par les investisseurs aux pratiques de gouvernance, la notation de la gouvernance d’entreprise est devenue une pratique de plus en plus courante soit à travers des services de notation spécialisés ou avec l’intégration du système de gouvernance d’entreprise dans la notation financière. Notre objectif est d’identifier, à partir d’un échantillon de 132 entreprises françaises cotées sur la période 2002-2008, une structure de gouvernance appréhender par le fonctionnement du conseil d’administration, la structure de propriété et les caractéristiques du dirigeant. Plus précisément, notre travail consiste à calculer un score de gouvernance d’entreprise, comportant plusieurs variables, selon la méthode d’enveloppement des données (DEA). Les résultats obtenus montrent que les firmes françaises interrogées possèdent un indice d’efficience de gouvernance de 68 %. Ainsi, nous avons pu identifier des rapports entre le score de gouvernance et les autres caractéristiques des firmes. Ensuite, nous avons pu déterminer les pratiques qui permettent d’améliorer la qualité de la gouvernance, tout en se basant sur la performance de la firme. Enfin, nous avons pu établir, à partir d’un système d’équations simultanées, un lien de causalité entre la gouvernance et la performance de la firme. / Corporate governance has been the subject of a renewed interest for a few years because of the spectacular bankruptcy and of the significant losses of some large companies (Enron, WorldCom, Vivendi…). Thus, the theme of corporate governance has taken a key concern of business leaders and institutional investors. Indeed, interest in good corporate governance practices has gained importance in the forefront. Following the attention given by investors in corporate governance practices, the rating of corporate governance has become a practice increasingly common either through specialized rating services or system integration of corporate governance in credit ratings. Our goal is to identify, from a sample of 132 French listed companies over the period 2002-2008, a governance structure for understanding the functioning of the board of directors, ownership structure and characteristics of the leader. Specifically, our work is to calculate a score of corporate governance, with multiple variables, using the method of data envelopment analysis (DEA). The results show that French firms surveyed have a governance efficiency index of 68 %. Thus, we were able to identify links between the governance score and the characteristics of firms. Finally, we have established, from a system of simultaneous equations, a causal link between governance and firm performance.
|
102 |
Beneish m-score : att identifiera manipulation i svenska bolag / Beneish m-score : identification of manipulation in Swedish companiesEskilstorp, Sofia, Olsson, Sofi, Nilsson, Johanna January 2019 (has links)
Studien som presenteras är en kvantitativ studie utförd på Högskolan i Borås. Syftet medstudien är att fastställa om Beneish m-score kan användas för att identifiera manipulation i svenska aktiebolag. I princip alla bolag använder sig av någon form av earnings management. Svårigheten ligger i att identifiera när ett bolag går från att utnyttja den flexibilitet som finns i lagarna till att röra sig utanför lagens gränser. Bolagen pressas hårt internt men framför alltexternt och förväntningarna att prestera är ofta höga. I studien presenteras och diskuteras de olika incitament som kan påverka att ett bolag väljer att manipulera sin redovisning. Ettresultat av manipulationen är att det skapas en informationsasymmetri, där utställaren av de finansiella rapporterna inte delger hela verkligheten varken till sina externa intressenter eller internt. Beslut baseras då på felaktiga grunder eftersom bolagets verkliga situation inte speglas. Beneish m-score är baserad på åtta olika variabler som fångar företeelser vilka anses drivabolag till att överträda redovisningsstandarder. Modellens syfte är att exponera det som tidigare legat dolt i bolagets informationsflöde. Med hjälp av modellen skall publicerad redovisningsdata kunna användas för att upptäcka manipulation och minskainformationsasymmetrin redan innan bolagen offentligt blivit anklagade för att manipulera sin redovisning. För att möjliggöra studiens syfte har 20 svenska aktiebolag valts ut. Urvalet är uppdelat i tvåurvalsgrupper, en grupp som speglar god redovisningssed samt en grupp där bolagen på olika sätt har manipulerat sin redovisning. Modellen har därefter testats på samtliga bolagsredovisning för att avgöra hur stort felutfall modellen har på svenska aktiebolag. Det framgår också i studien hur vissa antaganden har gjorts för att modellen skall fungera på ett praktiskt sätt på samtliga svenska aktiebolag. Studien bidrar därmed till att göra Beneish m-scoremodellen brukbar som ett möjligt analysverktyg på svenska aktiebolag. Resultatet som presenteras visar på att all manipulation inte upptäcks bland annat på grund av att Beneish m-score är uppbyggt på ett begränsat sätt. Modellen är baserad på variabler som skall indikera på manipulation genom förhöjda intäkter och resultat. De bolag som istället minskar intäkter och resultat kommer inte att upptäckas som manipulatörer. Slutsatsen påpekar därför på att modellen är för begränsad för att rättvist kunna upptäcka alla de komplexa situationer där manipulation kanske. / The study presented is a quantitative study issued at the University of Borås, written in Swedish. The purpose of the study is to determine whether Beneish m-score can be used to identify manipulation in Swedish limited companies. Almost all companies use some kind of earnings management. It is troublesome to identify when a company goes from utilizing the flexibility that exists in laws to move outside the laws. There are a lot of pressure on companies and the performance expectations are often high, both from internal and external parties. This study presents and discusses the various incentives that may influence a company to manipulate its accounting. As a result of the manipulation, an asymmetry of information is created. Where the issuer of the financial reports does not share the whole picture with its stakeholders. Decisions are based on incorrect information both internal and external since the company's actual situation is not reflected. Beneish m-score is based on eight different variables that captures phenomena that are assume to drive companies to violate accounting standards. The purpose of the model is to detect information that previously have been hidden in the company's information flow. With help from the model, published accounting data can be used to discover manipulation and reduce asymmetry of information even before the companies have been publicly accused for manipulation of their accounting. To enable the study's purpose, 20 Swedish limited companies have been chosen. The sample is divided in two groups, one group that reflect good accounting practice and one group with companies that have manipulated their financial accounts. The model has then been tested on all companies to determine the margin of error on Swedish companies. It is also presented in the study that certain assumptions have been made to make the model work on all Swedish limited companies. The study therefore contribute to make Beneish m-score useable as a possible analysis tool on all Swedish limited companies. The presented result describe that not all manipulation is detected partly because Beneish m-score is structured in a limited way. The model is based on variables that should detect manipulation through increased revenue and result. Companies that instead reduce revenue and result will not be detected as manipulators. The conclusion point out that Beneish model has limited ability to sufficiently detect all manipulation due to the complexity of the circumstances.
|
103 |
Agricultura familiar e os impactos da restrição ao crédito rural: uma análise para diferentes níveis de mercantilização / Family farming and the impact of rural credit restriction: an analysis for different levels of tradeGarcias, Marcos de Oliveira 22 May 2014 (has links)
O objetivo geral desta pesquisa foi avaliar o impacto da restrição ao crédito rural sobre a produtividade da terra e a produtividade do trabalho para os agricultores familiares do Brasil. Para estimar esse impacto, foram utilizados os dados do Censo Agropecuário de 2006 por município. Para diferenciar os diferentes agricultores familiares, foi utilizado o índice de mercantilização, separando a população em quartis. As estimativas do impacto da restrição ao crédito sobre a produtividade da terra e a produtividade do trabalho foram calculadas a partir da comparação entre o grupo que recebeu crédito e o que não recebeu crédito, obtido através do escore de propensão (propensity score matching). As estimativas do efeito médio de tratamento sobre os tratados, quando apresentaram resultados estatisticamente significativos, evidenciaram os diferentes grupos formados dentro da agricultura familiar. Por exemplo, na região Centro-oeste municípios com crédito tiveram maior produtividade da terra e do trabalho quando pertencentes ao quarto quartil. Os resultados obtidos no modelo estimado mostram que os efeitos da restrição ao crédito rural são diferentes para municípios mais ou menos mercantilizados e, portanto, requerem políticas distintas. / The overall objective of this research is to evaluate the impact of the restriction of rural credit on land and labor productivity for family farmers in Brazil. In order to estimate this impact, we have used data from Brazil\'s 2006 Agricultural Census at the municipal level. To differentiate among family farmers, a trade index was used, separating the population into quartiles. Estimates of the impact of credit restriction on the productivity of land and the productivity of labor were calculated through propensity score matching. Estimates of the average treatment effect on the treated, when presenting statistically significant results, highlight the differences among groups formed within the family farm. For example, in the Midwest of Brazil, municipalities with credit and belonging to the fourth quartile presented higher land and labor productivity. The results of the estimated model confirm that the effects of rural credit restriction are different for municipalities with smaller or larger trade indices, requiring therefore specific policies for each group.
|
104 |
Impactos da atividade inovativa: um estudo para a indústria paulista / Impacts of innovation activity: a study for the paulista industryFaria, Gustavo Assunção 28 February 2008 (has links)
A presente dissertação visa avaliar, a partir do uso dos dados da Pesquisa de Atividade Econômica Paulista - PAEP - do ano de 1996, da RAIS - Relação Anual de Informações Sociais de 1992, 1993, 1997 e 1998 e da SECEX - Secretaria do Comércio Exterior - dos anos de 1992 e 1993, a relação entre a atividade de inovação tecnológica e os potenciais impactos produzidos sobre o nível de emprego e sobre o nível de renda na indústria paulista entre os anos de 1997 e 1998. Como a inovação não é um evento aleatório, há o viés de seleção da amostra, de tal sorte que uma comparação direta entre os efeitos da inovação sobre certas variáveis daquelas firmas que inovaram com aquelas que não inovaram, na situação de ter havido inovação, produziria vieses. Tal problema é resolvido neste trabalho por meio do Propensity Score Matching, que visa o pareamento de unidades tratamento - controle para a obtenção dos resultados intentados, a saber, a variação na renda e no nível de emprego. Ademais, de modo a inibir a presença de efeitos não observáveis, recorre-se ao método de Diferenças em Diferenças (DID). Os resultados obtidos atestam para um aumento, na média, do nível de emprego para quase todos os tipos de atividade inovativa empreendidas. Em contrapartida, os achados se revelaram estatisticamente insignificantes para a variação de renda, também em quase todos os tipos de inovação. / This work intends to analyze, by the usage of three different data sources, PAEP (1996), RAIS - Relação Anual de Informações Sociais (1992, 1993, 1997, and 1998) and SECEX - Secretaria do Comércio Exterior (from 1992, and 1993) the relationship, if that exists, between innovation and its potential impacts over employment level as well as salaries during the 1997 - 1998 period. Once innovation activity cannot be considered as a random event, we incur in the well known selection bias problem. Consequently, a direct comparison of the innovation impacts between those firms which effectively innovated with those which did not innovate would be misleading. Such a problem may be corrected with the Propensity Score Matching, which consists in the establishment of treatment - control pairs in order to obtain the results previously searched. Moreover, in an attempt to control for the unobserved effects, it is applied the Differences in Differences Methodology (DID). Results obtained show that, on the one hand, for almost all the innovation activities considered, there was an increment in the level of employment. On the other hand, for most of the cases, there were not statistically significant results for an impact of innovation activities on the level of salaries.
|
105 |
Emigração no Paraguai: efeitos das remessas / Emigration in Paraguay: effects of remittancesSanchez, Blanca Nidia Aquino 02 March 2011 (has links)
Neste trabalho analisou-se o impacto das remessas financeiras sobre os patrimônios dos ativos nos domicílios, no país de origem. Utilizamos dados da Encuesta Permanente de Hogares de 2008, os quais foram fornecidos pelo órgão Dirección General de Estadística, Encuestas y Censos do Paraguai. Com estes dados realizamos uma comparação entre os domicílios com e sem remessas, independente de terem ou não emigrantes. A metodologia utilizada para realizar a comparação foi o Propensity Score Matching (PSM) com dois algoritmos, Vizinhos Próximos e Kernel. Os patrimônios dos ativos são carros, aluguéis e combinados. Os resultados em todos os casos foram estatisticamente significativos, porém, negativos. Com amesma metodologia e os mesmos dados, comparamos apenas os domicílios com emigrantes, e os resultados continuaram negativos, porém, com nível de significância menor. / In this study we analyzed the impact of remittances on financial assets in the wealth of households in the country of origin. We use data from the Encuesta Permanente Hogares 2008, which were provided by the agency Dirección General de Estadística, Encuestas y Censos of Paraguay. With these data we performed a comparison between households with and without remittances, regardless of whether or not immigrants. The methodology for conducting the comparison was the Propensity Score Matching (PSM) with two algorithms, Kernel and Nearest Neighbors. The stockholders\' assets are cars, rentals and combined. The results in all cases were statistically significant, but negative. With the same methodology and same data, comparing only households with migrants, the results remained negative, but with lower significance level.
|
106 |
Estratégias para o desenvolvimento de modelos de credit score com inferência de rejeitados. / Strategies for the development of credit score with the inference rejectedAlves, Mauro Correia 03 September 2008 (has links)
Modelos de credit score são usualmente desenvolvidos somente com informações dos proponentes aceitos. Neste trabalho foram consideradas estratégias que podem ser utilizadas para o desenvolvimento de modelos de credit score com a inclusão das informações dos rejeitados. Foram avaliadas as seguintes técnicas de inferência de rejeitados: classificação dos rejeitados como clientes Maus, parcelamento, dados aumentados, uso de informações de mercado e ainda a estratégia de aceitar proponentes rejeitados para acompanhamento e desenvolvimento de novos modelos de risco de crédito. Para a avaliação e comparação dos modelos foram utilizadas as medidas de desempenho: estatística de Kolmogorov-Smirnov (KS), área sob a curva de Lorentz (ROC), área entre as curvas de distribuição acumulada dos escores (AEC), diferença entre as taxas de inadimplência nos intervalos do escore definidos pelos decis e coeficiente de Gini. Concluiu-se que dentre as quatro primeiras técnicas avaliadas, o uso de informaçõoes de mercado foi a que apresentou melhor desempenho. Quanto à estratégia de aceitar proponentes rejeitados, observou-se que há um ganho em relação ao modelo ajustado só com base nos proponentes aceitos. / Credit scoring models are usually built using only information of accepted applicants. This text considered strategies that can be used to develop credit score models with inclusion of the information of the rejects. We evaluated the techniques of reject inference: classification of rejected customers as bad, parceling, augmentation, use of market information and the strategy of accepting rejected proponents for monitoring and developing new models of credit risk. For the evaluation and comparison between models were used performance measures: Kolmogorov-Smirnov statistics (KS), the area under the Lorentz Curve (ROC), area between cumulative distribution curves of the scores (AEC), difference among the delinquency rate in the score buckets based on deciles (DTI) and the Gini coefficient. We concluded that among the first four techniques evaluated, the fourth (use of market information) had the best performance. For the strategy to accept rejected bidders, it was observed that there is a gain in relation to the model that uses only information of accepted applicants.
|
107 |
Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos / Strategies for treatment of variables with missing data during the development of predictive modelsAssunção, Fernando 09 May 2012 (has links)
Modelos preditivos têm sido cada vez mais utilizados pelo mercado a fim de auxiliarem as empresas na mitigação de riscos, expansão de carteiras, retenção de clientes, prevenção a fraudes, entre outros objetivos. Entretanto, durante o desenvolvimento destes modelos é comum existirem, dentre as variáveis preditivas, algumas que possuem dados não preenchidos (missings), sendo necessário assim adotar algum procedimento para tratamento destas variáveis. Dado este cenário, este estudo tem o objetivo de discutir metodologias de tratamento de dados faltantes em modelos preditivos, incentivando o uso de algumas delas já conhecidas pelo meio acadêmico, só que não utilizadas pelo mercado. Para isso, este trabalho descreve sete metodologias. Todas elas foram submetidas a uma aplicação empírica utilizando uma base de dados referente ao desenvolvimento de um modelo de Credit Score. Sobre esta base foram desenvolvidos sete modelos (um para cada metodologia descrita) e seus resultados foram avaliados e comparados através de índices de desempenho amplamente utilizados pelo mercado (KS, Gini, ROC e Curva de Aprovação). Nesta aplicação, as técnicas que apresentaram melhor desempenho foram a que tratam os dados faltantes como uma categoria à parte (técnica já utilizada pelo mercado) e a metodologia que consiste em agrupar os dados faltantes na categoria conceitualmente mais semelhante. Já a que apresentou o pior desempenho foi a metodologia que simplesmente não utiliza a variável com dados faltantes, outro procedimento comumente visto no mercado. / Predictive models have been increasingly used by the market in order to assist companies in risk mitigation, portfolio growth, customer retention, fraud prevention, among others. During the model development, however, it is usual to have, among the predictive variables, some who have data not filled in (missing values), thus it is necessary to adopt a procedure to treat these variables. Given this scenario, the aim of this study is to discuss frameworks to deal with missing data in predictive models, encouraging the use of some already known by academia that are still not used by the market. This paper describes seven methods, which were submitted to an empirical application using a Credit Score data set. Each framework described resulted in a predictive model developed and the results were evaluated and compared through a series of widely used performance metrics (KS, Gini, ROC curve, Approval curve). In this application, the frameworks that presented better performance were the ones that treated missing data as a separate category (technique already used by the market) and the framework which consists of grouping the missing data in the category most similar conceptually. The worst performance framework otherwise was the one that simply ignored the variable containing missing values, another procedure commonly used by the market.
|
108 |
Utilisation et développement d'outils statistiques pour la prédiction individuelle du statut ganglionnaire dans le cancer de l'endomètre / Development and use of a score for predicting lymph node metastasis in endometrial cancerKoskas, Martin 26 September 2014 (has links)
Le cancer de l’endomètre est le plus fréquent des cancers gynécologiques pelviens. L’envahissement ganglionnaire constitue l’un des principaux facteurs pronostiques mais le rôle des curages ganglionnaires reste débattu.Nous avons construit le score PREGE (Prédiction du Risque d’Envahissement Ganglionnaire dans le cancer de l’Endomètre), à partir d’une base de données de près de 20000 cancers de l’endomètre, après la sélection de caractéristiques individuelles (race et âge) et tumorales définitives, obtenues sur la pièce d’hystérectomie (type, grade et extension locale) significativement associées à l’existence de métastase ganglionnaire. Le score PREGE a été validé sur une base de données multicentrique française (AUC dans les populations de développement et de validation de 0,80 et 0,79 respectivement). Le score était correctement calibré.En utilisant les données préopératoires (IRM et biopsie d’endomètre), les capacités de discrimination du score PREGE étaient conservées. Différents seuils d’intérêt pour la décision clinique ont été définis. Avec un seuil de 100 points, la valeur prédictive négative était de 100%.Dans aucun quantile du score PREGE, la survie spécifique n’était supérieure chez les patientes ayant eu une lymphadénectomie. Toutefois, avec un seuil prédit d’envahissement ganglionnaire supérieur à 20%, nous avons mis en évidence un bénéfice de la lymphadénectomie emportant au moins 10 ganglions.L’utilisation du score PREGE pour la sélection des patientes atteintes d’un cancer de l’endomètre candidates à une lymphadénectomie pourrait permettre de réduire le recours à cette intervention morbide sans altérer la survie spécifique / Endometrial cancer is the most common malignancy of the female genital tract. Lymph node metastasis is one of the most important prognostic factors. However, the therapeutic role of lymphadenectomy is still debated.We developed the score PREGE, able to predict lymph node metastasis based on pathological hysterectomy characteristics in endometrial cancer. Data from almost 20,000 patients who underwent hysterectomy and lymphadenectomy were analyzed and significant prognostic features were selected: final pathological characteristics (histologic type, grade and primary site tumoral extension) and patients’ characteristics (age and race). In a French multicentric cohort, the nomogram showed good discrimination (AUC=0.79 ) and was well calibrated.Lymph node metastasis prediction by the score using preoperative data was as accurate as that obtained using the final tumor characteristics. With a cut-off value of 100 points for the total score, the negative predictive value was 100%.Patients were clustered into quintiles according to their lymph node metastasis probability. The cancer related survival was compared based on whether patients underwent lymphadenectomy. In the five quintile groups, the specific survival rate was significantly higher in the patients who did not undergo lymphadenectomy. However, when lymph node letastatic probabilityexceeded 20%, specific survival was higher in patients in whom at least 10 lymph nodes were removed.PREGE score could be useful to select few patients who will really benefit from lymphadenectomy and avoid lymphadenectomy in most patients with endometrial cancer
|
109 |
Estratégias para o desenvolvimento de modelos de credit score com inferência de rejeitados. / Strategies for the development of credit score with the inference rejectedMauro Correia Alves 03 September 2008 (has links)
Modelos de credit score são usualmente desenvolvidos somente com informações dos proponentes aceitos. Neste trabalho foram consideradas estratégias que podem ser utilizadas para o desenvolvimento de modelos de credit score com a inclusão das informações dos rejeitados. Foram avaliadas as seguintes técnicas de inferência de rejeitados: classificação dos rejeitados como clientes Maus, parcelamento, dados aumentados, uso de informações de mercado e ainda a estratégia de aceitar proponentes rejeitados para acompanhamento e desenvolvimento de novos modelos de risco de crédito. Para a avaliação e comparação dos modelos foram utilizadas as medidas de desempenho: estatística de Kolmogorov-Smirnov (KS), área sob a curva de Lorentz (ROC), área entre as curvas de distribuição acumulada dos escores (AEC), diferença entre as taxas de inadimplência nos intervalos do escore definidos pelos decis e coeficiente de Gini. Concluiu-se que dentre as quatro primeiras técnicas avaliadas, o uso de informaçõoes de mercado foi a que apresentou melhor desempenho. Quanto à estratégia de aceitar proponentes rejeitados, observou-se que há um ganho em relação ao modelo ajustado só com base nos proponentes aceitos. / Credit scoring models are usually built using only information of accepted applicants. This text considered strategies that can be used to develop credit score models with inclusion of the information of the rejects. We evaluated the techniques of reject inference: classification of rejected customers as bad, parceling, augmentation, use of market information and the strategy of accepting rejected proponents for monitoring and developing new models of credit risk. For the evaluation and comparison between models were used performance measures: Kolmogorov-Smirnov statistics (KS), the area under the Lorentz Curve (ROC), area between cumulative distribution curves of the scores (AEC), difference among the delinquency rate in the score buckets based on deciles (DTI) and the Gini coefficient. We concluded that among the first four techniques evaluated, the fourth (use of market information) had the best performance. For the strategy to accept rejected bidders, it was observed that there is a gain in relation to the model that uses only information of accepted applicants.
|
110 |
Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos / Strategies for treatment of variables with missing data during the development of predictive modelsFernando Assunção 09 May 2012 (has links)
Modelos preditivos têm sido cada vez mais utilizados pelo mercado a fim de auxiliarem as empresas na mitigação de riscos, expansão de carteiras, retenção de clientes, prevenção a fraudes, entre outros objetivos. Entretanto, durante o desenvolvimento destes modelos é comum existirem, dentre as variáveis preditivas, algumas que possuem dados não preenchidos (missings), sendo necessário assim adotar algum procedimento para tratamento destas variáveis. Dado este cenário, este estudo tem o objetivo de discutir metodologias de tratamento de dados faltantes em modelos preditivos, incentivando o uso de algumas delas já conhecidas pelo meio acadêmico, só que não utilizadas pelo mercado. Para isso, este trabalho descreve sete metodologias. Todas elas foram submetidas a uma aplicação empírica utilizando uma base de dados referente ao desenvolvimento de um modelo de Credit Score. Sobre esta base foram desenvolvidos sete modelos (um para cada metodologia descrita) e seus resultados foram avaliados e comparados através de índices de desempenho amplamente utilizados pelo mercado (KS, Gini, ROC e Curva de Aprovação). Nesta aplicação, as técnicas que apresentaram melhor desempenho foram a que tratam os dados faltantes como uma categoria à parte (técnica já utilizada pelo mercado) e a metodologia que consiste em agrupar os dados faltantes na categoria conceitualmente mais semelhante. Já a que apresentou o pior desempenho foi a metodologia que simplesmente não utiliza a variável com dados faltantes, outro procedimento comumente visto no mercado. / Predictive models have been increasingly used by the market in order to assist companies in risk mitigation, portfolio growth, customer retention, fraud prevention, among others. During the model development, however, it is usual to have, among the predictive variables, some who have data not filled in (missing values), thus it is necessary to adopt a procedure to treat these variables. Given this scenario, the aim of this study is to discuss frameworks to deal with missing data in predictive models, encouraging the use of some already known by academia that are still not used by the market. This paper describes seven methods, which were submitted to an empirical application using a Credit Score data set. Each framework described resulted in a predictive model developed and the results were evaluated and compared through a series of widely used performance metrics (KS, Gini, ROC curve, Approval curve). In this application, the frameworks that presented better performance were the ones that treated missing data as a separate category (technique already used by the market) and the framework which consists of grouping the missing data in the category most similar conceptually. The worst performance framework otherwise was the one that simply ignored the variable containing missing values, another procedure commonly used by the market.
|
Page generated in 0.0333 seconds