361 |
Brexit: The predictors of a district majority voteMaconi, Stephen January 2019 (has links)
In June 2016, the United Kingdom held its EU referendum, colloquially known as Brexit, in which the people of the island nation voted on whether their country should remain a member of or leave the European Union. This thesis investigates what economic variables may have lain behind the majority outcome of a given voting area (or district) and to what degree they may have impacted it. A logistic regression is conducted primarily on referendum and election data from the Electoral Commission, census data from the Office for National Statistics, and political leaning scores as quantified by the Manifesto Project. The resulting model, which exhibits a hit ratio of 92 percent correct predictions, shows that age, education, national identity, political leaning, irreligion, and unemployment have significant correlations with the majority Brexit outcome of a district. On the other hand, population, health, and income variables do not have statistically significant effects; however, poor health, on average, does seem to have a large positive effect on the odds when taking relative sample size into account.
|
362 |
Predicting the Unobserved : A statistical analysis of missing data techniques for binary classificationSäfström, Stella January 2019 (has links)
The aim of the thesis is to investigate how the classification performance of random forest and logistic regression differ, given an imbalanced data set with MCAR missing data. The performance is measured in terms of accuracy and sensitivity. Two analyses are performed: one with a simulated data set and one application using data from the Swedish population registries. The simulation study is created to have the same class imbalance at 1:5. The missing values are handled using three different techniques: complete case analysis, predictive mean matching and mean imputation. The thesis concludes that logistic regression and random forest are on average equally accurate, with some instances of random forest outperforming logistic regression. Logistic regression consistently outperforms random forest with regards to sensitivity. This implies that logistic regression may be the best option for studies where the goal is to accurately predict outcomes in the minority class. None of the missing data techniques stood out in terms of performance.
|
363 |
Predicting essay grades for the Swedish national writing test based on the new grading scale A-FLöfving, Jimmy January 2019 (has links)
Based on the curriculum of 2011 a new grading scale ranging from A-F was introduced in the Swedish upper secondary school system. Previous research on similar data have focused on the earlier grading scale, and its crucial that the new circumstances are addressed to understand the impact on grading. Using 348 essays from the national writing test this study investigates the use of automated essay scoring as a way of grading in this new setting. Using various classication methods the models for younger students outperform the corresponding models for older students. This implies that it is harder to predict grades on essays written by older students. Based on the current data the result shows that with the new grading scale the use of automated essay scoring should be used with caution.
|
364 |
Redes Bayesianas aplicadas à análise do risco de crédito. / Bayesian networks applied to the anilysis of credit risk.Karcher, Cristiane 26 February 2009 (has links)
Modelos de Credit Scoring são utilizados para estimar a probabilidade de um cliente proponente ao crédito se tornar inadimplente, em determinado período, baseadas em suas informações pessoais e financeiras. Neste trabalho, a técnica proposta em Credit Scoring é Redes Bayesianas (RB) e seus resultados foram comparados aos da Regressão Logística. As RB avaliadas foram as Bayesian Network Classifiers, conhecidas como Classificadores Bayesianos, com seguintes tipos de estrutura: Naive Bayes, Tree Augmented Naive Bayes (TAN) e General Bayesian Network (GBN). As estruturas das RB foram obtidas por Aprendizado de Estrutura a partir de uma base de dados real. Os desempenhos dos modelos foram avaliados e comparados através das taxas de acerto obtidas da Matriz de Confusão, da estatística Kolmogorov-Smirnov e coeficiente Gini. As amostras de desenvolvimento e de validação foram obtidas por Cross-Validation com 10 partições. A análise dos modelos ajustados mostrou que as RB e a Regressão Logística apresentaram desempenho similar, em relação a estatística Kolmogorov- Smirnov e ao coeficiente Gini. O Classificador TAN foi escolhido como o melhor modelo, pois apresentou o melhor desempenho nas previsões dos clientes maus pagadores e permitiu uma análise dos efeitos de interação entre variáveis. / Credit Scoring Models are used to estimate the insolvency probability of a customer, in a period, based on their personal and financial information. In this text, the proposed model for Credit Scoring is Bayesian Networks (BN) and its results were compared to Logistic Regression. The BN evaluated were the Bayesian Networks Classifiers, with structures of type: Naive Bayes, Tree Augmented Naive Bayes (TAN) and General Bayesian Network (GBN). The RB structures were developed using a Structure Learning technique from a real database. The models performance were evaluated and compared through the hit rates observed in Confusion Matrix, Kolmogorov-Smirnov statistic and Gini coefficient. The development and validation samples were obtained using a Cross-Validation criteria with 10-fold. The analysis showed that the fitted BN models have the same performance as the Logistic Regression Models, evaluating the Kolmogorov-Smirnov statistic and Gini coefficient. The TAN Classifier was selected as the best BN model, because it performed better in prediction of bad customers and allowed an interaction effects analysis between variables.
|
365 |
Análise da mobilidade urbana voltada para inclusão de veículos elétricos de carga visando uma logística sustentável. / Sem título em inglêsChaud, Carolina Attas 27 May 2013 (has links)
Esta tese tem por objetivo elaborar uma metodologia integrada de análise do impacto e do desenvolvimento do veículo elétrico ao longo do tempo atrelado à inserção de estações de carregamento em grandes cidades. Esta metodologia está dividida em duas etapas. A primeira representa a caracterização do veículo em termos das variáveis que determinam o seu desempenho, tais como: avaliação das velocidades em (Km/h); a distância percorrida em (Km); fonte de energia (acumuladores eletroquímicos); sistema de acionamento dos veículos elétricos determinado como motores elétricos em função da potência (W) e da Tensão (V). Ainda, metodologicamente foi desmembrado em 4 ciclos. A segunda retrata sobre um estudo voltado para inserção de estações de carregamento em uma metrópole como a cidade de São Paulo analisando o comportamento otimizado da oferta de energia elétrica na cidade em questão, diante de diferentes taxas hipotéticas de penetração de veículos elétricos, para diferentes perfis de recarga dos veículos (recarga inteligente e sem controle). Foi realizado um estudo comparativo de possíveis ganhos ambientais, econômicos, sociais e políticos com a inserção desses veículos movidos a bateria substituindo os movidos a diesel. Bons resultados, tanto do ponto de vista ambiental (dada a redução do número de emissões e de veículos), quanto de competitividade (custos em geral), puderam ser observados, ratificando e estimulando o uso desse tipo de conceito. Assim, com o intuito de promover a mobilidade elétrica com vistas à sustentabilidade do setor de transportes, surgem novas propostas de arranjos das formas de entregas nas cidades como meio de solucionar os transtornos dessa circulação de mercadorias (seja pela intrusão poluição sonora e visual, aumento do número de emissões). / This thesis aims at developing an integrated methodology for analyzing and impact the development of electric vehicle over time pegged the inclusion of charging stations in major cities. This methodology is divided into two stages. The first step is the characterization of the vehicle in terms of the variables that determine its performance such as: evaluation of speeds (km / h); energy source (electrochemical batteries); drive system of electric vehicles such as electric motors determined as a function of power (W) and voltage (V). Still, methodologically was divided into 4 cycles. The second case of the study portrays the insertion of charging stations in a metropolis like São Paulo investigating the optimal mix of electricity supply in Brazil, in the long term, for different hypothetical rates of electric vehicles penetration, and different recharging profiles for vehicles (smart and dumb recharging). Good results, either under the environmental point of view (reduction of pollution levels and of moving vehicles), or under the competitive framework (cost reduction), were observed, which endorse and stimulate the adoption of this novel concept. But, due to the growing volumes of urban cargo, mainly in the CBDs, the subject urban cargo is receiving much more attention recently, particularly when proposing measures to improve environmental conditions in these centers.
|
366 |
Modelos baseados em pseudo-valores e sua aplicabilidade em credit scoring / Models based on pseudo-values with application to credit scoringSilva, Liliane Travassos da 02 August 2010 (has links)
Os modelos de credit scoring têm sido bastante difundidos nos últimos anos como uma importante ferramenta para agilizar e tornar mais confiável o processo de concessão de crédito por parte das instituições financeiras. Esses modelos são utilizados para classificar os clientes em relação a seus riscos de inadimplência. Neste trabalho, é avaliada a aplicabilidade de uma nova metodologia, baseada em pseudo-valores, como alternativa para a construção de modelos de credit scoring. O objetivo é compará-la com abordagens tradicionais como a regressão logística e o modelo de riscos proporcionais de Cox. A aplicação prática é feita para dados de operações de crédito pessoal sem consignação, coletados do Sistema de Informações de Crédito do Banco Central do Brasil. As performances dos modelos são comparadas utilizando a estatística de Kolmogorov-Smirnov e a área sob a curva ROC. / Credit Scoring models have become popular in recent years as an important tool in the credit granting process, making it more expedite and reliable. The models are mainly considered to classify customers according to their default risk. In this work we evaluate the apllicability of a new methodology, based on pseudo-values, as an alternative to constructing credit scoring models. The objective is to compare this novel methodology with traditional approaches such as logistic regression and Cox proportional hazards model. The models are applied to a dataset on personal credit data, collected from the Credit Information System of Central Bank of Brazil. The performances of the models are compared via Kolmogorov-Smirnov statistic and the area under ROC curve.
|
367 |
Modelo para determinação de resiliência em sistemas de transportes: uma aplicação no sistema de tráfego aéreo. / Model for determining resilience in transport systems: an application in the air traffic system.Medeiros, Wesley José Nogueira 21 March 2018 (has links)
Este trabalho propõe um modelo de análise quantitativa baseado em simulação de eventos discretos para a determinação do nível de resiliência em sistemas de transporte. O nível de resiliência é avaliado considerando as funções de desempenho relacionadas a capacidade, ao nível de serviço e ao tempo de recuperação do sistema de transporte frente a um evento de ruptura. O modelo é validado através de estudo de caso aplicado ao sistema de tráfego aéreo brasileiro, considerando um espaço aéreo composto por 12 setores de uma região de informação de voo (FIR), suas demandas diárias de aeronaves, sua malha de rotas aéreas e sua rede de aeródromos instalada. O evento de ruptura é oriundo de condições meteorológicas adversas que afetam simultaneamente as operações de pouso e decolagem no aeroporto do Rio de Janeiro - Santos Dumont (SBRJ) e no aeroporto de São Paulo - Congonhas (SBSP). Conclui-se que o modelo de análise permite a plena determinação do nível de resiliência em sistemas de transportes, mesmo em situações de rupturas operacionais simultâneas. / This work proposes a quantitative analysis model based on discrete event simulation (DES) to determine the resilience level of transport systems. The resilience level is evaluated considering the performance functions related to capacity, service level and recovery time of the transport system in a presence of disruptive events. The model is validated through a case study applied to the Brazilian air traffic system, considering an airspace with 12 sectors of a flight information region (FIR), its daily aircraft demands, its air route network and its aerodromes network installed. The disruptive event comes from adverse weather conditions that simultaneously affect the landing and takeoff operations at Rio de Janeiro - Santos Dumont (SBRJ) and São Paulo - Congonhas (SBSP) airports. It is concluded that the analysis model allows the full determination of the resilience level in transport systems, even in situations of simultaneous operational disruptions.
|
368 |
Designação de rotas para frota dedicada em uma rede de distribuição de linha branca. / Assigning lanes to dedicated fleet in a white goods distribution network.Stringher, Fabiano Gadini 31 May 2004 (has links)
Esta dissertação apresenta um problema de otimização relacionado com a designação de rotas de carga completa para frota própria ou dedicada, visando a minimização dos custos de transporte numa rede de distribuição formada por fábricas uni-produto, centros de distribuição (consolidação) e clientes. Essas rotas são conjugadas formando ciclos fechados (viagens) para garantir a otimização do tempo através do movimento contínuo desta frota dedicada. A metodologia é aplicada em uma rede de distribuição de um fabricante de linha branca no Brasil. Além dos resultados econômicos favoráveis, outras contribuições para o tema de conjugação de rotas foram encontradas nesta dissertação, tais como, a regra de formação de caminhos, o limite para conjugação de rotas numa rede de distribuição e o desenvolvimento de uma estrutura para custear esses caminhos conjugados. O modelo de programação linear inteira desenvolvido mostrou-se apto a resolver problemas de tamanho real em tempo factível, mesmo com recursos computacionais comuns. / This thesis presents an optimization problem regarding the assignment of truckload lanes to a private or dedicated fleet to minimize transportation costs in a distribution network formed by single-product plants, distribution (consolidation) centers and clients. These lanes are conjugated in order to form closed cycles (trips) to guarantee time optimization through continuous movement of this dedicated fleet. This methodology is applied to a distribution network of a white goods manufacturer in Brazil. More than good economic results, there are others contributions for the theme of conjugated lanes in this thesis, such as, the rule of formation trips, the limit to conjugated lanes to a distribution network and the development of a structure to get the conjugated lanes\' costs. The model of integer linear program that was development is capable to solve the real problems in a reasonable time, even if with regular.
|
369 |
Modelo preditivo para perda de crédito e sua aplicação em decisão de spread / A model of credit loss and its application in decision of spreadMello, Joao Fernando Serrajordia Rocha de 01 April 2009 (has links)
Métodos analíticos para concessão de crédito vêm apresentando enormes avanços nas últimas décadas, particularmente no que se refere a métodos estatísticos de classificação para identificar grupos de indivíduos com diferentes taxas de inadimplência. A maioria dos trabalhos existentes sugere decisões do tipo conceder o crédito ou não, considerando apenas de forma marginal o resultado esperado da operação. O presente trabalho tem o objetivo de propor um modelo de avaliação de risco de crédito mais complexo que os tradicionais modelos de Credit Scoring, que forneça uma perspectiva mais detalhada acerca do desempenho futuro de um contrato de crédito, e que vá além da classificação entre bom e mau pagador. Aliado a este ganho de informação na previsibilidade oferecida pelo modelo, também é objetivo ampliar o espaço de decisões do problema, saindo de uma resposta binária (como aceitar/rejeitar o crédito) para algo que responda à seguinte pergunta: qual é a taxa justa para cobrir determinado risco?. / Analytical methods for granting credit are presenting enormous advances in recent decades, particularly in the field of statistical methods of classification to identify groups of individuals with different rates of default. Most of the existing work suggests decisions of the type granting credit or not, regarding just marginally the expected outcome of the operation. This work aims to propose a model to evaluate credit risk with more complexity than the traditional \"Credit Scoring\" models, providing a more detailed view about the future performance of a credit agreement, which goes beyond the classification of good and bad payers. Coupled with this improvement of information offered by the model, it is also this works aim to expand the decision space of the problem, leaving a binary response (such as accept/reject the claim) to something that answers the following question: \"what is the fair rate to cover a given risk \".
|
370 |
Simulação baseada em agentes para operação de pátios de terminais de contêineres. / Agent-based simulation for yard management in container terminal operations.Brito, Thiago Barros 20 June 2016 (has links)
Terminais de contêineres (TC) e sistemas logísticos em geral, estão atualmente imersos em estruturas de negócio e ambientes operacionais altamente complexos e dinâmicos. Nesse ambiente, pesquisadores e usuários das ferramentas de PO são requisitados a resolver novos tipos de problemas, que surgem a partir de uma crescente complexidade interativa entre os elementos que constituem esses sistemas. Entretanto, parece estar faltando aos tomadores de decisão ferramentas capazes de lidar com sistemas que necessitam a consideração de processos interdependentes, compostos por elementos interagindo e tomando decisões de maneira descentralizada. Neste cenário, a simulação baseada em agentes (SBA) é tida como uma ferramenta potencial para o desenvolvimento e análise de sistemas logísticos, uma vez que ela é capaz de construir análises de sistemas cujo comportamento está associado a propriedades emergentes decorrentes das interações entre seus componentes (agentes). Assim, a SBA é considerada uma possibilidade de abordagem para sistemas logísticos, capaz de tratar questões complexas ainda não tangenciadas por metodologias de simulação tradicionais. Apesar do potencial alegado, a aplicação da SBA ainda é incipiente no campo logístico, representada com baixo nível de maturidade na literatura. Dessa forma, o objetivo do trabalho é desenvolver uma aplicação SBA representando uma operação full-scale do pátio de um TC, a fim de confirmar a SBA como uma ferramenta potencial para representar sistemas logísticos , capaz de apoiar processos de tomada de decisão maduros. Com base no desenvolvimento proposto foi possível, metodologicamente e de maneira prática, avaliar a utilização de SBA, seus benefícios, dificuldades, desdobramentos técnicos e outras questões. Essa avaliação permitiu concluir que a SBA cumpre as promessas de flexibilidade, representatividade e potencial de sofisticação para representação de sistemas logísticos. Além disso, observou-se que a metodologia foi capaz de estender sua contribuição no sentido de expandir algumas das fronteiras conceituais da metodologia de simulação, tais como a discussão sobre o conceito de modelagem genérica e a integração entre simulação-otimização. / Container terminals (CTs), and logistics systems in general, are nowadays immersed in a dynamic and highly complex business and operational environment. Thus, researches and users of OR are being called to solve new types of logistics system problems, born from this growing interactive complexity between the system\'s elements. However, what seems to be missing in the decision-makers OR toolbox are tools able to deal with systems that need to consider several interconnected and interdepend functions and process. In this scenario, agent-based simulation (ABS) is considered to hold high promises for developing complex logistics systems, based on the fact that it is able to build analysis of systems whose behavior is associated to emergent properties deriving from interactions between its basic constituent elements (agents). ABS is considered rather a new approach for simulating systems, able to challenge more complex questions, not answered by traditional simulation methodology. Despite the advocate potential of ABS, its application still incipient within the logistic field, lacking in terms of maturity in literarture. In that way, the objective of the work is to develop an ABS application representing a full-scale CT yard management operation, in order to confirm ABS as a potential tool to represent logistics systems and support mature decision making processes. Based on the proposed development, the work is be able to conceptually, methodologically and practically evaluate the utilization of ABS - its benefits, difficulties, application unfolding, new representation boundaries and other possibilities. This evaluation allowed concluding that the ABS fulfills the high flexibility, representability and promises for logistics systems, even extending its contribution to some of the conceptual frontiers of the simulation methodology, such as generic modeling methodology discussion and simulation-optimization integration.
|
Page generated in 0.0681 seconds