• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 93
  • 80
  • 11
  • 11
  • 10
  • 4
  • 3
  • 3
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 253
  • 90
  • 78
  • 69
  • 60
  • 57
  • 53
  • 52
  • 47
  • 46
  • 44
  • 41
  • 38
  • 37
  • 36
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Análise do desempenho de classificadores para o mapeamento de cobertura do solo em regiões de floresta tropical: estudo de caso do município de Tefé - AM

Schwartzman, Luiz Fernando Guimarães January 2017 (has links)
A Amazônia é a maior floresta tropical do mundo e desempenha papel fundamental na regulação climática do continente sul-americano. A expansão de atividades antrópicas ocorridas na Amazônia nos últimos 70 anos provocou mudanças nos padrões de cobertura do solo na região que levaram ao surgimento de diversas políticas de conservação em nível nacional e internacional. Uma das principais técnicas para o monitoramento e acompanhamento do desenvolvimento dessas políticas são as técnicas fornecidas pelo sensoriamento remoto. Esse trabalho tem por objetivo avaliar o desempenho de três classificadores de imagens digitais (Mínima Distância Euclidiana, Máxima Verrosimilhança e Extration and Classification of Homogeneous Objects) na região central da Amazônia brasileira. Foram utilizadas duas abordagens para realizar as classificações, na primeira os classificadores foram aplicados sobre uma imagem do satélite Landsat - 8 que teve seus números digitais convertidos para valores de refletância e na segunda abordagem os classificadores foram aplicados sobre imagens fração resultantes da aplicação do modelo linear de mistura espectral na imagem do Landsat - 8. Para avaliar os desempenho dos classificadores e das abordagens propostas aplicou-se uma matriz de confusão e foi calculado o índice Kappa para cada um dos resultados obtidos. Os resultados mostraram que o Máxima verossimilhança apresentou o melhor desempenho nas duas abordagem seguido pelo ECHO com resultados próximos. O Mínima Distância teve o pior desempenho nas duas abordagem. Os resultados também indicaram que a redução da dimensionalidade dos dados provocadas pelo modelo linear de mistura espectral foi capaz de melhorar o desempenho apenas do ECHO. / The Amazon is the largest tropical forest in the world and plays a key role in the climate regulation in South America.In the last 70 years, the expansion of anthropogenic activities in this biome has led to changes in land´s cover patterns in that region which have led to the emergence of several conservation policies in national and international levels. One of the main techniques of monitoring the development of these policies is the technique provided by remote sensing. This theses aims to evaluate the performance of three digital image classifiers (Minimum Distance, Maximum Verification and Extraction and Classification of Homogeneous Objects) in the Brazilian’s Amazon central region. Two approaches were used to perform the classifications. To the first one the classifiers were applied on the satellite Landsat – 8’s image that had its digital numbers converted to values of reflectance. To the second approach the classifiers were applied on fraction images resulting from the application of the linear model of spectral mixing in the Landsat-8 image. To evaluate the performance of the proposed classifiers and approaches a confusion matrix the Kappa index was adopted to calculate each of the obtained results. The results showed that the maximum probability has presented the best performance in the two approaches followed by ECHO with close results. The Minimum Distance had the worst performance in both approaches. The results also indicated that the reduction of data dimensionality caused by the linear spectral mixing model was able to improve the performance of only ECHO.
82

Supervised Classification of Missense Mutations as Pathogenic or Tolerated using Ensemble Learning Methods

Balasubramanyam, Rashmi January 2017 (has links) (PDF)
Missense mutations account for more than 50% of the mutations known to be involved in human inherited diseases. Missense classification is a challenging task that involves sequencing of the genome, identifying the variations, and assessing their deleteriousness. This is a very laborious, time and cost intensive task to be carried out in the laboratory. Advancements in bioinformatics have led to several large-scale next-generation genome sequencing projects, and subsequently the identification of genome variations. Several studies have combined this data with information on established deleterious and neutral variants to develop machine learning based classifiers. There are significant issues with the missense classifiers due to which missense classification is still an open area of research. These issues can be classified under two broad categories: (a) Dataset overlap issue - where the performance estimates reported by the state-of-the-art classifiers are overly optimistic as they have often been evaluated on datasets that have significant overlaps with their training datasets. Also, there is no comparative analysis of these tools using a common benchmark dataset that contains no overlap with the training datasets, therefore making it impossible to identify the best classifier among them. Also, such a common benchmark dataset is not available. (b) Inadequate capture of vital biological information of the protein and mutations - such as conservation of long-range amino acid dependencies, changes in certain physico-chemical properties of the wild-type and mutant amino acids, due to the mutation. It is also not clear how to extract and use this information. Also, some classifiers use structural information that is not available for all proteins. In this study, we compiled a new dataset, containing around 2 - 15% overlap with the popularly used training datasets, with 18,036 mutations in 5,642 proteins. We reviewed and evaluated 15 state-of-the-art missense classifiers - SIFT, PANTHER, PROVEAN, PhD-SNP, Mutation Assessor, FATHMM, SNPs&GO, SNPs&GO3D, nsSNPAnalyzer, PolyPhen-2, SNAP, MutPred, PON-P2, CONDEL and MetaSNP, using the six metrics - accuracy, sensitivity, specificity, precision, NPV and MCC. When evaluated on our dataset, we observe huge performance drops from what has been claimed. Average drop in the performance for these 13 classifiers are around 15% in accuracy, 17% in sensitivity, 14% in specificity, 7% in NPV, 24% in precision and 30% in MCC. With this we show that the performance of these tools is not consistent on different datasets, and thus not reliable for practical use in a clinical setting. As we observed that the performance of the existing classifiers is poor in general, we tried to develop a new classifier that is robust and performs consistently across datasets, and better than the state-of-the-art classifiers. We developed a novel method of capturing long-range amino acid dependency conservation by boosting the conservation frequencies of substrings of amino acids of various lengths around the mutation position using AdaBoost learning algorithm. This score alone performed equivalently to the sequence conservation based tools in classifying missense mutations. Popularly used sequence conservation properties was combined with this boosted long-range dependency conservation scores using AdaBoost algorithm. This reduced the class bias, and improved the overall accuracy of the classifier. We trained a third classifier by incorporating changes in 21 important physico-chemical properties, due to the mutation. In this case, we observed that the overall performance further improved and the class bias further reduced. The performance of our final classifier is comparable with the state-of-the-art classifiers. We did not find any significant improvement, but the class-specific accuracies and precisions are marginally better by around 1-2% than those of the existing classifiers. In order to understand our classifier better, we dissected our benchmark dataset into: (a) seen and unseen proteins, and (b) pure and mixed proteins, and analysed the performance in detail. Finally we concluded that our classifier performs consistently across each of these categories of seen, unseen, pure and mixed protein.
83

Geoestística e sensoriamento remoto na classificação de imagens em áreas cultivadas com citros

Silva, Alessandra Fagioli da [UNESP] 28 February 2011 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:24:39Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-02-28Bitstream added on 2014-06-13T20:31:55Z : No. of bitstreams: 1 silva_af_me_botfca.pdf: 1495276 bytes, checksum: fb2de316101ec3a42fe84ea5707baf27 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / A citricultura é importante para a economia brasileira devido aos recordes de exportações e pela geração de empregos direto e indireto. O sensoriamento remoto é a fonte primária de informações sobre a cobertura do solo em decorrência dos avanços tecnológicos nos sistemas sensores. A incorporação de procedimentos geoestatísticos em estudos ambientais baseado em técnicas de Krigagem tem sido utilizada por profissionais da área de sensoriamento remoto. O objetivo deste trabalho foi comparar a precisão de métodos de classificação de imagens orbitais na determinação de áreas cultivadas com citros, na Mesoregião de Bauru e Araraquara, através de métodos de sensoriamento remoto e geoestatísticos, para a discriminação e quantificação da área plantada. A área de estudo utilizada nesta pesquisa esta localizada na região central do Estado de São Paulo, com uma área de 56.146,78 ha. Foi utilizado o SIG-SPRING para o processamento dos dados. Foram utilizadas as bandas 2, 3 e 4 da imagem digital proveniente do satélite CBERS 2B, câmera CCD (Câmera Imageadora de Alta Resolução) que fornece imagens com uma resolução espacial de 20 metros. A imagem foi de 16/04/2009, nas órbitas/ponto 157/124 e 157/125. No processo de classificação das imagens foram estudados três métodos de classificação, sendo o CLUSTER não-supervisionado, o MAXVER (Máxima Verossimilhança) e a KI (Krigagem Indicativa) supervisionados, além da classificação em tela tida como verdade terrestre. As fidedignidades das classificações foram avaliadas pelo índice Kappa. Pelos resultados obtidos nas classificações de imagem para a discriminação e quantificação de áreas cultivadas com citros pode-se concluir: os classificadores obtiveram melhor qualidade de classificação para as áreas maiores com CITROS;a Krigagem Indicativa unificou as áreas pequenas de CITROS em uma única área... / The citrus industry is important for the Brazilian economy due to record exports and generating direct and indirect jobs. Remote sensing is the primary source of information on land cover as a result of technological advances in sensor systems. The incorporation of geostatistics procedures in environmental studies based on Kriging techniques has been used by professionals in areas of remote sensing. The aim of this study was to compare the accuracy of classification methods in the determination of satellite images of areas cultivated with citrus, Mesoregião in Araraquara, Bauru, and, through methods of remote sensing and geostatistics to discrimination and quantification of the area planted. The study area used in this research is located in the central region of São Paulo, with an area of 56,146.78 ha. It was used the GIS-SPRING for data processing. We used bands 2, 3 and 4 of the digital image from the satellite CBERS 2B, CCD camera (Camera high resolution image) that provides images with a spatial resolution of 20 meters. The image dated of 04/16/2009, the path/row 157/124 and 157/125. In the process of image classification were studied three methods of classification, and unsupervised clustering, the MLC (Maximum Likelihood) and KI (kriging) supervised classification beyond the screen taken as ground truth. The validation of classifications were evaluated by Kappa index. The results obtained of image classification onto discrimination and quantification of citrus areas were: the classifiers had improved quality of classification for wide citrus areas, the Indicative Kriging unified the small citrus areas in a single area, the Indicative Kriging was the classifier that less classified riparian vegetation area such as citrus, the others changed riparian vegetation by citrus. The validation showed that Indicative Kriging was the classifier which had the lower quality rating than... (Complete abstract click electronic access below)
84

Comparação de métodos de classificação de imagens, visando o gerenciamento de áreas citrícolas /

Barbosa, Ana Paula, 1983. January 2009 (has links)
Resumo: Dada a significativa importância da atividade citrícola no Estado de São Paulo, verifica-se a necessidade de um constante monitoramento destas áreas, contribuindo para a tomada de decisões rápidas e abrangentes, visando à manutenção desta exploração. Mesmo com sua extraordinária capacidade de analisar e interpretar dados de sensoriamento remoto, o ser humano tende à subjetividade ao registrar as informações observadas nas imagens. Muitas vezes, o conhecimento do analista sobre a área de estudo é limitado, o que faz do processo de classificação uma tarefa que demanda maior esforço e tempo para identificação dos objetos representados na superfície. A classificação de imagens é o processo de extração de informação para reconhecer padrões e objetos homogêneos e são utilizados em sensoriamento remoto para mapear áreas da superfície terrestre que correspondem aos temas de interesse. O trabalho teve por objetivo a comparação da eficiência de métodos de classificação de imagens orbitais em áreas cultivadas com citros, utilizando técnicas de geoprocessamento visando o planejamento e o gerenciamento localizado das áreas de produção de citros. A área de estudo utilizada corresponde a Fazenda Água Branca, município de Bariri/ SP. O SIG - Idrisi 15.0, foi utilizado no processamento das imagens do satélite LANDSAT-5 TM, órbita/ponto: 221/75, passagens de 16/06/2003 e 26/05/2007. Do trabalho realizado constatou-se que os resultados na avaliação de acurácia da classificação foram satisfatórios, sendo que a classificação do algoritmo CLUSTER apresentou qualidade excelente (0,9276) e muito boa (0,6485); o algoritmo MAXVER apresentou classificações excelentes, com Kappa de 0,8338 e 0,8818; e o índice gerado pelo método de classificação relativa... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The significative activity of the citrus crop in São Paulo State requires a constant monitoring of these areas, contributing to make the quick and comprehensive decisions, aiming to maintain this operation. Even with the extraordinary ability to analyze and interpret data from remote sensing, human beings tend to subjectivity to register the information in the observed images. Often, knowledge of the analyst about the study area is limited, which makes the process of classifying a task that demands more time and effort to identify the objects represented on the surface. The images classification is the process of extraction of information to recognize patterns and homogeneous objects and it is used in remote sensing to map areas of the surface that correspond to themes of interest. This study aimed to compare the efficiency of methods of classification of orbital images in areas cultivated with citrus, using GIS techniques to the planning and management located in the areas of citrus production. The study area is located in Água Branca Farm, city of Bariri/SP. The GIS - Idrisi 15.0 was used in the image processing. It noted that the evaluation results of the classification accuracy were satisfactory, which the classifications of the CLUSTER algorithm had excellent quality (0.9276) and very good (0.6485), the MAXVER algorithm had excellent ratings, with kappa of 0.8338 and 0.8818, and the index obtained by the method of Fuzzy classification submitted a rating between very good (0.7260) and good (0.5235) for 2003 and 2007, respectively. The methods used for the discrimination of areas cultivated with citrus showed different efficiencies in the classification of images. In general, the classifications for the 2003 images showed the best performance when compared... (Complete abstract click electronic access below) / Orientador: Sérgio Campos / Coorientador: Célia Regina Lopes Zimback / Coorientador: Zacarias Xavier de Barros / Banca: Sergio Lazaro de Lima / Banca: Osmar Delmanto Júnior / Mestre
85

Análise do desempenho de classificadores para o mapeamento de cobertura do solo em regiões de floresta tropical: estudo de caso do município de Tefé - AM

Schwartzman, Luiz Fernando Guimarães January 2017 (has links)
A Amazônia é a maior floresta tropical do mundo e desempenha papel fundamental na regulação climática do continente sul-americano. A expansão de atividades antrópicas ocorridas na Amazônia nos últimos 70 anos provocou mudanças nos padrões de cobertura do solo na região que levaram ao surgimento de diversas políticas de conservação em nível nacional e internacional. Uma das principais técnicas para o monitoramento e acompanhamento do desenvolvimento dessas políticas são as técnicas fornecidas pelo sensoriamento remoto. Esse trabalho tem por objetivo avaliar o desempenho de três classificadores de imagens digitais (Mínima Distância Euclidiana, Máxima Verrosimilhança e Extration and Classification of Homogeneous Objects) na região central da Amazônia brasileira. Foram utilizadas duas abordagens para realizar as classificações, na primeira os classificadores foram aplicados sobre uma imagem do satélite Landsat - 8 que teve seus números digitais convertidos para valores de refletância e na segunda abordagem os classificadores foram aplicados sobre imagens fração resultantes da aplicação do modelo linear de mistura espectral na imagem do Landsat - 8. Para avaliar os desempenho dos classificadores e das abordagens propostas aplicou-se uma matriz de confusão e foi calculado o índice Kappa para cada um dos resultados obtidos. Os resultados mostraram que o Máxima verossimilhança apresentou o melhor desempenho nas duas abordagem seguido pelo ECHO com resultados próximos. O Mínima Distância teve o pior desempenho nas duas abordagem. Os resultados também indicaram que a redução da dimensionalidade dos dados provocadas pelo modelo linear de mistura espectral foi capaz de melhorar o desempenho apenas do ECHO. / The Amazon is the largest tropical forest in the world and plays a key role in the climate regulation in South America.In the last 70 years, the expansion of anthropogenic activities in this biome has led to changes in land´s cover patterns in that region which have led to the emergence of several conservation policies in national and international levels. One of the main techniques of monitoring the development of these policies is the technique provided by remote sensing. This theses aims to evaluate the performance of three digital image classifiers (Minimum Distance, Maximum Verification and Extraction and Classification of Homogeneous Objects) in the Brazilian’s Amazon central region. Two approaches were used to perform the classifications. To the first one the classifiers were applied on the satellite Landsat – 8’s image that had its digital numbers converted to values of reflectance. To the second approach the classifiers were applied on fraction images resulting from the application of the linear model of spectral mixing in the Landsat-8 image. To evaluate the performance of the proposed classifiers and approaches a confusion matrix the Kappa index was adopted to calculate each of the obtained results. The results showed that the maximum probability has presented the best performance in the two approaches followed by ECHO with close results. The Minimum Distance had the worst performance in both approaches. The results also indicated that the reduction of data dimensionality caused by the linear spectral mixing model was able to improve the performance of only ECHO.
86

Sistema imunológico artificial para predição de fraudes e furtos de energia elétrica / Artificial immune system to predict electrical energy fraud and theft

Astiazara, Mauricio Volkweis January 2012 (has links)
Neste trabalho é analisada a aplicação da técnica de Sistemas Imunológicos Artificiais (SIA) a um problema do mundo real: como predizer fraudes e furtos de energia elétrica. Vários trabalhos tem mostrado que épossível detectar padrões de dados anormais a partir dos dados de consumidores de energia elétrica e descobrir problemas como fraude e furto. Sistemas Imunológicos Artificiais é um ramo recente da Inteligência Computacional e tem diversas possíveis aplicações, sendo uma delas o reconhecimento de padrões. Mais de um algoritmo pode ser empregado para criar um SIA; no escopo deste trabalho será empregado o algoritmo Clonalg. A eficácia deste algoritmo é medida e comparada com a de outros métodos de classificação. A amostra de dados usada para validar este trabalho foi fornecida por uma companhia de energia elétrica. Os dados fornecidos foram selecionados e transformados com o objetivo de eliminar redundância e normalizar valores. / In this paper, we analyze the application of an Artificial Immune System (AIS) to a real world problem: how to predict electricity fraud and theft. Various works have explained that it is possible to detect abnormal data patterns from electricity consumers and discover problems like fraud and theft. Artificial Immune Systems is a recent branch of Computational Intelligence and has several possible applications, one of which is pattern recognition. More than one algorithm can be employed to create an AIS; we selected the Clonalg algorithm for our analysis. The efficiency of this algorithm is measured and compared with that of other classifier methods. The data sample used to validate this work was provided by an electrical energy company. The provided data were selected and transformed with the aim of eliminating redundant data and to normalize values.
87

Sistema imunológico artificial para predição de fraudes e furtos de energia elétrica / Artificial immune system to predict electrical energy fraud and theft

Astiazara, Mauricio Volkweis January 2012 (has links)
Neste trabalho é analisada a aplicação da técnica de Sistemas Imunológicos Artificiais (SIA) a um problema do mundo real: como predizer fraudes e furtos de energia elétrica. Vários trabalhos tem mostrado que épossível detectar padrões de dados anormais a partir dos dados de consumidores de energia elétrica e descobrir problemas como fraude e furto. Sistemas Imunológicos Artificiais é um ramo recente da Inteligência Computacional e tem diversas possíveis aplicações, sendo uma delas o reconhecimento de padrões. Mais de um algoritmo pode ser empregado para criar um SIA; no escopo deste trabalho será empregado o algoritmo Clonalg. A eficácia deste algoritmo é medida e comparada com a de outros métodos de classificação. A amostra de dados usada para validar este trabalho foi fornecida por uma companhia de energia elétrica. Os dados fornecidos foram selecionados e transformados com o objetivo de eliminar redundância e normalizar valores. / In this paper, we analyze the application of an Artificial Immune System (AIS) to a real world problem: how to predict electricity fraud and theft. Various works have explained that it is possible to detect abnormal data patterns from electricity consumers and discover problems like fraud and theft. Artificial Immune Systems is a recent branch of Computational Intelligence and has several possible applications, one of which is pattern recognition. More than one algorithm can be employed to create an AIS; we selected the Clonalg algorithm for our analysis. The efficiency of this algorithm is measured and compared with that of other classifier methods. The data sample used to validate this work was provided by an electrical energy company. The provided data were selected and transformed with the aim of eliminating redundant data and to normalize values.
88

Estudo e desenvolvimento de métodos para predição de doadores de sangue / Study and development of methods for prediction of blood donors

Silva, Fernando Henrique da 16 February 2018 (has links)
Submitted by JÚLIO HEBER SILVA (julioheber@yahoo.com.br) on 2018-02-19T11:16:14Z No. of bitstreams: 2 Dissertação - Fernando Henrique da Silva - 2018.pdf: 7574243 bytes, checksum: 54853391be8cd76fc74017985311ad09 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-02-19T11:31:02Z (GMT) No. of bitstreams: 2 Dissertação - Fernando Henrique da Silva - 2018.pdf: 7574243 bytes, checksum: 54853391be8cd76fc74017985311ad09 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-02-19T11:31:02Z (GMT). No. of bitstreams: 2 Dissertação - Fernando Henrique da Silva - 2018.pdf: 7574243 bytes, checksum: 54853391be8cd76fc74017985311ad09 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-02-16 / Hemotherapy units has difficulties to optimize the search for blood donors in emergency situations, as well as to keep their blood stocks at adequate levels. On the other hand, the use of computational techniques for prediction has obtained promissing results in several areas of knowledge, and can be seen as a fundamental tool in obtaining blood donations, however, are little explored in this sector. Given this gap, this research aimed to analyze and develop prediction techniques to optimize the search for donors with higher conversion rate to the donation, focusing on data mining techniques. For this, we first analyzed the performance of traditional literature classifiers applied to a real database, which produced unsatisfactory prediction results. Seeking for higher quality results we propose a top-k recommendation approach of blood donors, which uses heuristics to estimate a confidence degree in donation. Computational experiments show that the top-k recommendation approach achieves good results for all three developed heuristics. The support vector-based heuristic achieving 94.09% of precision among the top-10 recommended, and 99.90% of precision for top-1, for the same data set that the classifiers were not successful. It is expected that the results of this research will contribute to the academic community due to the variety of classifiers analyzed and especially due to the proposed top-k recommendations approach. In the future, this approach can be better analyzed with other databases and even improved by the development of new heuristics. In addition, it is believed that the developed top-k approach can be used in health prediction systems, with a focus on predicting blood donors, especially in emergency situations. / Unidades Hemoterápicas encontram dificuldades para otimizar a busca por doadores de sangue em situações de emergência, assim como para manter seus estoques sanguíneos em níveis adequados. Por outro lado, a utilização de técnicas computacionais de predição tem obtido ótimos resultados em várias áreas do conhecimento, podendo ser vista como uma ferramenta fundamental na obtenção de doações de sangue, contudo, são pouco exploradas neste setor. Dado esta lacuna, este trabalho objetivou em analisar e desenvolver técnicas de predição para otimizar a busca por doadores com maior taxa de conversão à doação, com foco em técnicas de mineração de dados. Para isto, primeiramente analisou-se o desempenho de classificadores tradicionais da literatura aplicados a uma base de dados real, o que produziu resultados de predição insatisfatórios. Na busca de resultados de maior qualidade foi proposta uma abordagem de recomendação dos top-k, que utiliza heurísticas para a estimar a confiança em doação. Experimentos computacionais demonstram que a abordagem de recomendação top-k alcança bons resultados para todas as três heurísticas desenvolvidas. A heurística baseada em vetores de suporte obteve taxas de precisão de 94,09% entre os top-10 recomendados, chegando a 99,90% de precisão para o top-1, para a mesma base em que não se obteve sucesso com o uso de classificadores. É esperado que os resultados deste trabalho contribuam para a comunidade acadêmica devido a variedade de classificadores analisados e principalmente pela abordagem de recomendações top-k proposta. Futuramente esta abordagem poderá ser melhor analisada com outras bases de dados e até mesmo aprimorada pelo desenvolvimento de novas heurísticas. Além disso, acredita-se que a abordagem top-k desenvolvida possa ser utilizada em sistemas predição na área da saúde, com foco na predição de doadores de sangue principalmente em situações de emergência.
89

Performance financeira da carteira na avaliação de modelos de análise e concessão de crédito: uma abordagem baseada em aprendizagem estatística / Financial performance portfolio to evaluate and select analyses and credit models: An approach based on Statistical Learning

Rodrigo Alves Silva 05 September 2014 (has links)
Os modelos de análise e decisão de concessão de crédito buscam associar o perfil do tomador de crédito à probabilidade do não pagamento de obrigações contraídas, identificando assim o risco associado ao tomador e auxiliando a firma a decidir pela aprovação ou negação da solicitação de crédito. Atualmente este campo de pesquisa tem ganhado importância no cenário nacional - pela intensificação da atividade de crédito no país com grande participação dos bancos públicos neste processo - e internacional - pelo aumento das preocupações com potenciais danos à economia derivados de eventos de default. Tal quadro fez com que fossem construídos e adaptados diversos modelos e métodos à análise de risco de crédito tanto para consumidores como para empresas. Estes modelos são testados e comparados com base na acurácia de previsão ou de métricas de otimização estatística. Este é um procedimento que pode não se mostrar eficiente do ponto de vista financeiro, ao mesmo tempo em que dificulta a interpretação e tomada de decisão por parte da firma quanto a qual o melhor modelo, gerando uma lacuna pelo desprendimento observado entre a decisão de qual o modelo a ser adotado e o objetivo financeiro da empresa. Tendo em vista que o desempenho financeiro é um dos principais indicadores de qualquer procedimento gerencial, o presente estudo objetivou preencher a esta lacuna analisando o desempenho financeiro de carteiras de crédito formadas por técnicas de aprendizagem estatística utilizadas atualmente na classificação e análise de risco de crédito em pesquisas nacionais e internacionais. A pesquisa selecionou as técnicas: análise discriminante, regressão logística, redes bayesianas Naïve Bayes, kdB-1, kdB-2, SVC e SVM e aplicou tais técnicas junto à base de dados German Credit Data Set. Os resultados foram analisados e comparados inicialmente em termos de acurácia e custos por erro de classificação. Adicionalmente a pesquisa propôs o emprego de quatro métricas financeiras (RFC, PLR, RAROC e IS), encontrando variações quanto aos resultados produzidos por cada técnica. Estes resultados sugerem variações quanto a sequência de eficiência e consequentemente de emprego das técnicas, demonstrando a importância da consideração destas métricas para a análise e decisão de seleção de modelos de classificação ótimos. / Analysis and decision credit concession models search for relating the borrower\'s credit profile to the nonpayment probability of their obligations, identifying risks related to borrower and helping decision firm to approve or deny the credit request. Currently this search field has increased in Brazilian scenario - by credit activity intensification into the country with a large public banks sharing - and in the international scenario - by growing concerns about economy potential damages resulting from default events. This position leads the construction and adaptation of several models and methods by credit risk analysis from both consumers and companies. These models have been tested and compared based on prediction of accuracy or other statistical optimization metrics. This proceed is eventually not effective when analyzed by a financial standpoint, in the same time that affects the understanding and decision of the enterprise about the best model, creating a gap in the decision model choice and the firm financial goals. Given that the financial performance is a foremost indicator of any management procedure, this study aimed to address this gap by the financial performance analysis of loan portfolios formed by statistical learning techniques currently used in the classification and credit risk analysis in national and international researches. The selected techniques (discriminant analysis, logistic regression, Bayesian networks Naïve Bayes , 1 - KDB , KDB - 2 , SVC and SVM) were applied to the German Credit Data Set and their results were initially analyzed and compared in terms of accuracy and misclassification costs. Regardless of these metrics the research has proposed to use four financial metrics (RFC, PLR, RAROC and IS), finding variations in the results of each statistical learning techniques. These results suggest variations in the sequence of efficiency and, ultimately, techniques choice, demonstrating the importance of considering these metrics for analysis and selection of decision models of optimal classification.
90

Performance Analysis of Credit Scoring Models on Lending Club Data / Performance Analysis of Credit Scoring Models on Lending Club Data

Polena, Michal January 2017 (has links)
In our master thesis, we compare ten classification algorithms for credit scor- ing. Their prediction performances are measured by six different classification performance measurements. We use a unique P2P lending data set with more than 200,000 records and 23 variables for our classifiers comparison. This data set comes from Lending Club, the biggest P2P lending platform in the United States. Logistic regression, Artificial neural network, and Linear discriminant analysis are the best three classifiers according to our results. Random forest ranks as the fifth best classifier. On the other hand, Classification and regression tree and k-Nearest neighbors are ranked as the worse classifiers in our ranking. 1

Page generated in 0.4525 seconds