Global ETD Search

41	Utilizando comit?s de classificadores para predi??o de rendimento escolar Nogueira, Priscilla Suene de Santana 06 February 2015 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2016-03-02T22:44:37Z No. of bitstreams: 1 PriscillaSueneDeSantanaNogueira_DISSERT.pdf: 2990260 bytes, checksum: b2f0adece207327dfcf45f7d23b39fd4 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2016-03-03T22:56:49Z (GMT) No. of bitstreams: 1 PriscillaSueneDeSantanaNogueira_DISSERT.pdf: 2990260 bytes, checksum: b2f0adece207327dfcf45f7d23b39fd4 (MD5) / Made available in DSpace on 2016-03-03T22:56:49Z (GMT). No. of bitstreams: 1 PriscillaSueneDeSantanaNogueira_DISSERT.pdf: 2990260 bytes, checksum: b2f0adece207327dfcf45f7d23b39fd4 (MD5) Previous issue date: 2015-02-06 / A minera??o de dados educacionais (MDE) ? um dom?nio de aplica??o na ?rea de Intelig?ncia artificial que tem sido bastante explorado na atualidade. Os avan?os tecnol?gicos e em especial, a crescente utiliza??o dos ambientes virtuais de aprendizagem t?m permitido a gera??o de consider?veis quantidades de dados a serem investigados. Dentre as atividades a serem tratadas nesse contexto est? a predi??o de rendimento escolar de estudantes, a qual pode ser realizada atrav?s do emprego de t?cnicas de aprendizado de m?quina. Tais t?cnicas podem ser utilizadas para classifica??o dos estudantes em r?tulos previamente definidos. Uma das estrat?gias para aplica??o dessas t?cnicas consiste em combin?-las no projeto de sistemas multiclassificadores, cuja efici?ncia pode ser comprovada por resultados j? alcan?ados em outros trabalhos realizados em diversas ?reas, tais como: medicina, com?rcio e biometria. Os dados utilizados nos experimentos foram obtidos por meio das intera??es entre estudantes em um dos mais utilizados ambientes virtuais de aprendizagem denominado moodle. Diante desse breve panorama, o presente trabalho apresenta resultados de diversos experimentos que incluem o emprego de sistemas multiclassifcadores espec?ficos, denominados comit?s de classificadores, desse modo visando alcan?ar melhores resultados na predi??o de rendimento escolar, ou seja, na busca por maiores percentuais de acur?cia na classifica??o dos estudantes; apresentando uma significativa explora??o de dados educacionais e an?lises relevantes advindas desses experimentos. / Educational Data Mining is an application domain in artificial intelligence area that has been extensively explored nowadays. Technological advances and in particular, the increasing use of virtual learning environments have allowed the generation of considerable amounts of data to be investigated. Among the activities to be treated in this context exists the prediction of school performance of the students, which can be accomplished through the use of machine learning techniques. Such techniques may be used for student?s classification in predefined labels. One of the strategies to apply these techniques consists in their combination to design multi-classifier systems, which efficiency can be proven by results achieved in other studies conducted in several areas, such as medicine, commerce and biometrics. The data used in the experiments were obtained from the interactions between students in one of the most used virtual learning environments called Moodle. In this context, this paper presents the results of several experiments that include the use of specific multi-classifier systems systems, called ensembles, aiming to reach better results in school performance prediction that is, searching for highest accuracy percentage in the student?s classification. Therefore, this paper presents a significant exploration of educational data and it shows analyzes of relevant results about these experiments. Minera??o de dados educacionais Comit?s de classificadores Moodle
42	Soluções em personalização de conteúdo baseadas em classificadores simbólicos modais Leite Dantas Bezerra, Byron 31 January 2008 (has links) Made available in DSpace on 2014-06-12T15:48:46Z (GMT). No. of bitstreams: 1 license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Engenhos de Personalização são ferramentas úteis para se encontrar informações do interesse de uma pessoa de forma efetiva. Para isso, eles capturam informações sobre os usuários de um sistema para aprender sobre suas preferências. De posse destas informações, os Engenhos de Personalização adotam técnicas de filtragem de informação baseadas normalmente em classificadores com aprendizagem supervisionada. As técnicas mais comuns definem as correlações entre os usuários da comunidade e, a partir daí, disparam um processo conhecido popularmente como boca-à-boca . Outra técnica realiza uma filtragem com base no conteúdo descritivo dos itens no repositório como, o elenco e o gênero de um filme. Finalmente, existem abordagens híbridas que procuram combinar diferentes técnicas absorvendo o que há de melhor em cada uma. No presente trabalho fazemos uma leitura crítica do estado da arte relacionado aos Engenhos de Personalização e, a partir daí, apresentamos três novos métodos baseados em conceitos e ferramentas do domínio de Análise de Dados Simbólicos, em que cada um deles segue uma técnica diferente: o método Content Modal Based Filtering realiza filtragem de informação baseada no conteúdo; o método Social Modal Collaborative Filtering realiza filtragem colaborativa; e o método Hybrid Modal Based Filtering realiza filtragem híbrida. Definimos um processo de avaliação de desempenho das tecnologias de personalização e o aplicamos para efeito de comparação dos nossos métodos com abordagens clássicas. Em nossas análises consideramos dimensões relevantes para sistemas reais, mas pouco exploradas nos trabalhos atuais, como o impacto da quantidade de itens no perfil do usuário (associado ao Problema do Novo Usuário) e o tamanho da comunidade de usuários (associado ao Problema da Esparsidade). Nos experimentos realizados constatamos que duas de nossas abordagens de filtragem alcançaram desempenho em um cenário com pouca informação sobre o usuário e alta esparsidade pouco abaixo de 4% comparado ao desempenho obtido no cenário ideal. Nestas condições um dos métodos mais populares, a filtragem colaborativa com kNN, apresenta uma queda de desempenho de 18,5% Classificadores Simbólicos Modais Análise de Dados Simbólicos Sistemas de Recomendação Personalização Filtragem de Informação
43	Construção de sistemas de múltiplos classificadores por meio de hibridização e otimização de técnicas de agrupamento e classificação de dados ALMEIDA, Leandro Maciel 31 January 2011 (has links) Made available in DSpace on 2014-06-12T15:51:59Z (GMT). No. of bitstreams: 2 arquivo3006_1.pdf: 934448 bytes, checksum: cfaf4b35b4e186dc40f91523ebe587bf (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Os Sistemas de Múltiplos Classificadores (também conhecidos como Comitês de Classificadores) podem usar a combinação ou a seleção de hipóteses dos diferentes membros para determinar a hipótese de solução para um dado problema. O método de combinação de hipóteses é mais difundido, sendo possível encontrar diferentes estratégias que aprimoraram o seu desempenho desde a sua concepção. Por outro lado, o método de seleção não possui tantos avanços quanto o método de combinação, embora o seu potencial já tenha sido comprovado em trabalhos da literatura. A construção de sistemas de múltiplos classificadores usando o método de seleção envolve a busca pela estratégia de seleção, que pode ser através do agrupamento dos dados de treinamento e seleção de classificadores especializados nos dados de cada grupo encontrado. Os aprimoramentos realizados no método de seleção de classificadores ocorrem para a definição da estratégia de seleção, normalmente executada por um método manual. Por outro lado, os melhores aprimoramentos do método de combinação de classificadores foram obtidos com o uso de métodos evolucionários (automáticas) para o ajuste de parâametros. Devido à ausência da hibridização com métodos evolucionários para o aprimoramento do método de seleção; às dificuldades inerentes ao trabalho por tentativa e erro em atividades de busca e para avançoo do conhecimento sobre o potencial do método de seleção, faz-se necessária uma exploração do potencial do método de seleção usando métodos de busca evolucionários. Este trabalho explora a construção automática de sistemas de múltiplos classificadores usando o método de seleção. Nesta tese é proposto um novo método, que emprega a Otimização por Exame de Partículas e Evolução Diferencial acoplada ao Algoritmo Genético, utilizado para o aprimoramento da estratégia de seleção de classificadores. A combinação com métodos evolucionários tem o objetivo de explorar o potencial do método de seleção de classificadores, apresentando os benefícios de sua hibridização com métodos de busca evolucionários. A estratégia de seleção de classificadores adotada é composta por uma fase de agrupamento dos dados de treinamento e outra de busca por classificadores especializados para cada grupo de dados encontrado. Os experimentos realizados utilizaram os métodos K-médias e Mapas Auto-Organizáveis na fase de agrupamento e Redes Neurais Artificiais Lineares e Perceptrons de múltiplas camadas na fase de classificação. Algoritmos Evolucionários foram usados (Otimização por Exame de Partículas com ajuste dinâmico de parâmetros e Evolução Diferencial integrada a um Algoritmo Genético) no presente trabalho, com o propósito de otimizar os parâmetros e desempenho das diferentes técnicas empregadas nas fases de agrupamento e classificação. Os resultados experimentais mostraram que o método proposto possui um melhor desempenho quando comparado aos métodos manuais e supera de forma significativa a maioria dos métodos comumente usados para a construção de sistemas de múltiplos classificadores Redes Neurais Artificiais Comitês Sistemas de Múltiplos Classificadores Algoritmos Evolucionários Evolução Diferencial Otimização por Enxame de Partículas
44	Estudo e desenvolvimento de métodos para predição de doadores de sangue / Study and development of methods for prediction of blood donors Silva, Fernando Henrique da 16 February 2018 (has links) Submitted by JÚLIO HEBER SILVA (julioheber@yahoo.com.br) on 2018-02-19T11:16:14Z No. of bitstreams: 2 Dissertação - Fernando Henrique da Silva - 2018.pdf: 7574243 bytes, checksum: 54853391be8cd76fc74017985311ad09 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-02-19T11:31:02Z (GMT) No. of bitstreams: 2 Dissertação - Fernando Henrique da Silva - 2018.pdf: 7574243 bytes, checksum: 54853391be8cd76fc74017985311ad09 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-02-19T11:31:02Z (GMT). No. of bitstreams: 2 Dissertação - Fernando Henrique da Silva - 2018.pdf: 7574243 bytes, checksum: 54853391be8cd76fc74017985311ad09 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-02-16 / Hemotherapy units has difficulties to optimize the search for blood donors in emergency situations, as well as to keep their blood stocks at adequate levels. On the other hand, the use of computational techniques for prediction has obtained promissing results in several areas of knowledge, and can be seen as a fundamental tool in obtaining blood donations, however, are little explored in this sector. Given this gap, this research aimed to analyze and develop prediction techniques to optimize the search for donors with higher conversion rate to the donation, focusing on data mining techniques. For this, we first analyzed the performance of traditional literature classifiers applied to a real database, which produced unsatisfactory prediction results. Seeking for higher quality results we propose a top-k recommendation approach of blood donors, which uses heuristics to estimate a confidence degree in donation. Computational experiments show that the top-k recommendation approach achieves good results for all three developed heuristics. The support vector-based heuristic achieving 94.09% of precision among the top-10 recommended, and 99.90% of precision for top-1, for the same data set that the classifiers were not successful. It is expected that the results of this research will contribute to the academic community due to the variety of classifiers analyzed and especially due to the proposed top-k recommendations approach. In the future, this approach can be better analyzed with other databases and even improved by the development of new heuristics. In addition, it is believed that the developed top-k approach can be used in health prediction systems, with a focus on predicting blood donors, especially in emergency situations. / Unidades Hemoterápicas encontram dificuldades para otimizar a busca por doadores de sangue em situações de emergência, assim como para manter seus estoques sanguíneos em níveis adequados. Por outro lado, a utilização de técnicas computacionais de predição tem obtido ótimos resultados em várias áreas do conhecimento, podendo ser vista como uma ferramenta fundamental na obtenção de doações de sangue, contudo, são pouco exploradas neste setor. Dado esta lacuna, este trabalho objetivou em analisar e desenvolver técnicas de predição para otimizar a busca por doadores com maior taxa de conversão à doação, com foco em técnicas de mineração de dados. Para isto, primeiramente analisou-se o desempenho de classificadores tradicionais da literatura aplicados a uma base de dados real, o que produziu resultados de predição insatisfatórios. Na busca de resultados de maior qualidade foi proposta uma abordagem de recomendação dos top-k, que utiliza heurísticas para a estimar a confiança em doação. Experimentos computacionais demonstram que a abordagem de recomendação top-k alcança bons resultados para todas as três heurísticas desenvolvidas. A heurística baseada em vetores de suporte obteve taxas de precisão de 94,09% entre os top-10 recomendados, chegando a 99,90% de precisão para o top-1, para a mesma base em que não se obteve sucesso com o uso de classificadores. É esperado que os resultados deste trabalho contribuam para a comunidade acadêmica devido a variedade de classificadores analisados e principalmente pela abordagem de recomendações top-k proposta. Futuramente esta abordagem poderá ser melhor analisada com outras bases de dados e até mesmo aprimorada pelo desenvolvimento de novas heurísticas. Além disso, acredita-se que a abordagem top-k desenvolvida possa ser utilizada em sistemas predição na área da saúde, com foco na predição de doadores de sangue principalmente em situações de emergência. Classificadores Doação de sangue Sistemas de recomendação Blood donation Classifiers Recommendation systems CIENCIAS EXATAS E DA TERRA::MATEMATICA
45	Sistemas classificadores evolutivos para problemas multirrótulo / Learning classifier system for multi-label classification Rosane Maria Maffei Vallim 27 July 2009 (has links) Classificação é, provavelmente, a tarefa mais estudada na área de Aprendizado de Máquina, possuindo aplicação em uma grande quantidade de problemas reais, como categorização de textos, diagnóstico médico, problemas de bioinformática, além de aplicações comerciais e industriais. De um modo geral, os problemas de classificação podem ser categorizados quanto ao número de rótulos de classe que podem ser associados à cada exemplo de entrada. A abordagem mais investigada pela comunidade de Aprendizado de Máquina é a de classes mutuamente exclusivas. Entretanto, existe uma grande variedade de problemas importantes em que cada exemplo de entrada pode ser associado a mais de um rótulo ou classe. Esses problemas são denominados problemas de classificação multirrótulo. Os Learning Classifier Systems(LCS) constituem uma técnica de Indução de Regras de Classificação que tem como principal mecanismo de busca um Algoritmo Genético. Essa técnica busca encontrar um conjunto de regras que tenha alta precisão de classificação, que seja compreensível e que possua regras consideradas interessantes sob o ponto de vista de classificação. Apesar de existirem na literatura diversos trabalhos sobre os LCS para problemas de classificação com classes mutuamente exclusivas, pouco se tem conhecimento sobre um LCS que seja capaz de lidar com problemas multirrótulo. Dessa maneira, o objetivo desta monografia é apresentar uma proposta de LCS para problemas multirrótulo, que pretende induzir um conjunto de regras de classificação que produza um resultado eficaz e comparável com outras técnicas de classificação. De acordo com esse objetivo, apresenta-se também uma revisão bibliográfica dos temas envolvidos na proposta, que são: Sistemas Classificadores Evolutivos e Classificação Multirrótulo / Classification is probably the most studied task in the Machine Learning area, with applications in a broad number of real problems like text categorization, medical diagnosis, bioinformatics and even comercial and industrial applications. Generally, classification problems can be categorized considering the number of class labels associated to each input instance. The most studied approach by the community of Machine Learning is the one that considers mutually exclusive classes. However, there is a large variety of important problems in which each instance can be associated to more than one class label. This problems are called multi-label classification problems. Learning Classifier Systems (LCS) are a technique for rule induction which uses a Genetic Algorithm as the primary search mechanism. This technique searchs for sets of rules that have high classification accuracy and that are also understandable and interesting on the classification point of view. Although there are several works on LCS for classification problems with mutually exclusive classes, there is no record of an LCS that can deal with the multi-label classification problem. The objective of this work is to propose an LCS for multi-label classification that builds a set of classification rules which achieves results that are efficient and comparable to other multi-label methods. In accordance with this objective this work also presents a review of the themes involved: Learning Classifier Systems and Multi-label Classification Algoritmos genéticos Classificação multirrótulo Sistemas classificadores evolutivos Genetic algorithms Learning classifier systems Multi-label classification
46	Investigação de combinações de técnicas de detecção de ruído para dados de expressão gênica / Investigation of ensembles of noise detection techniques for gene expression data. Giampaolo Luiz Libralon 09 November 2007 (has links) Ruído pode ser definido como um exemplo em um conjunto de dados que aparentemente é inconsistente com o restante dos dados existentes, pois não segue o mesmo padrão dos demais. Ruídos em conjuntos de dados podem reduzir o desempenho das técnicas de Aprendizado de Máquina (AM) empregadas e aumentar o tempo de construção da hipótese induzida, assim como sua complexidade. Dados são geralmente coletados por meio de medições realizadas em um domínio de interesse. Nesse sentido, nenhum conjunto de dados é perfeito. Erros de medições, dados incompletos, errados, corrompidos ou distorcidos, falhas humanas ou dos equipamentos utilizados, dentre muitos outros fatores, contribuem para a contaminação dos dados, e isso é particularmente verdadeiro para dados com elevada dimensionalidade. Sendo assim, a detecção de ruídos é uma tarefa crítica, principalmente em ambientes que exigem segurança e confiabilidade, uma vez que a presença desses pode indicar situações que degradam o desempenho do sistema ou a segurança e confiabilidade das informações. Algoritmos para a detecção e remoção de ruídos podem aumentar a confiabilidade de conjuntos de dados ruidosos. Nesse âmbito, esse trabalho investiga técnicas de detecção de ruído baseadas em distância, em que a remoção de ruídos é feita em uma etapa de pré-processamento, aplicadas a problemas de classificação de dados de Expressão Gênica, caracterizados pela presença de ruídos, elevada dimensionalidade e complexidade. O objetivo é melhorar o desempenho das técnicas de AM empregadas para solucioná-los. Por fim, combinações de técnicas de detecção de ruído são implementadas de modo a analisar a possibilidade de melhorar, ainda mais, o desempenho obtido. / Noise can be defined as an example which seems to be inconsistent with the remaining ones in a data set. The presence of noise in data sets can decrease the performance of Machine Learning (ML) techniques in the problem analysis and also increase the time taken to build the induced hypothesis and its complexity. Data are collected from measurements made which represent a given domain of interest. In this sense, no data set is perfect. Measurement errors, incomplete, corrupted, wrong or distorted examples, equipment problems or human fails, besides many other related factors, help contaminating the data, and this is particularly true for data sets with high dimensionality. For this reason, noise detection is a critical task, specially in domains which demand security and trustworthiness, since the presence of noise can lead to situations which degrade the system performance or the security and trustworthiness of the involved information. Algorithms to detect and remove noise may increase trustworthiness of noisy data sets. Based on that, this work evaluates distance-based noise detection techniques, in which noise removal is done by a pre-processing phase, in gene expression classification problems, characterized by the presence of noise, high dimensionality and complexity. The objective is to improve the performance of ML techniques used to solve these problems. Next, ensembles of noise detection techniques are developed in order to analyze the possibility to further improve the performance obtained. Aprendizado de Máquina Combinação de Classificadores. Expressão Gênica Ruído Ensembles. Gene Expression Problems Machine Learning Noise
47	Combinação de classificadores para detecção de fraudes em sinistros de automóveis. Rodrigues, Luis Alexandre 05 August 2014 (has links) Made available in DSpace on 2016-03-15T19:37:51Z (GMT). No. of bitstreams: 1 Luis Alexandre Rodrigues.pdf: 1364668 bytes, checksum: ac6c4273730fb6f75f7a0ceead7e4c1f (MD5) Previous issue date: 2014-08-05 / Universidade Presbiteriana Mackenzie / This work presents a process to detect suspected cases of fraud at automobile claims dataset, which is evaluated the economic created by it. Because of a detection process presenting misclassific ation, it is necessary to evaluate the financial economy made by the process not only its accuracy in detecting suspected cases of fraud. This process uses a combination of classifiers, with C4.5 Decision Tree, Naive Bayes and Support Vector Machine, const ructed by samples of the data set with automobile claims. This way, the process defined by this work can obtain the balance between the accuracy of classification and the financial economy. / Este trabalho apresenta um processo para detectar casos suspeitos de fraude em conjunto de dados com sinistros de automóvel, em que é avaliada a economia financeira gerada por ele. Devido ao fato de um processo de detecção apresentar erros de classificação, é necessário avaliar a economia financeira apresentada pelo processo e não somente a sua precisão na detecção de casos suspeitos de fraude. Este processo utiliza a combinação de classificadores, sendo Árvore de Decisão C4.5, Naive Bayes e Support Vector Machine, construídos por amostras do conjunto de dados com sinistros de automóvel. Desta forma, o processo definido por este trabalho pode obter o equilíbrio entre a precisão da classificação e a economia financeira. detecção de fraude combinação de classificadores mineração de dados fraud detection multi classifier data mining CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
48	Performance financeira da carteira na avaliação de modelos de análise e concessão de crédito: uma abordagem baseada em aprendizagem estatística / Financial performance portfolio to evaluate and select analyses and credit models: An approach based on Statistical Learning Rodrigo Alves Silva 05 September 2014 (has links) Os modelos de análise e decisão de concessão de crédito buscam associar o perfil do tomador de crédito à probabilidade do não pagamento de obrigações contraídas, identificando assim o risco associado ao tomador e auxiliando a firma a decidir pela aprovação ou negação da solicitação de crédito. Atualmente este campo de pesquisa tem ganhado importância no cenário nacional - pela intensificação da atividade de crédito no país com grande participação dos bancos públicos neste processo - e internacional - pelo aumento das preocupações com potenciais danos à economia derivados de eventos de default. Tal quadro fez com que fossem construídos e adaptados diversos modelos e métodos à análise de risco de crédito tanto para consumidores como para empresas. Estes modelos são testados e comparados com base na acurácia de previsão ou de métricas de otimização estatística. Este é um procedimento que pode não se mostrar eficiente do ponto de vista financeiro, ao mesmo tempo em que dificulta a interpretação e tomada de decisão por parte da firma quanto a qual o melhor modelo, gerando uma lacuna pelo desprendimento observado entre a decisão de qual o modelo a ser adotado e o objetivo financeiro da empresa. Tendo em vista que o desempenho financeiro é um dos principais indicadores de qualquer procedimento gerencial, o presente estudo objetivou preencher a esta lacuna analisando o desempenho financeiro de carteiras de crédito formadas por técnicas de aprendizagem estatística utilizadas atualmente na classificação e análise de risco de crédito em pesquisas nacionais e internacionais. A pesquisa selecionou as técnicas: análise discriminante, regressão logística, redes bayesianas Naïve Bayes, kdB-1, kdB-2, SVC e SVM e aplicou tais técnicas junto à base de dados German Credit Data Set. Os resultados foram analisados e comparados inicialmente em termos de acurácia e custos por erro de classificação. Adicionalmente a pesquisa propôs o emprego de quatro métricas financeiras (RFC, PLR, RAROC e IS), encontrando variações quanto aos resultados produzidos por cada técnica. Estes resultados sugerem variações quanto a sequência de eficiência e consequentemente de emprego das técnicas, demonstrando a importância da consideração destas métricas para a análise e decisão de seleção de modelos de classificação ótimos. / Analysis and decision credit concession models search for relating the borrower\'s credit profile to the nonpayment probability of their obligations, identifying risks related to borrower and helping decision firm to approve or deny the credit request. Currently this search field has increased in Brazilian scenario - by credit activity intensification into the country with a large public banks sharing - and in the international scenario - by growing concerns about economy potential damages resulting from default events. This position leads the construction and adaptation of several models and methods by credit risk analysis from both consumers and companies. These models have been tested and compared based on prediction of accuracy or other statistical optimization metrics. This proceed is eventually not effective when analyzed by a financial standpoint, in the same time that affects the understanding and decision of the enterprise about the best model, creating a gap in the decision model choice and the firm financial goals. Given that the financial performance is a foremost indicator of any management procedure, this study aimed to address this gap by the financial performance analysis of loan portfolios formed by statistical learning techniques currently used in the classification and credit risk analysis in national and international researches. The selected techniques (discriminant analysis, logistic regression, Bayesian networks Naïve Bayes , 1 - KDB , KDB - 2 , SVC and SVM) were applied to the German Credit Data Set and their results were initially analyzed and compared in terms of accuracy and misclassification costs. Regardless of these metrics the research has proposed to use four financial metrics (RFC, PLR, RAROC and IS), finding variations in the results of each statistical learning techniques. These results suggest variations in the sequence of efficiency and, ultimately, techniques choice, demonstrating the importance of considering these metrics for analysis and selection of decision models of optimal classification. Aprendizagem Estatística Classificadores Desempenho Financeiro Risco de crédito Classifiers Credit risk Financial Performance Statistical Learning
49	Combinação de Classificadores para Reconhecimento de Padrões / Not available Paulo Sérgio Prampero 16 March 1998 (has links) O cérebro humano é formado por um conjunto de neurônios de diferentes tipos, cada um com sua especialidade. A combinação destes diferentes tipos de neurônios é um dos aspectos responsáveis pelo desempenho apresentado pelo cérebro na realização de várias tarefas. Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado no sistema nervoso e que adquirem conhecimento através da experiência. Uma alternativa para melhorar o desempenho das Redes Neurais Artificiais é a utilização de técnicas de Combinação de Classificadores. Estas técnicas de combinação exploram as diferenças e as semelhanças das redes para a obtenção de resultados melhores. Dentre as principais aplicações de Redes Neurais Artificiais está o Reconhecimento de Padrões. Neste trabalho, foram utilizadas técnicas de Combinação de Classificadores para a combinação de Redes Neurais Artificiais em problemas de Reconhecimento de Padrões. / The human brain is formed by neurons of different types, each one with its own speciality. The combination of theses different types of neurons is one of the main features responsible for the brain performance in severa! tasks. Artificial Neural Networks are computation technics whose mathematical model is based on the nervous system and learns new knowledge by experience. An alternative to improve the performance of Artificial Neural Networks is the employment of Classifiers Combination techniques. These techniques of combination explore the difference and the similarity of the networks to achieve better performance. The main application of Artificial Neural Networks is Pattern Recognition. In this work, Classifiers Combination techniques were utilized to combine Artificial Neural Networks to solve Pattern Recognition problems. Combinação de classificadores Reconhecimento de padrões Redes neurais artificiais Artificial neural networks Classifiers combination Pattern recognition
50	Uma An?lise Comparativa entre Sistemas de Combina??o de Classificadores com Distribui??o Vertical dos Dados Santana, Laura Emmanuella Alves dos Santos 01 February 2008 (has links) Made available in DSpace on 2014-12-17T15:47:44Z (GMT). No. of bitstreams: 1 LauraEASS.pdf: 1648653 bytes, checksum: 0aa1d6a5cd26175688d09f2c09459503 (MD5) Previous issue date: 2008-02-01 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / In systems that combine the outputs of classification methods (combination systems), such as ensembles and multi-agent systems, one of the main constraints is that the base components (classifiers or agents) should be diverse among themselves. In other words, there is clearly no accuracy gain in a system that is composed of a set of identical base components. One way of increasing diversity is through the use of feature selection or data distribution methods in combination systems. In this work, an investigation of the impact of using data distribution methods among the components of combination systems will be performed. In this investigation, different methods of data distribution will be used and an analysis of the combination systems, using several different configurations, will be performed. As a result of this analysis, it is aimed to detect which combination systems are more suitable to use feature distribution among the components / Em sistemas que combinam as sa?das de classificadores de padr?es, sistemas de combina??o, como comit?s e sistemas multiagentes para classifica??o, um dos principais problemas ? que os componentes do sistema (classificadores ou agentes) devem ser diversos entre si. Em outras palavras, n?o existe ganho de desempenho em sistemas formados por um conjunto de componentes id?nticos. Um modo de aumentar a diversidade do sistema ? distribuir os dados do padr?o entre os classificadores que comp?em o sistema. Neste trabalho ser? feita uma investiga??o sobre o impacto do uso de t?cnicas de distribui??o de dados, mais especificamente distribui??o de caracter?sticas, entre os componentes de sistemas de combina??o de classificadores. Nesta investiga??o, diferentes t?cnicas de distribui??o de caracter?sticas ser?o usadas e uma an?lise comparativa entre diferentes sistemas de combina??o, usando diferentes configura??es, ser? feita. Como resultado desta an?lise, espera-se detectar que sistemas de combina??o s?o mais adequados para usar distribui??o de caracter?sticas entre os componentes Distribui??o Vertical de Dados Comit?s de Classificadores Sistemas Multiagentes Vertical Data Distribution Classifier Combination Systems Ensembles Multiagent Systems

Search results