Global ETD Search

1	Classifica??o com algoritmo AdaBoost.M1 : o mito do limiar de erro de treinamento Le?es Neto, Ant?nio do Nascimento 20 November 2017 (has links) Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-02-16T13:18:07Z No. of bitstreams: 1 Ant?nio_do_Nascimento_Le?es_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) / Approved for entry into archive by Caroline Xavier (caroline.xavier@pucrs.br) on 2018-02-22T16:34:51Z (GMT) No. of bitstreams: 1 Ant?nio_do_Nascimento_Le?es_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) / Made available in DSpace on 2018-02-22T16:40:19Z (GMT). No. of bitstreams: 1 Ant?nio_do_Nascimento_Le?es_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) Previous issue date: 2017-11-20 / The accelerated growth of data repositories, in the different areas of activity, opens space for research in the area of data mining, in particular, with the methods of classification and combination of classifiers. The Boosting method is one of them, which combines the results of several classifiers in order to obtain better results. The main purpose of this dissertation is the experimentation of alternatives to increase the effectiveness and performance of the algorithm AdaBoost.M1, which is the implementation often employed by the Boosting method. An empirical study was perfered taking into account stochastic aspects trying to shed some light on an obscure internal parameter, in which algorithm creators and other researchers assumed that the training error threshold should be correlated with the number of classes in the target data set and logically, most data sets should use a value of 0.5. In this paper, we present an empirical evidence that this is not a fact, but probably a myth originated by the mistaken application of the theoretical assumption of the joint effect. To achieve this goal, adaptations were proposed for the algorithm, focusing on finding a better suggestion to define this threshold in a general case. / O crescimento acelerado dos reposit?rios de dados, nas diversas ?reas de atua??o, abre espa?o para pesquisas na ?rea da minera??o de dados, em espec?fico, com os m?todos de classifica??o e de combina??o de classificadores. O Boosting ? um desses m?todos, e combina os resultados de diversos classificadores com intuito de obter melhores resultados. O prop?sito central desta disserta??o ? responder a quest?o de pesquisa com a experimenta??o de alternativas para aumentar a efic?cia e o desempenho do algoritmo AdaBoost.M1 que ? a implementa??o frequentemente empregada pelo Boosting. Foi feito um estudo emp?rico levando em considera??o aspectos estoc?sticos tentando lan?ar alguma luz sobre um par?metro interno obscuro em que criadores do algoritmo e outros pesquisadores assumiram que o limiar de erro de treinamento deve ser correlacionado com o n?mero de classes no conjunto de dados de destino e, logicamente, a maioria dos conjuntos de dados deve usar um valor de 0.5. Neste trabalho, apresentamos evid?ncias emp?ricas de que isso n?o ? um fato, mas provavelmente um mito originado pela aplica??o da primeira defini??o do algoritmo. Para alcan?ar esse objetivo, foram propostas adapta??es para o algoritmo, focando em encontrar uma sugest?o melhor para definir esse limiar em um caso geral. Minera??o de dados Classifica??o Combina??o de classificadores Classification Boosting AdaBoost.M1 Data Mining Ensemble Methods
2	Dilema da diversidade-acur?cia: um estudo emp?rico no contexto de multiclassificadores Oliveira, Diogo Fagundes de 01 September 2008 (has links) Made available in DSpace on 2014-12-17T15:47:49Z (GMT). No. of bitstreams: 1 DiogoFO.pdf: 866073 bytes, checksum: bf59c2597aef9b7382b7e14bd4914265 (MD5) Previous issue date: 2008-09-01 / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico / Multi-classifier systems, also known as ensembles, have been widely used to solve several problems, because they, often, present better performance than the individual classifiers that form these systems. But, in order to do so, it s necessary that the base classifiers to be as accurate as diverse among themselves this is also known as diversity/accuracy dilemma. Given its importance, some works have investigate the ensembles behavior in context of this dilemma. However, the majority of them address homogenous ensemble, i.e., ensembles composed only of the same type of classifiers. Thus, motivated by this limitation, this thesis, using genetic algorithms, performs a detailed study on the dilemma diversity/accuracy for heterogeneous ensembles / Sistemas Multiclassificadores, tamb?m conhecidos como comit?s de classificadores, t?m sido amplamente utilizados para resolver os mais variados problemas, pois em geral t?m melhores desempenhos que os classificadores base que formam esses sistemas. Para que isso ocorra, por?m, ? necess?rio que os classificadores base sejam t?o acurados quanto diversos entre si isso ? conhecido como dilema da diversidade-acur?cia. Dado a sua import?ncia, alguns trabalhos sobre o estudo do omportamento dos comit?s no contexto desse dilema foram propostos. Entretanto, a maioria dos trabalhos estudou tal problema para comit?s homog?neos, ou seja, comit?s formados apenas por classificadores do mesmo tipo. Sendo assim, motivado por esta limita??o, esta disserta??o, usando algoritmos gen?ticos, efetua um estudo mais detalhado sobre o dilema da diversidade-acur?cia em comit?s heterog?neos Algoritmo gen?tico multiobjetivo Comit?s de classificadores Ensembles
3	Uma An?lise Comparativa entre Sistemas de Combina??o de Classificadores com Distribui??o Vertical dos Dados Santana, Laura Emmanuella Alves dos Santos 01 February 2008 (has links) Made available in DSpace on 2014-12-17T15:47:44Z (GMT). No. of bitstreams: 1 LauraEASS.pdf: 1648653 bytes, checksum: 0aa1d6a5cd26175688d09f2c09459503 (MD5) Previous issue date: 2008-02-01 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / In systems that combine the outputs of classification methods (combination systems), such as ensembles and multi-agent systems, one of the main constraints is that the base components (classifiers or agents) should be diverse among themselves. In other words, there is clearly no accuracy gain in a system that is composed of a set of identical base components. One way of increasing diversity is through the use of feature selection or data distribution methods in combination systems. In this work, an investigation of the impact of using data distribution methods among the components of combination systems will be performed. In this investigation, different methods of data distribution will be used and an analysis of the combination systems, using several different configurations, will be performed. As a result of this analysis, it is aimed to detect which combination systems are more suitable to use feature distribution among the components / Em sistemas que combinam as sa?das de classificadores de padr?es, sistemas de combina??o, como comit?s e sistemas multiagentes para classifica??o, um dos principais problemas ? que os componentes do sistema (classificadores ou agentes) devem ser diversos entre si. Em outras palavras, n?o existe ganho de desempenho em sistemas formados por um conjunto de componentes id?nticos. Um modo de aumentar a diversidade do sistema ? distribuir os dados do padr?o entre os classificadores que comp?em o sistema. Neste trabalho ser? feita uma investiga??o sobre o impacto do uso de t?cnicas de distribui??o de dados, mais especificamente distribui??o de caracter?sticas, entre os componentes de sistemas de combina??o de classificadores. Nesta investiga??o, diferentes t?cnicas de distribui??o de caracter?sticas ser?o usadas e uma an?lise comparativa entre diferentes sistemas de combina??o, usando diferentes configura??es, ser? feita. Como resultado desta an?lise, espera-se detectar que sistemas de combina??o s?o mais adequados para usar distribui??o de caracter?sticas entre os componentes Distribui??o Vertical de Dados Comit?s de Classificadores Sistemas Multiagentes Vertical Data Distribution Classifier Combination Systems Ensembles Multiagent Systems

1

Page generated in 0.0934 seconds