Global ETD Search

1	[en] RÉNYI ENTROPY AND CAUCHY-SCHWARTZ MUTUAL INFORMATION APPLIED TO THE MIFS-U VARIABLES SELECTION ALGORITHM: A COMPARATIVE STUDY / [pt] ENTROPIA DE RÉNYI E INFORMAÇÃO MÚTUA DE CAUCHY-SCHWARTZ APLICADAS AO ALGORITMO DE SELEÇÃO DE VARIÁVEIS MIFS-U: UM ESTUDO COMPARATIVO LEONARDO BARROSO GONCALVES 08 September 2008 (has links) [pt] A presente dissertação aborda o algoritmo de Seleção de Variáveis Baseada em Informação Mútua sob Distribuição de Informação Uniforme (MIFS-U) e expõe um método alternativo para estimação da entropia e da informação mútua, medidas que constituem a base deste algoritmo de seleção. Este método tem, por fundamento, a informação mútua quadrática de Cauchy-Schwartz e a entropia quadrática de Rényi, combinada, no caso de variáveis contínuas, ao método de estimação de densidade Janela de Parzen. Foram realizados experimentos com dados reais de domínio público, sendo tal método comparado com outro, largamente utilizado, que adota a definição de entropia de Shannon e faz uso, no caso de variáveis contínuas, do estimador de densidade histograma. Os resultados mostram pequenas variações entre os dois métodos, mas que sugerem uma investigação futura através de um classificador, tal como Redes Neurais, para avaliar qualitativamente tais resultados à luz do objetivo final que consiste na maior exatidão de classificação. / [en] This dissertation approaches the algorithm of Selection of Variables under Mutual Information with Uniform Distribution (MIFS-U) and presents an alternative method for estimate entropy and mutual information, measures that constitute the base of this selection algorithm. This method has, for foundation, the Cauchy-Schwartz quadratic mutual information and the quadratic Rényi entropy, combined, in the case of continuous variables, with Parzen Window density estimation. Experiments were accomplished with real public domain data, being such method compared with other, broadly used, that adopts the Shannon entropy definition and makes use, in the case of continuous variables, of the histogram density estimator The results show small variations among the two methods, what suggests a future investigation through a classifier, such as Neural Networks, to evaluate this results, qualitatively, in the light of the final objective that consists of the biggest sort exactness. [pt] ENTROPIA [en] ENTROPY [pt] INFORMACAO MUTUA [en] MUTUAL INFORMATION [pt] SELECAO DE VARIAVEIS [en] SELECTION OF VARIABLES [pt] JANELAS DE PARZEN [en] PARZEN WINDOWS
2	[en] RELAPSE RISK ESTIMATION IN CHILDREN WITH ACUTE LYMPHOBLASTIC LEUKEMIA BY USING NEURAL NETWORKS / [pt] ESTIMAÇÃO DO RISCO DE RECIDIVA EM CRIANÇAS PORTADORAS DE LEUCEMIA LINFOBLÁSTICA AGUDA USANDO REDES NEURAIS JOSE LEONARDO RIBEIRO MACRINI 21 December 2004 (has links) [pt] Esta tese propõe uma metodologia, baseada em procedimentos quantitativos, para estimação do risco de evento adverso (recaída ou morte) em crianças portadoras de Leucemia Linfoblástica Aguda (LLA). A metodologia proposta foi implementada e analisada utilizando dados de grupo de crianças diagnosticadas no Setor de Hematologia do Instituto de Puericultura e Pediatria Martagão Gesteira (IPPMG) da UFRJ e no Serviço de Hematologia Hospital Universitário Pedro Ernesto (HUPE) da UERJ que constituem uma considerável parcela dos casos de LLA na infância registrados no Rio de Janeiro nos últimos anos. A estimação do risco de recaída foi realizada através de um modelo de Redes Neurais após uma seqüência de procedimentos de pré- tratamento de variáveis e de refinamentos do método no que concerne a saída alvo da rede. O tratamento das variáveis é fundamental uma vez que o número reduzido de amostras é uma característica intrínseca deste problema. Embora a LLA seja o câncer mais freqüente a infância, sua incidência é de aproximadamente 1 caso por 100 mil habitantes por ano. Os resultados encontrados foram satisfatórios obtendo-se um percentual de acerto de 93% (fora da amostra) para os pacientes que recaíram quando comparados com o método classicamente utilizado na clínica médica para a avaliação do risco de recidiva (método do grupo BFM). Espera-se que os resultados obtidos possam vir a dar subsídios às condutas médicas em relação à estimativa do risco de recidiva dos pacientes, portanto, podendo vir a ser útil na modulação da intensidade da terapêutica. / [en] In this it is proposed a methodology, based on quantitative procedure, to estimate the adverse event risk (relapse or death) in Acute Lymphoblastic Leukemia (ALL) in children. This methodology was implemented and analyzed in a dataset composed by children diagnosed and treated at the hematology service of the Instituto de Puericultura e Pediatria Martagão Gesteira (IPPMG) in the Federal University of Rio de Janeiro and of the Hospital Universitário Pedro Ernesto (HUPE) in the University of state of Rio de Janeiro. This group constitutes a considerable fraction of the ALL cases in childhood registered in the last few years in Rio de Janeiro. The relapse risk was estimated by a Neural Networks model after a sequence of variable pre-treatment procedures. This treatment has a fundamental importance due to the small number of cases (an intrinsic characteristic of this problem). Although, the ALL is the most frequent cancer in childhood, it incidence is approximately just 1 case for 100 000 inhabitants by year. The obtained results may be considered excellent when compared with the classical risk estimative method used in the medical clinics (BFM risk). A perceptual of successes of 93% (out-of-sample) in no- relapse patients was achieved. We expect that the obtained results may subsidize medical conduct concerning the risk of adverse event and so it could be useful in the treatment intensity modulation. [pt] REDES NEURAIS [en] NEURAL NETWORKS [pt] CLASSIFICACAO [en] CLASSIFICATION [pt] RISCO [en] RISK [pt] INFORMACAO MUTUA [en] MUTUAL INFORMATION [pt] SELECAO DE VARIAVEIS [en] SELECTION OF VARIABLES [pt] LEUCEMIA LINFOBLASTICA AGUDA [en] ACUTE LYMPHOCYTIC LEUKEMIA
3	[en] SELECTION OF VARIABLES AND PATTERN CLASSIFICATION BY NEURAL NETWORKS AS HELP TO THE DIAGNOSTIC OF HEART DISEASE / [pt] SELEÇÃO DE VARIÁVEIS E CLASSIFICAÇÃO DE PADRÕES POR REDES NEURAIS COMO AUXÍLIO AO DIAGNÓSTICO DE DOENÇA CARDÍACA THIAGO BAPTISTA RODRIGUES 09 April 2007 (has links) [pt] Esta dissertação propõe uma metodologia, baseada em procedimentos quantitativos, para auxiliar o diagnóstico de indivíduos portadores de doença cardíaca. A metodologia proposta foi implementada e analisada em um grupo de indivíduos do banco de dados público intitulado Heart Disease Database (Base de Dados pública de Doença Cardíaca) (Aha, atualizado em 2001), diagnosticados nas cidades de Cleveland e Long Beach, nos Estados Unidos. Os resultados obtidos neste estudo foram comparados aos resultados de outros autores encontrados na literatura, de forma a se ter uma medida da qualidade dos resultados aqui obtidos. Foram utilizadas também outras técnicas de classificação de padrões conhecidas na literatura, denominadas Análise Discriminante e Algoritmo C4.5, de forma a estabelecer comparações com os resultados obtidos nesta dissertação utilizando Redes Neurais, e aplicar a metodologia sugerida na divisão dos conjuntos de treinamento/generalização. Os resultados obtidos foram satisfatórios. Um percentual de acerto médio de 91,0 % foi atingido, enquanto que outros resultados de estudos usando a mesma base de dados alcançaram percentuais de acerto médio de 83,0 % (Ho & Chou, 2001) e 83,5 % (Hu, Li, Cai & Xu, 2004). O desempenho da Rede Neural também foi melhor quando comparado ao da Análise Discriminante e do Algoritmo C4.5. A metodologia de divisão dos conjuntos de treinamento/generalização sugerida nesta dissertação promoveu melhorias em todas as três técnicas de classificação de padrões utilizadas. Acredita-se que os resultados obtidos poderão auxiliar as condutas médicas em relação ao diagnóstico de doença cardíaca, podendo, portanto, vir a ser úteis na prevenção e/ou tratamento de doenças cardíacas. / [en] This dissertation proposes a methodology, established in quantitative procedures, to assist the diagnostic of individuals with heart disease. The proposed methodology was implemented and analyzed in a group of individuals of the public database called Heart Disease Database (Aha, current in 2001), diagnosed in the cities of Cleveland and Long Beach, in the United States. The results gotten in this study had been compared with the results of other authors found in literature to have a measure of the quality of the results gotten here. Others techniques of classification of standards known in literature had also been used, called Discriminate Analysis and C4.5 Algorithm, to establish comparisons with the results gotten in this dissertation using Neural Networks, and to apply the methodology suggested in the division of the sets of training/generalization. The gotten results were satisfactory. A percentage of average rightness of 91.0 % was reached, whereas other results of studies using the same database had reached percentages of average rightness of 83.0 % (Ho & Chou, 2001) and 83.5 % (Hu, Li, Cai & Xu, 2004). The performance of the Neural Network was also better when compared with Discriminate Analysis and C4.5 Algorithm. The methodology of division of the sets of training/generalization suggested in this dissertation promoted improvements in all the three used techniques of classification of standards. It´s believable that the gotten results will be able to assist the medical behaviors in relation to the diagnostic of heart disease, becoming useful in the prevention and/or treatment of heart diseases. [pt] REDES NEURAIS [en] NEURAL NETWORKS [pt] CLASSIFICACAO [en] CLASSIFICATION [pt] INFORMACAO MUTUA [en] MUTUAL INFORMATION [pt] SELECAO DE VARIAVEIS [en] SELECTION OF VARIABLES [pt] DIAGNOSTICO [en] DIAGNOSTIC [pt] DOENCA CARDIACA [en] HEART DISEASE

1

Page generated in 0.0524 seconds