1 |
[en] RÉNYI ENTROPY AND CAUCHY-SCHWARTZ MUTUAL INFORMATION APPLIED TO THE MIFS-U VARIABLES SELECTION ALGORITHM: A COMPARATIVE STUDY / [pt] ENTROPIA DE RÉNYI E INFORMAÇÃO MÚTUA DE CAUCHY-SCHWARTZ APLICADAS AO ALGORITMO DE SELEÇÃO DE VARIÁVEIS MIFS-U: UM ESTUDO COMPARATIVOLEONARDO BARROSO GONCALVES 08 September 2008 (has links)
[pt] A presente dissertação aborda o algoritmo de Seleção de
Variáveis Baseada em Informação Mútua sob Distribuição de
Informação Uniforme (MIFS-U) e expõe um método alternativo
para estimação da entropia e da informação mútua, medidas
que constituem a base deste algoritmo de seleção.
Este método tem, por fundamento, a informação mútua
quadrática de Cauchy-Schwartz e a entropia quadrática de
Rényi, combinada, no caso de variáveis contínuas, ao método
de estimação de densidade Janela de Parzen. Foram
realizados experimentos com dados reais de domínio público,
sendo tal método comparado com outro, largamente utilizado,
que adota a definição de entropia de Shannon e faz uso, no
caso de variáveis contínuas, do estimador de densidade
histograma. Os resultados mostram pequenas variações entre
os dois métodos, mas que sugerem uma investigação futura
através de um classificador, tal como Redes Neurais, para
avaliar qualitativamente tais resultados à luz do objetivo
final que consiste na maior exatidão de classificação. / [en] This dissertation approaches the algorithm of Selection of
Variables under Mutual Information with Uniform Distribution
(MIFS-U) and presents an alternative method for estimate
entropy and mutual information, measures that
constitute the base of this selection algorithm. This method
has, for foundation, the Cauchy-Schwartz quadratic mutual
information and the quadratic Rényi entropy, combined, in
the case of continuous variables, with Parzen Window
density estimation. Experiments were accomplished with real
public domain data, being such method compared with other,
broadly used, that adopts the Shannon entropy definition and
makes use, in the case of continuous variables, of the
histogram density estimator The results show small
variations among the two methods, what suggests a future
investigation through a classifier, such as Neural
Networks, to evaluate this results, qualitatively, in the
light of the final objective that consists of the biggest
sort exactness.
|
2 |
[en] RELAPSE RISK ESTIMATION IN CHILDREN WITH ACUTE LYMPHOBLASTIC LEUKEMIA BY USING NEURAL NETWORKS / [pt] ESTIMAÇÃO DO RISCO DE RECIDIVA EM CRIANÇAS PORTADORAS DE LEUCEMIA LINFOBLÁSTICA AGUDA USANDO REDES NEURAISJOSE LEONARDO RIBEIRO MACRINI 21 December 2004 (has links)
[pt] Esta tese propõe uma metodologia, baseada em procedimentos
quantitativos, para estimação do risco de evento adverso
(recaída ou morte) em
crianças portadoras de Leucemia Linfoblástica Aguda (LLA).
A metodologia
proposta foi implementada e analisada utilizando dados de
grupo de crianças
diagnosticadas no Setor de Hematologia do Instituto de
Puericultura e Pediatria
Martagão Gesteira (IPPMG) da UFRJ e no Serviço de
Hematologia Hospital
Universitário Pedro Ernesto (HUPE) da UERJ que constituem
uma considerável
parcela dos casos de LLA na infância registrados no Rio de
Janeiro nos últimos
anos.
A estimação do risco de recaída foi realizada através de um
modelo de
Redes Neurais após uma seqüência de procedimentos de pré-
tratamento de
variáveis e de refinamentos do método no que concerne a
saída alvo da rede.
O tratamento das variáveis é fundamental uma vez que o
número reduzido
de amostras é uma característica intrínseca deste problema.
Embora a LLA seja
o câncer mais freqüente a infância, sua incidência é de
aproximadamente 1 caso
por 100 mil habitantes por ano. Os resultados encontrados
foram satisfatórios obtendo-se um percentual de
acerto de 93% (fora da amostra) para os pacientes que
recaíram quando
comparados com o método classicamente utilizado na clínica
médica para a
avaliação do risco de recidiva (método do grupo BFM).
Espera-se que os
resultados obtidos possam vir a dar subsídios às condutas
médicas em relação à
estimativa do risco de recidiva dos pacientes, portanto,
podendo vir a ser útil na
modulação da intensidade da terapêutica. / [en] In this it is proposed a methodology, based on quantitative
procedure, to
estimate the adverse event risk (relapse or death) in Acute
Lymphoblastic
Leukemia (ALL) in children. This methodology was
implemented and analyzed
in a dataset composed by children diagnosed and treated at
the hematology
service of the Instituto de Puericultura e Pediatria
Martagão Gesteira (IPPMG)
in the Federal University of Rio de Janeiro and of the
Hospital Universitário
Pedro Ernesto (HUPE) in the University of state of Rio de
Janeiro. This group
constitutes a considerable fraction of the ALL cases in
childhood registered in
the last few years in Rio de Janeiro.
The relapse risk was estimated by a Neural Networks model
after a
sequence of variable pre-treatment procedures. This
treatment has a fundamental
importance due to the small number of cases (an intrinsic
characteristic of this
problem). Although, the ALL is the most frequent cancer in
childhood, it
incidence is approximately just 1 case for 100 000
inhabitants by year.
The obtained results may be considered excellent when
compared with the
classical risk estimative method used in the medical
clinics (BFM risk). A
perceptual of successes of 93% (out-of-sample) in no-
relapse patients was
achieved. We expect that the obtained results may subsidize
medical conduct
concerning the risk of adverse event and so it could be
useful in the treatment
intensity modulation.
|
3 |
[en] SELECTION OF VARIABLES AND PATTERN CLASSIFICATION BY NEURAL NETWORKS AS HELP TO THE DIAGNOSTIC OF HEART DISEASE / [pt] SELEÇÃO DE VARIÁVEIS E CLASSIFICAÇÃO DE PADRÕES POR REDES NEURAIS COMO AUXÍLIO AO DIAGNÓSTICO DE DOENÇA CARDÍACATHIAGO BAPTISTA RODRIGUES 09 April 2007 (has links)
[pt] Esta dissertação propõe uma metodologia, baseada em
procedimentos
quantitativos, para auxiliar o diagnóstico de indivíduos
portadores de doença
cardíaca. A metodologia proposta foi implementada e
analisada em um grupo de
indivíduos do banco de dados público intitulado Heart
Disease Database (Base
de Dados pública de Doença Cardíaca) (Aha, atualizado em
2001), diagnosticados
nas cidades de Cleveland e Long Beach, nos Estados Unidos.
Os resultados
obtidos neste estudo foram comparados aos resultados de
outros autores
encontrados na literatura, de forma a se ter uma medida da
qualidade dos
resultados aqui obtidos. Foram utilizadas também outras
técnicas de classificação
de padrões conhecidas na literatura, denominadas Análise
Discriminante e
Algoritmo C4.5, de forma a estabelecer comparações com os
resultados obtidos
nesta dissertação utilizando Redes Neurais, e aplicar a
metodologia sugerida na
divisão dos conjuntos de treinamento/generalização. Os
resultados obtidos foram
satisfatórios. Um percentual de acerto médio de 91,0 % foi
atingido, enquanto que
outros resultados de estudos usando a mesma base de dados
alcançaram
percentuais de acerto médio de 83,0 % (Ho & Chou, 2001) e
83,5 % (Hu, Li, Cai
& Xu, 2004). O desempenho da Rede Neural também foi melhor
quando
comparado ao da Análise Discriminante e do Algoritmo C4.5.
A metodologia de
divisão dos conjuntos de treinamento/generalização
sugerida nesta dissertação
promoveu melhorias em todas as três técnicas de
classificação de padrões
utilizadas. Acredita-se que os resultados obtidos poderão
auxiliar as condutas
médicas em relação ao diagnóstico de doença cardíaca,
podendo, portanto, vir a
ser úteis na prevenção e/ou tratamento de doenças
cardíacas. / [en] This dissertation proposes a methodology, established in
quantitative
procedures, to assist the diagnostic of individuals with
heart disease. The
proposed methodology was implemented and analyzed in a
group of individuals
of the public database called Heart Disease Database (Aha,
current in 2001),
diagnosed in the cities of Cleveland and Long Beach, in
the United States. The
results gotten in this study had been compared with the
results of other authors
found in literature to have a measure of the quality of
the results gotten here.
Others techniques of classification of standards known in
literature had also been
used, called Discriminate Analysis and C4.5 Algorithm, to
establish
comparisons with the results gotten in this dissertation
using Neural Networks,
and to apply the methodology suggested in the division of
the sets of
training/generalization. The gotten results were
satisfactory. A percentage of
average rightness of 91.0 % was reached, whereas other
results of studies using
the same database had reached percentages of average
rightness of 83.0 % (Ho &
Chou, 2001) and 83.5 % (Hu, Li, Cai & Xu, 2004). The
performance of the Neural
Network was also better when compared with Discriminate
Analysis and C4.5
Algorithm. The methodology of division of the sets of
training/generalization
suggested in this dissertation promoted improvements in
all the three used
techniques of classification of standards. It´s believable
that the gotten results will
be able to assist the medical behaviors in relation to the
diagnostic of heart
disease, becoming useful in the prevention and/or
treatment of heart diseases.
|
Page generated in 0.0524 seconds