Spelling suggestions: "subject:"redução dde substâncias"" "subject:"redução dee substâncias""
1 |
Metodologia para avaliar técnicas de redução de protótipos: protótipos gerados versus protótipos selecionadosPereira, Luciano de Santana 17 July 2013 (has links)
Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-11T18:44:57Z
No. of bitstreams: 2
Dissertaçao Luciano Pereira.pdf: 1413296 bytes, checksum: 608b11e654f960ce7a6787138b9b1bd0 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:10:24Z (GMT) No. of bitstreams: 2
Dissertaçao Luciano Pereira.pdf: 1413296 bytes, checksum: 608b11e654f960ce7a6787138b9b1bd0 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:10:24Z (GMT). No. of bitstreams: 2
Dissertaçao Luciano Pereira.pdf: 1413296 bytes, checksum: 608b11e654f960ce7a6787138b9b1bd0 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-07-17 / T´ecnicas de aprendizagem de m´aquina baseadas em instˆancias s˜ao utilizadas em v´arias
aplicac¸ ˜oes, como, por exemplo, reconhecimento de faces, voz e digitais, na medicina para
auxiliar m´edicos na detecc¸ ˜ao de neoplasias, entre outras. Geralmente, essas t´ecnicas s˜ao submetidas
a grandes conjuntos de dados, fazendo com que haja necessidade de grande espac¸o em
mem´oria para processamento e armazenamento, al´em do elevado custo computacional para
a classificac¸ ˜ao. Com o objetivo de minimizar esses problemas, as t´ecnicas de reduc¸ ˜ao de
instˆancias buscam reduzir o tamanho do conjunto de dados, escolhendo ou produzindo elementos
que consigam represent´a-lo, reduzindo a necessidade de mem´oria para o armazenamento do
conjunto de dados, o custo computacional e minimizando a taxa de erro. Existem, atualmente,
dois ramos da pesquisa que buscam a reduc¸ ˜ao de instˆancias: a selec¸ ˜ao de instˆancias, que faz
a reduc¸ ˜ao escolhendo algumas instˆancias representantes de todo o conjunto de treinamento e
as t´ecnicas de gerac¸ ˜ao de prot´otipos que buscam a reduc¸ ˜ao de instˆancias, produzindo novos
prot´otipos, a partir de v´arias heur´ısticas, que ir˜ao representar todo o conjunto de treinamento.
Esse processo de gerac¸ ˜ao ´e mais demorado que o processo de selec¸ ˜ao. Por´em, observa-se na literatura
que as t´ecnicas de gerac¸ ˜ao apresentam melhores resultados que as t´ecnicas de selec¸ ˜ao.
A proposta deste trabalho ´e investigar se as t´ecnicas de selec¸ ˜ao podem obter resultados semelhantes
`as t´ecnicas de gerac¸ ˜ao. O resultado obtido neste estudo mostra que as t´ecnicas de
selec¸ ˜ao existentes podem obter taxas equivalentes `as t´ecnicas de gerac¸ ˜ao na maioria das bases
utilizadas nos experimentos, existindo algumas excec¸ ˜oes em que as t´ecnicas de gerac¸ ˜ao obtiveram
melhores resultados. Podemos verificar que, na maioria dos casos (83,3%) das bases
testadas, os prot´otipos gerados tinham instˆancias muito pr´oximas, no conjunto de treinamento,
que poderiam substitu´ı-los, sem a necessidade de gerac¸ ˜ao de prot´otipos, que ´e um processo mais
custoso que a selec¸ ˜ao de prot´otipos. Podemos concluir que ´e poss´ıvel desenvolver t´ecnicas de
selec¸ ˜ao, que apresentem taxas de erro estatisticamente iguais `as t´ecnicas de gerac¸ ˜ao.
|
2 |
Técnicas de redução de instâncias: ATISA e SSMA2Lima Pereira, Cesar 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:55:36Z (GMT). No. of bitstreams: 2
arquivo2273_1.pdf: 1625266 bytes, checksum: 0eb4bb8ecfe790f72029c6e54c3438f6 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco / Algoritmos de aprendizagem baseados em instâncias geralmente fazem uso de grandes conjuntos
de treinamento. Esses algoritmos podem necessitar de razoável espaço de armazenamento
para manter esses conjuntos, ou mesmo sofrer com elevado custo computacional para a realização
da aprendizagem, ou durante generalizações. Um processo de seleção de instâncias
específicas para uso na aprendizagem pode influenciar fortemente o desempenho dos algoritmos
baseados em instâncias. Eles podem ser melhorados em quesitos como: requisitos de
armazenamento, tempo de execução e também em poder de classificação. Uma variedade de
técnicas da literatura atuam com a finalidade da redução de instâncias em um conjunto de treinamento.
Duas novas técnicas serão introduzidas nesta dissertação. A primeira delas, ATISA
(Adaptive Threshold-based Instance Selection Algorithm), mantém instâncias com base em um
critério que usa a distância de cada instância ao seu inimigo mais próximo como um limiar.
Essa característica prioriza instâncias próximas às fronteiras de decisão, que são mais determinantes
no processo de classificação. O ATISA é apresentado em três diferentes algoritmos, cada
um com abordagens distintas. A segunda técnica proposta é uma adaptação do SSMA (Steady-
State Memetic Algorithm), já utilizado para a seleção de instâncias, para a síntese de protótipos.
Aqui chamado de SSMA2, ele é um algoritmo evolucionário que cria protótipos que representam
instâncias e que podem não estar contidos no conjunto original de treinamento. Durante
o processo de evolução, ele realiza um passo de busca local para refinar soluções, vem daí a
denominação memético. Ambos, ATISA e SSMA2, apresentaram-se como alternativas dentre
as técnicas de redução de instâncias existentes, de acordo com os experimentos realizados
|
3 |
Algoritmos de Geração de Protótipos Para Bases DesbalanceadasOliveira, Dayvid Victor Rodrigues de 25 February 2014 (has links)
Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-06T19:37:29Z
No. of bitstreams: 2
DISSERTAÇÃO Dayvid Victor Rodrigues de Oliveira.pdf: 798881 bytes, checksum: 3b4ac40fda11573b025340c2b03e8903 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-06T19:37:29Z (GMT). No. of bitstreams: 2
DISSERTAÇÃO Dayvid Victor Rodrigues de Oliveira.pdf: 798881 bytes, checksum: 3b4ac40fda11573b025340c2b03e8903 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014-02-25 / Técnicas de redução de instâncias são técnicas usadas para reduzir a quantidade de
instâncias em um conjunto de dados. Estas técnicas podem atuar removendo dados redundantes
ou gerando novos dados. As instâncias resultantes são chamadas de protótipos. Técnicas de
seleção de protótipos, são técnicas de redução de instâncias que realizam esta tarefa selecionando
um subconjunto do conjunto de dados original. Já as técnicas de geração de protótipos, são
técnicas de redução de instâncias que criam instâncias que não necessariamente pertencem ao
conjunto de dados original. Algoritmos evolucionários têm sido frequentemente utilizados em
seleção de protótipos, tal abordagem é chamada de evolutionary prototype selection. Algumas
bases de dados do mundo real possuem muitas instâncias de uma classe, a classe majoritária,
e poucas de outra, classe minoritária, estas bases são chamadas de bases desbalanceadas. Em
tais bases, muitos algoritmos de redução de instâncias se tornam inviáveis, retornando muitas
instâncias da classe majoritária e poucas, ou até nenhuma, da classe minoritária. Este efeito é
ainda mais acentuado em técnicas de remoção de ruídos. Neste trabalho, são propostas duas
técnicas de geração de protótipos que minimizam o efeito de desbalanceamento entre classes.
A primeira proposta é o Creative Steady-State Memetic Algorithm (CSSMA), um algoritmo de
geração de protótipos que utiliza um algoritmo evolucionário, incorporando uma busca local, para
encontrar o conjunto de protótipos artificiais que maximiza a função de aptidão. Esta técnica é
inspirada no Steady-State Memetic Algorithm, uma das melhores técnicas de seleção de protótipos
na literatura, tanto em redução quanto em classificação. A segunda proposta é o Adaptive Self-
Generating Prototypes (ASGP), esta técnica gera instâncias levando em consideração o tamanho
do maior agrupamento de cada classe. O ASGP é uma derivação do Self-Generating Prototypes
(SGP), considerada uma das técnicas de geração de protótipos de maior poder de generalização,
sendo, porém, ineficiente em bases desbalanceadas. As bases de dados usadas nos experimentos
são do módulo imbalanced datasets do KEEL software, dicotômicas, e com diferentes níveis de
desbalanceamento. Cada base é dividida em 5 partições para aplicação do k-fold cross validation
(k=5). As métricas usadas para avaliar a performance dos algoritmos foram a area under the ROC
curve (AUC) e a taxa de redução. Para comparar os resultados, foi utilizado o teste estatístico de
Wilcoxon. Os resultados mostram que o CSSMA foi superior em taxa de acerto, AUC, a outros
algoritmos evolucionários de redução de instâncias recentemente propostos. O ASGP também
obteve uma AUC superior ao Self-Generating Prototypes 2, versão mais atual do SGP.
|
Page generated in 0.0582 seconds