Spelling suggestions: "subject:"etnoaprendizagem"" "subject:"autoaprendizagem""
1 |
Meta-aprendizagem aplicada à classificação de dados de expressão gênica / Meta-learning applied to gene expression data classificationSouza, Bruno Feres de 26 October 2010 (has links)
Dentre as aplicações mais comuns envolvendo microarrays, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta da ocorrência de câncer. Essa classificação é realizada com a ajuda de algoritmos de Aprendizagem de Máquina. A escolha do algoritmo mais adequado para um dado problema não é trivial. Nesta tese de doutorado, estudou-se a utilização de meta-aprendizagem como uma solução viável. Os resultados experimentais atestaram o sucesso da aplicação utilizando um arcabouço padrão para caracterização dos dados e para a construção da recomendação. A partir de então, buscou-se realizar melhorias nesses dois aspectos. Inicialmente, foi proposto um novo conjunto de meta-atributos baseado em índices de validação de agrupamentos. Em seguida, estendeu-se o método de construção de rankings kNN para ponderar a influência dos vizinhos mais próximos. No contexto de meta-regressão, introduziu-se o uso de SVMs para estimar o desempenho de algoritmos de classificação. Árvores de decisão também foram empregadas para a construção da recomendação de algoritmos. Ante seu desempenho inferior, empregou-se um esquema de comitês de árvores, que melhorou sobremaneira a qualidade dos resultados / Among the most common applications involving microarray, one can highlight the classification of tissue samples, which is essential for the correct identification of the occurrence of cancer and its type. This classification takes place with the aid of machine learning algorithms. Choosing the best algorithm for a given problem is not trivial. In this thesis, we studied the use of meta-learning as a viable solution. The experimental results confirmed the success of the application using a standard framework for characterizing data and constructing the recommendation. Thereafter, some improvements were made in these two aspects. Initially, a new set of meta-attributes was proposed, which are based on cluster validation indices. Then the kNN method for ranking construction was extended to weight the influence of nearest neighbors. In the context of meta-regression, the use of SVMs was introduced to estimate the performance of ranking algorithms. Decision trees were also employed for recommending algorithms. Due to their low performance, a ensemble of trees was employed, which greatly improved the quality of results
|
2 |
Abordagem de constru??o de arquitetura homog?nea para comit?s via meta-aprendizagemParente, Regina Rosa 21 May 2012 (has links)
Made available in DSpace on 2014-12-17T15:48:00Z (GMT). No. of bitstreams: 1
ReginaRP_DISSERT.pdf: 1401966 bytes, checksum: 6823e0f79e0b8c97c1c944a55bbfe9c4 (MD5)
Previous issue date: 2012-05-21 / In the world we are constantly performing everyday actions. Two of these actions are
frequent and of great importance: classify (sort by classes) and take decision. When we
encounter problems with a relatively high degree of complexity, we tend to seek other opinions,
usually from people who have some knowledge or even to the extent possible, are
experts in the problem domain in question in order to help us in the decision-making process.
Both the classification process as the process of decision making, we are guided by
consideration of the characteristics involved in the specific problem. The characterization
of a set of objects is part of the decision making process in general. In Machine Learning
this classification happens through a learning algorithm and the characterization is applied
to databases. The classification algorithms can be employed individually or by machine
committees. The choice of the best methods to be used in the construction of a committee
is a very arduous task. In this work, it will be investigated meta-learning techniques in selecting
the best configuration parameters of homogeneous committees for applications in
various classification problems. These parameters are: the base classifier, the architecture
and the size of this architecture. We investigated nine types of inductors candidates for
based classifier, two methods of generation of architecture and nine medium-sized groups
for architecture. Dimensionality reduction techniques have been applied to metabases looking
for improvement. Five classifiers methods are investigated as meta-learners in the
process of choosing the best parameters of a homogeneous committee. / No universo cotidiano estamos constantemente realizando a??es. Duas dessas a??es
s?o frequentes e de grande import?ncia: classificar (distribuir por classes) e tomar decis?o.
Quando nos deparamos com problemas com um grau de complexidade relativamente alto,
tendemos a buscar outras opini?es, geralmente de pessoas que tenham certo conhecimento
ou at? mesmo, na medida do poss?vel, sejam especialistas no dom?nio do problema em
quest?o, de forma que nos ajudem no processo de tomada de decis?o. Tanto no processo
de classifica??o quanto em um processo de tomada de decis?o, somos orientados pela
considera??o das caracter?sticas envolvidas no problema espec?fico. A caracteriza??o de
um conjunto de objetos faz parte do processo de tomada de decis?o em geral. Em Aprendizado
de M?quina essa classifica??o acontece atrav?s de um algoritmo de aprendizado
e a caracteriza??o ? aplicada ?s bases de dados. Os algoritmos de classifica??o podem
ser empregados individualmente ou em forma de comit?s de m?quinas. A escolha dos
melhores m?todos a serem utilizados na constru??o de um comit? ? uma tarefa bastante
?rdua. Neste trabalho, ser?o investigadas t?cnicas de meta-aprendizagem na sele??o dos
melhores par?metros de configura??o de comit?s homog?neos para aplica??es em problemas
diversos de classifica??o. Tais par?metros s?o: o classificador base, a arquitetura e o
tamanho desta arquitetura. Foram investigados nove tipos de indutores candidatos a classificador
base, dois m?todos de gera??o de arquitetura e tr?s grupos de tamanho m?dio
para arquitetura, pequeno, m?dio e grande. Ante um desempenho fraco no processo de
meta-aprendizagem foram aplicadas t?cnicas de redu??o de dimensionalidade ?s metabases
e seis novos crit?rios de tamanho m?dio da arquitetura foram estabelecidos. Cinco
m?todos classificadores s?o investigados como meta-aprendizes no processo de escolha
dos melhores par?metros de um comit? homog?neo.
|
3 |
Meta-aprendizagem aplicada à classificação de dados de expressão gênica / Meta-learning applied to gene expression data classificationBruno Feres de Souza 26 October 2010 (has links)
Dentre as aplicações mais comuns envolvendo microarrays, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta da ocorrência de câncer. Essa classificação é realizada com a ajuda de algoritmos de Aprendizagem de Máquina. A escolha do algoritmo mais adequado para um dado problema não é trivial. Nesta tese de doutorado, estudou-se a utilização de meta-aprendizagem como uma solução viável. Os resultados experimentais atestaram o sucesso da aplicação utilizando um arcabouço padrão para caracterização dos dados e para a construção da recomendação. A partir de então, buscou-se realizar melhorias nesses dois aspectos. Inicialmente, foi proposto um novo conjunto de meta-atributos baseado em índices de validação de agrupamentos. Em seguida, estendeu-se o método de construção de rankings kNN para ponderar a influência dos vizinhos mais próximos. No contexto de meta-regressão, introduziu-se o uso de SVMs para estimar o desempenho de algoritmos de classificação. Árvores de decisão também foram empregadas para a construção da recomendação de algoritmos. Ante seu desempenho inferior, empregou-se um esquema de comitês de árvores, que melhorou sobremaneira a qualidade dos resultados / Among the most common applications involving microarray, one can highlight the classification of tissue samples, which is essential for the correct identification of the occurrence of cancer and its type. This classification takes place with the aid of machine learning algorithms. Choosing the best algorithm for a given problem is not trivial. In this thesis, we studied the use of meta-learning as a viable solution. The experimental results confirmed the success of the application using a standard framework for characterizing data and constructing the recommendation. Thereafter, some improvements were made in these two aspects. Initially, a new set of meta-attributes was proposed, which are based on cluster validation indices. Then the kNN method for ranking construction was extended to weight the influence of nearest neighbors. In the context of meta-regression, the use of SVMs was introduced to estimate the performance of ranking algorithms. Decision trees were also employed for recommending algorithms. Due to their low performance, a ensemble of trees was employed, which greatly improved the quality of results
|
4 |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagemFerrari, Daniel Gomes 27 March 2014 (has links)
Made available in DSpace on 2016-03-15T19:38:50Z (GMT). No. of bitstreams: 1
Daniel Gomes Ferrari.pdf: 2637416 bytes, checksum: 535856887beb7ff04af53570120bc1f9 (MD5)
Previous issue date: 2014-03-27 / Natcomp Informatica e Equipamentos Eletronicos LTDA / Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of
clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given
problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it
to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems. / Agrupamento é uma tarefa importante na mineração de dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos. Devido à natureza não supervisionada da tarefa, a busca por uma solução de boa qualidade pode se tornar um processo complexo. Atualmente, existe na literatura acadêmica uma grande quantidade de algoritmos que podem ser utilizados na
resolução deste problema. A seleção do algoritmo mais adequado para um determinado problema pode ser um processo lento e custoso. Em 1976, Rice formulou o Problema de Seleção de Algoritmos (PSA), postulando que um algoritmo de bom desempenho pode ser escolhido de acordo com as características estruturais do problema em que o mesmo será
aplicado. A meta-aprendizagem traz consigo o conceito de aprender sobre o aprender, isto é, por meio do meta-conhecimento obtido do processo de aprendizagem dos algoritmos é possível aprimorar o desempenho do processo. Meta-aprendizagem possui grande interseção com mineração de dados no que tange problemas de classificação, sendo utilizada no desenvolvimento de sistemas de seleção de algoritmos. Nesta tese é proposta a abordagem ao PSA por meio de técnicas de meta-aprendizagem para agrupamento de dados. A
caracterização de 84 problemas é realizada pela abordagem clássica, baseada nos problemas, e por uma nova proposta baseada na similaridade entre os objetos. São utilizados dez índices internos para promover diferentes avaliações do desempenho de sete algoritmos, onde a combinação desses índices determina o ranking dos algoritmos. São realizadas diversas análises no intuito de avaliar a qualidade do meta-conhecimento obtido em viabilizar o mapeamento entre as características do problema e o desempenho dos algoritmos. Os
resultados mostram que a nova caracterização e combinação dos índices proporcionam a seleção, com qualidade, de algoritmos para agrupamento de dados.
|
5 |
Uma abordagem para a escolha do melhor método de seleção de instâncias usando meta-aprendizagemMOURA, Shayane de Oliveira 21 August 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-04-05T14:16:18Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Shayane_FINAL.pdf: 7778172 bytes, checksum: bef887b2265bc2ffe53c75c2c275d796 (MD5) / Made available in DSpace on 2016-04-05T14:16:18Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Shayane_FINAL.pdf: 7778172 bytes, checksum: bef887b2265bc2ffe53c75c2c275d796 (MD5)
Previous issue date: 2015-08-21 / IF Sertão - PE / Os sistemas de Descoberta de Conhecimentos em Bases de Dados (mais conhecidos
como sistemas KDD) e métodos de Aprendizagem de Máquinas preveem situações,
agrupam e reconhecem padrões, entre outras tarefas que são demandas de um mundo
no qual a maioria dos serviços está sendo oferecido por meio virtual. Apesar dessas
aplicações se preocuparem em gerar informações de fácil interpretação, rápidas e
confiáveis, as extensas bases de dados utilizadas dificultam o alcance de precisão
unida a um baixo custo computacional. Para resolver esse problema, as bases de
dados podem ser reduzidas com o objetivo de diminuir o tempo de processamento e
facilitar o seu armazenamento, bem como, guardar apenas informações suficientes e
relevantes para a extração do conhecimento. Nesse contexto, Métodos de Seleção de
Instâncias (MSIs) têm sido propostos para reduzir e filtrar as bases de dados, selecionando
ou criando novas instâncias que melhor as descrevam. Todavia, aqui se aplica
o Teorema do No Free Lunch, ou seja, a performance dos MSIs varia conforme a base e
nenhum dos métodos sempre sobrepõe seu desempenho aos demais. Por isso, esta
dissertação propõe uma arquitetura para selecionar o “melhor” MSI para uma dada
base de dados (mais adequado emrelação à precisão), chamadaMeta-CISM (Metalearning
for Choosing Instance SelectionMethod). Estratégias de meta-aprendizagem
são utilizadas para treinar um meta-classificador que aprende sobre o relacionamento
entre a taxa de acerto de MSIs e a estrutura das bases. O Meta-CISM utiliza ainda
reamostragem e métodos de seleção de atributos para melhorar o desempenho do
meta-classificador. A proposta foi avaliada com os MSIs: C-pruner, DROP3, IB3, ICF e
ENN-CNN. Os métodos de reamostragem utilizados foram: Bagging e Combination
(método proposto neste trabalho). Foram utilizados como métodos de seleção de
atributos: Relief-F, CFS, Chi Square Feature Evaluation e Consistency-Based Subset
Evaluation. Cinco classificadores contribuíram para rotular as meta-instâncias: C4.5,
PART, MLP-BP, SMO e KNN. Uma MLP-BP treinou o meta-classificador. Os experimentos
foram realizados com dezesseis bases de dados públicas. O método proposto
(Meta-CISM) foi melhor que todos os MSIs estudados, na maioria dos experimentos
realizados. Visto que eficientemente seleciona um dos três melhores MSIs em mais de
85% dos casos, a abordagemé adequada para ser automaticamente utilizada na fase
de pré-processamento das base de dados. / The systems for Knowledge Discovery in Databases (better known as KDD systems)
andMachine Learning methods predict situations, recognize and group (cluster) patterns,
among other tasks that are demands of a world in which the most of the services
is being offered by virtual ways. Although these applications are concerned in generate
fast, reliable and easy to interpret information, extensive databases used for such
applications make difficult achieving accuracy with a low computational cost. To solve
this problem, the databases can be reduced aiming to decrease the processing time
and facilitating its storage, as well as, to save only sufficient and relevant information
for the knowledge extraction. In this context, Instances SelectionMethods (ISMs) have
been proposed to reduce and filter databases, selecting or creating new instances that
best describe them. Nevertheless, No Free Lunch Theorem is applied, that is, the ISMs
performance varies according to the base and none of the methods always overcomes
their performance over others. Therefore, this work proposes an architecture to
select the "best"ISM for a given database (best suited in relation to accuracy), called
Meta-CISM (Meta-learning for Choosing Instance SelectionMethod). Meta-learning
strategies are used to train a meta-classifier that learns about the relationship between
the accuracy rate of ISMs and the bases structures. TheMeta-CISM still uses resampling
and feature selection methods to improve the meta-classifier performance. The
proposal was evaluated with the ISMs: C-pruner, DROP3, IB3, ICF and ENN-CNN.
Resampling methods used were: Bagging and Combination (method proposed in this
work). The Feature SelectionMethods used were: Relief-F, CFS, Chi Square Feature
Evaluation e Consistency-Based Subset Evaluation. Five classifiers contributed to label
the meta-instances: C4.5, PART, MLP-BP, SMO e KNN. The meta-classifier was trained
by a MLP-BP. Experiments were carried with sixteen public databases. The proposed
method (Meta-CISM) was better than all ISMs studied in the most of the experiments
performed. Since that efficiently selects one of the three best ISMs in more than 85%
of cases, the approach is suitable to be automatically used in the pre-processing of the
databases.
|
Page generated in 0.0549 seconds