Spelling suggestions: "subject:"autoaprendizado."" "subject:"reaprendizado.""
11 |
Use of meta-learning for hyperparameter tuning of classification problems / Uso de meta-aprendizado para o ajuste de hiper-parâmetros em problemas de classificaçãoMantovani, Rafael Gomes 17 May 2018 (has links)
Machine learning solutions have been successfully used to solve many simple and complex problems. However, their development process still relies on human experts to perform tasks such as data preprocessing, feature engineering and model selection. As the complexity of these tasks increases, so does the demand for automated solutions, namely Automated Machine Learning (AutoML). Most algorithms employed in these systems have hyperparameters whose configuration may directly affect their predictive performance. Therefore, hyperparameter tuning is a recurring task in AutoML systems. This thesis investigated how to efficiently automate hyperparameter tuning by means of Meta-learning. To this end, large-scale experiments were performed tuning the hyperparameters of different classification algorithms, and an enhanced experimental methodology was adopted throughout the thesis to explore and learn the hyperparameter profiles for different classification algorithms. The results also showed that in many cases the default hyperparameter settings induced models that are on par with those obtained by tuning. Hence, a new Meta-learning recommender system was proposed to identify when it is better to use default values and when to tune classification algorithms for each new dataset. The proposed system is capable of generalizing several learning processes into a single modular framework, along with the possibility of assigning different algorithms. Furthermore, a descriptive analysis of model predictions is used to identify which data characteristics affect the necessity for tuning in each one of the algorithms investigated in the thesis. Experimental results also demonstrated that the proposed recommender system reduced the time spent on optimization processes, without reducing the predictive performance of the induced models. Depending on the target algorithm, the Meta-learning recommender system can statistically outperform the baselines. The significance of these results opens a number of new avenues for future work. / Soluções de aprendizado de máquina tem sido cada vez mais usadas com sucesso para resolver problemas dos mais simples aos complexos. Entretanto, o processo de desenvolvimento de tais soluções ainda é um processo que depende da ação de especialistas humanos em tarefas como: pré-processamento dos dados, engenharia de features e seleção de modelos. Consequentemente, quando a complexidade destas tarefas atinge um nível muito alto, há a necessidade de soluções automatizadas, denominadas por Aprendizado de Máquina automatizado (AutoML). A maioria dos algoritmos usados em tais sistemas possuem hiper-parâmetros cujos valores podem afetar diretamente o desempenho preditivo dos modelos gerados. Assim sendo, o ajuste de hiper-parâmetros é uma tarefa recorrente no desenvolvimento de sistems de AutoML. Nesta tese investigou-se a automatização do ajuste de hiper-parâmetros por meio de Meta-aprendizado. Seguindo essa linha, experimentos massivos foram realizados para ajustar os hiper-parâmetros de diferentes algoritmos de classificação. Além disso, uma metodologia experimental aprimorada e adotada ao lngo da tese perimtiu identificar diferentes perfis de ajuste para diferentes algoritmos de classificação. Entretanto, os resultados também mostraram que em muitos casos as configurações default destes algoritmos induziram modelos mais precisos do que os obtidos por meio de ajuste. Assim, foi proposto um novo sistema de recomendação baseado em Meta-learning para identificar quando é melhor realizar o ajuste de parâmetros para os algoritmos de classificação ou apenas usar os valores default. O sistema proposto é capaz de generalizar várias etapas do aprendizado em um único framework modular, juntamente com a possibilidade de avaliar diferentes algoritmos de aprendizado de máquina. As análises descritivas das predições obtidas pelo sistema indicaram quais características podem ser responsáveis por determinar quando o ajuste se faz necessário para cada um dos algoritmos investigados na tese. Os resultados também demonstraram que o sistema recomendador proposto reduziu o tempo gasto com a otimização mantendo o desempenho preditivo dos modelos gerados. Além disso, dependendo do algoritmo de classificação modelado, o sistema foi estatisticamente superior aos baselines. A significância desdes resultados abre um novo número de oportunidades para trabalhos futuros.
|
12 |
Noise detection in classification problems / Detecção de ruídos em problemas de classificaçãoLuís Paulo Faina Garcia 22 June 2016 (has links)
In many areas of knowledge, considerable amounts of time have been spent to comprehend and to treat noisy data, one of the most common problems regarding information collection, transmission and storage. These noisy data, when used for training Machine Learning techniques, lead to increased complexity in the induced classification models, higher processing time and reduced predictive power. Treating them in a preprocessing step may improve the data quality and the comprehension of the problem. This Thesis aims to investigate the use of data complexity measures capable to characterize the presence of noise in datasets, to develop new efficient noise ltering techniques in such subsamples of problems of noise identification compared to the state of art and to recommend the most properly suited techniques or ensembles for a specific dataset by meta-learning. Both artificial and real problem datasets were used in the experimental part of this work. They were obtained from public data repositories and a cooperation project. The evaluation was made through the analysis of the effect of artificially generated noise and also by the feedback of a domain expert. The reported experimental results show that the investigated proposals are promising. / Em diversas áreas do conhecimento, um tempo considerável tem sido gasto na compreensão e tratamento de dados ruidosos. Trata-se de uma ocorrência comum quando nos referimos a coleta, a transmissão e ao armazenamento de informações. Esses dados ruidosos, quando utilizados na indução de classificadores por técnicas de Aprendizado de Maquina, aumentam a complexidade da hipótese obtida, bem como o aumento do seu tempo de indução, além de prejudicar sua acurácia preditiva. Trata-los na etapa de pré-processamento pode significar uma melhora da qualidade dos dados e um aumento na compreensão do problema estudado. Esta Tese investiga medidas de complexidade capazes de caracterizar a presença de ruídos em um conjunto de dados, desenvolve novos filtros que sejam mais eficientes em determinados nichos do problema de detecção e remoção de ruídos que as técnicas consideradas estado da arte e recomenda as mais apropriadas técnicas ou comitês de técnicas para um determinado conjunto de dados por meio de meta-aprendizado. As bases de dados utilizadas nos experimentos realizados neste trabalho são tanto artificiais quanto reais, coletadas de repositórios públicos e fornecidas por projetos de cooperação. A avaliação consiste tanto da adição de ruídos artificiais quanto da validação de um especialista. Experimentos realizados mostraram o potencial das propostas investigadas.
|
13 |
Seleção e controle do viés de aprendizado ativo / Selection and control of the active learning biasDavi Pereira dos Santos 22 February 2016 (has links)
A área de aprendizado de máquina passa por uma grande expansão em seu universo de aplicações. Algoritmos de indução de modelos preditivos têm sido responsáveis pela realização de tarefas que eram inviáveis ou consideradas exclusividade do campo de ação humano até recentemente. Contudo, ainda é necessária a supervisão humana durante a construção de conjuntos de treinamento, como é o caso da tarefa de classificação. Tal construção se dá por meio da rotulação manual de cada exemplo, atribuindo a ele pelo menos uma classe. Esse processo, por ser manual, pode ter um custo elevado se for necessário muitas vezes. Uma técnica sob investigação corrente, capaz de mitigar custos de rotulação, é o aprendizado ativo. Dado um orçamento limitado, o objetivo de uma estratégia de amostragem ativa é direcionar o esforço de treinamento para os exemplos essenciais. Existem diversas abordagens efetivas de selecionar ativamente os exemplos mais importantes para consulta ao supervisor. Entretanto, não é possível, sem incorrer em custos adicionais, testá-las de antemão quanto à sua efetividade numa dada aplicação. Ainda mais crítica é a necessidade de que seja escolhido um algoritmo de aprendizado para integrar a estratégia de aprendizado ativo antes que se disponha de um conjunto de treinamento completo. Para lidar com esses desafios, esta tese apresenta como principais contribuições: uma estratégia baseada na inibição do algoritmo de aprendizado nos momentos menos propícios ao seu funcionamento; e, a experimentação da seleção de algoritmos de aprendizado, estratégias ativas de consulta ou pares estratégia-algoritmo baseada em meta-aprendizado, visando a experimentação de formas de escolha antes e durante o processo de rotulação. A estratégia de amostragem proposta é demonstrada competitiva empiricamente. Adicionalmente, experimentos iniciais com meta-aprendizado indicam a possibilidade de sua aplicação em aprendizado ativo, embora tenha sido identificado que investigações mais extensivas e aprofundadas sejam necessárias para apurar sua real efetividade prática. Importantes contribuições metodológicas são descritas neste documento, incluindo uma análise frequentemente negligenciada pela literatura da área: o risco devido à variabilidade dos algoritmos. Por fim, são propostas as curvas e faixas de ranqueamento, capazes de sumarizar, num único gráfico, experimentos de uma grande coleção de conjuntos de dados. / The machine learning area undergoes a major expansion in its universe of applications. Algorithms for the induction of predictive models have made it possible to carry out tasks that were once considered unfeasible or restricted to be solved by humans. However, human supervision is still needed to build training sets, for instance, in the classification task. Such building is usually performed by manual labeling of each instance, providing it, at least, one class. This process has a high cost due to its manual nature. A current technique under research, able to mitigate labeling costs, is called active learning. The goal of an active learning strategy is to manage the training effort to focus on the most relevant instances, within a budget. Several effective sampling approaches having been proposed. However, when one needs to choose the proper strategy for a given problem, they are impossible to test beforehand without incurring into additional costs. Even more critical is the need to choose a learning algorithm to integrate the active learning strategy before the existence of a complete training set. This thesis presents two major contributions to cope with such challenges: a strategy based on the learning algorithm inhibition when it is prone to inaccurate predictions; and, an attempt to automatically select the learning algorithms, active querying strategies or pairs strategy-algorithm, based on meta-learning. This attempt tries to verify the feasibility of such kind of decision making before and during the learning process. The proposed sampling approach is empirically shown to be competitive. Additionally, meta-learning experiments show that it can be applied to active learning, although more a extensive investigation is still needed to assess its real practical effectivity. Important methodological contributions are made in this document, including an often neglected analysis in the literature of active learning: the risk due to the algorithms variability. A major methodological contribution, called ranking curves, is presented.
|
14 |
Use of meta-learning for hyperparameter tuning of classification problems / Uso de meta-aprendizado para o ajuste de hiper-parâmetros em problemas de classificaçãoRafael Gomes Mantovani 17 May 2018 (has links)
Machine learning solutions have been successfully used to solve many simple and complex problems. However, their development process still relies on human experts to perform tasks such as data preprocessing, feature engineering and model selection. As the complexity of these tasks increases, so does the demand for automated solutions, namely Automated Machine Learning (AutoML). Most algorithms employed in these systems have hyperparameters whose configuration may directly affect their predictive performance. Therefore, hyperparameter tuning is a recurring task in AutoML systems. This thesis investigated how to efficiently automate hyperparameter tuning by means of Meta-learning. To this end, large-scale experiments were performed tuning the hyperparameters of different classification algorithms, and an enhanced experimental methodology was adopted throughout the thesis to explore and learn the hyperparameter profiles for different classification algorithms. The results also showed that in many cases the default hyperparameter settings induced models that are on par with those obtained by tuning. Hence, a new Meta-learning recommender system was proposed to identify when it is better to use default values and when to tune classification algorithms for each new dataset. The proposed system is capable of generalizing several learning processes into a single modular framework, along with the possibility of assigning different algorithms. Furthermore, a descriptive analysis of model predictions is used to identify which data characteristics affect the necessity for tuning in each one of the algorithms investigated in the thesis. Experimental results also demonstrated that the proposed recommender system reduced the time spent on optimization processes, without reducing the predictive performance of the induced models. Depending on the target algorithm, the Meta-learning recommender system can statistically outperform the baselines. The significance of these results opens a number of new avenues for future work. / Soluções de aprendizado de máquina tem sido cada vez mais usadas com sucesso para resolver problemas dos mais simples aos complexos. Entretanto, o processo de desenvolvimento de tais soluções ainda é um processo que depende da ação de especialistas humanos em tarefas como: pré-processamento dos dados, engenharia de features e seleção de modelos. Consequentemente, quando a complexidade destas tarefas atinge um nível muito alto, há a necessidade de soluções automatizadas, denominadas por Aprendizado de Máquina automatizado (AutoML). A maioria dos algoritmos usados em tais sistemas possuem hiper-parâmetros cujos valores podem afetar diretamente o desempenho preditivo dos modelos gerados. Assim sendo, o ajuste de hiper-parâmetros é uma tarefa recorrente no desenvolvimento de sistems de AutoML. Nesta tese investigou-se a automatização do ajuste de hiper-parâmetros por meio de Meta-aprendizado. Seguindo essa linha, experimentos massivos foram realizados para ajustar os hiper-parâmetros de diferentes algoritmos de classificação. Além disso, uma metodologia experimental aprimorada e adotada ao lngo da tese perimtiu identificar diferentes perfis de ajuste para diferentes algoritmos de classificação. Entretanto, os resultados também mostraram que em muitos casos as configurações default destes algoritmos induziram modelos mais precisos do que os obtidos por meio de ajuste. Assim, foi proposto um novo sistema de recomendação baseado em Meta-learning para identificar quando é melhor realizar o ajuste de parâmetros para os algoritmos de classificação ou apenas usar os valores default. O sistema proposto é capaz de generalizar várias etapas do aprendizado em um único framework modular, juntamente com a possibilidade de avaliar diferentes algoritmos de aprendizado de máquina. As análises descritivas das predições obtidas pelo sistema indicaram quais características podem ser responsáveis por determinar quando o ajuste se faz necessário para cada um dos algoritmos investigados na tese. Os resultados também demonstraram que o sistema recomendador proposto reduziu o tempo gasto com a otimização mantendo o desempenho preditivo dos modelos gerados. Além disso, dependendo do algoritmo de classificação modelado, o sistema foi estatisticamente superior aos baselines. A significância desdes resultados abre um novo número de oportunidades para trabalhos futuros.
|
15 |
Meta-aprendizado aplicado a fluxos contínuos de dados / Metalearning for algorithm selection in data stramsRossi, Andre Luís Debiaso 19 December 2013 (has links)
Algoritmos de aprendizado de máquina são amplamente empregados na indução de modelos para descoberta de conhecimento em conjuntos de dados. Como grande parte desses algoritmos assume que os dados são gerados por uma função de distribuição estacionária, um modelo é induzido uma única vez e usado indefinidamente para a predição do rótulo de novos dados. Entretanto, atualmente, diversas aplicações, como gerenciamento de transportes e monitoramento por redes de sensores, geram fluxos contínuos de dados que podem mudar ao longo do tempo. Consequentemente, a eficácia do algoritmo escolhido para esses problemas pode se deteriorar ou outros algoritmos podem se tornar mais apropriados para as características dos novos dados. Nesta tese é proposto um método baseado em meta-aprendizado para gerenciar o processo de aprendizado em ambientes dinâmicos de fluxos contínuos de dados com o objetivo de melhorar o desempenho preditivo do sistema de aprendizado. Esse método, denominado MetaStream, seleciona regularmente o algoritmo mais promissor para os dados que estão chegando, de acordo com as características desses dados e de experiências passadas. O método proposto emprega técnicas de aprendizado de máquina para gerar o meta-conhecimento, que relaciona as características extraídas dos dados em diferentes instantes do tempo ao desempenho preditivo dos algoritmos. Entre as medidas usadas para extrair informação relevante dos dados, estão aquelas comumente empregadas em meta-aprendizado convencional com diferentes conjuntos de dados, que são adaptadas para as especificidades do cenário de fluxos, e de áreas correlatas, que consideram, por exemplo, a ordem de chegada dos dados. O MetaStream é avaliado para três conjuntos de dados reais e seis algoritmos de aprendizado diferentes. Os resultados mostram a aplicabilidade do MetaStream e sua capacidade de melhorar o desempenho preditivo geral do sistema de aprendizado em relação a um método de referência para a maioria dos problemas investigados. Deve ser observado que uma combinação de modelos mostrou-se superior ao MetaStream para dois conjuntos de dados. Assim, foram analisados os principais fatores que podem ter influenciado nos resultados observados e são indicadas possíveis melhorias do método proposto / Machine learning algorithms are widely employed to induce models for knowledge discovery in databases. Since most of these algorithms suppose that the underlying distribution of the data is stationary, a model is induced only once e it is applied to predict the label of new data indefinitely. However, currently, many real applications, such as transportation management systems and monitoring of sensor networks, generate data streams that can change over time. Consequently, the effectiveness of the algorithm chosen for these problems may deteriorate or other algorithms may become more suitable for the new data characteristics. This thesis proposes a metalearning based method for the management of the learning process in dynamic environments of data streams aiming to improve the general predictive performance of the learning system. This method, named MetaStream, regularly selects the most promising algorithm for arriving data according to its characteristics and past experiences. The proposed method employs machine learning techniques to generate metaknowledge, which relates the characteristics extracted from data in different time points to the predictive performance of the algorithms. Among the measures applied to extract relevant information are those commonly used in conventional metalearning for different data sets, which are adapted for the data stream particularities, and from other related areas that consider the order of the data stream. We evaluate MetaStream for three real data stream problems and six different learning algorithms. The results show the applicability of the MetaStream and its capability to improve the general predictive performance of the learning system compared to a baseline method for the majority of the cases investigated. It must be observed that an ensemble of models is usually superior to MetaStream. Thus, we analyzed the main factors that may have influenced the results and indicate possible improvements for the proposed method
|
16 |
Meta-aprendizado aplicado a fluxos contínuos de dados / Metalearning for algorithm selection in data stramsAndre Luís Debiaso Rossi 19 December 2013 (has links)
Algoritmos de aprendizado de máquina são amplamente empregados na indução de modelos para descoberta de conhecimento em conjuntos de dados. Como grande parte desses algoritmos assume que os dados são gerados por uma função de distribuição estacionária, um modelo é induzido uma única vez e usado indefinidamente para a predição do rótulo de novos dados. Entretanto, atualmente, diversas aplicações, como gerenciamento de transportes e monitoramento por redes de sensores, geram fluxos contínuos de dados que podem mudar ao longo do tempo. Consequentemente, a eficácia do algoritmo escolhido para esses problemas pode se deteriorar ou outros algoritmos podem se tornar mais apropriados para as características dos novos dados. Nesta tese é proposto um método baseado em meta-aprendizado para gerenciar o processo de aprendizado em ambientes dinâmicos de fluxos contínuos de dados com o objetivo de melhorar o desempenho preditivo do sistema de aprendizado. Esse método, denominado MetaStream, seleciona regularmente o algoritmo mais promissor para os dados que estão chegando, de acordo com as características desses dados e de experiências passadas. O método proposto emprega técnicas de aprendizado de máquina para gerar o meta-conhecimento, que relaciona as características extraídas dos dados em diferentes instantes do tempo ao desempenho preditivo dos algoritmos. Entre as medidas usadas para extrair informação relevante dos dados, estão aquelas comumente empregadas em meta-aprendizado convencional com diferentes conjuntos de dados, que são adaptadas para as especificidades do cenário de fluxos, e de áreas correlatas, que consideram, por exemplo, a ordem de chegada dos dados. O MetaStream é avaliado para três conjuntos de dados reais e seis algoritmos de aprendizado diferentes. Os resultados mostram a aplicabilidade do MetaStream e sua capacidade de melhorar o desempenho preditivo geral do sistema de aprendizado em relação a um método de referência para a maioria dos problemas investigados. Deve ser observado que uma combinação de modelos mostrou-se superior ao MetaStream para dois conjuntos de dados. Assim, foram analisados os principais fatores que podem ter influenciado nos resultados observados e são indicadas possíveis melhorias do método proposto / Machine learning algorithms are widely employed to induce models for knowledge discovery in databases. Since most of these algorithms suppose that the underlying distribution of the data is stationary, a model is induced only once e it is applied to predict the label of new data indefinitely. However, currently, many real applications, such as transportation management systems and monitoring of sensor networks, generate data streams that can change over time. Consequently, the effectiveness of the algorithm chosen for these problems may deteriorate or other algorithms may become more suitable for the new data characteristics. This thesis proposes a metalearning based method for the management of the learning process in dynamic environments of data streams aiming to improve the general predictive performance of the learning system. This method, named MetaStream, regularly selects the most promising algorithm for arriving data according to its characteristics and past experiences. The proposed method employs machine learning techniques to generate metaknowledge, which relates the characteristics extracted from data in different time points to the predictive performance of the algorithms. Among the measures applied to extract relevant information are those commonly used in conventional metalearning for different data sets, which are adapted for the data stream particularities, and from other related areas that consider the order of the data stream. We evaluate MetaStream for three real data stream problems and six different learning algorithms. The results show the applicability of the MetaStream and its capability to improve the general predictive performance of the learning system compared to a baseline method for the majority of the cases investigated. It must be observed that an ensemble of models is usually superior to MetaStream. Thus, we analyzed the main factors that may have influenced the results and indicate possible improvements for the proposed method
|
17 |
Arquitetura híbrida para otimização multi-objetivo de SVMsMiranda, Péricles Barbosa Cunha de 22 February 2013 (has links)
Submitted by Luiz Felipe Barbosa (luiz.fbabreu2@ufpe.br) on 2015-03-12T13:03:02Z
No. of bitstreams: 2
Dissertaçao Péricles Miranda.pdf: 2165606 bytes, checksum: d9dd28b8af21e867949112bcb33578ac (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:13:38Z (GMT) No. of bitstreams: 2
Dissertaçao Péricles Miranda.pdf: 2165606 bytes, checksum: d9dd28b8af21e867949112bcb33578ac (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:13:38Z (GMT). No. of bitstreams: 2
Dissertaçao Péricles Miranda.pdf: 2165606 bytes, checksum: d9dd28b8af21e867949112bcb33578ac (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-02-22 / Vem sendo dada grande atenção às Máquinas de Vetores de Suporte (SVMs) devido à sua fundamentação
teórica e seu bom desempenho quando comparadas a outros algoritmos de aprendizado
em diferentes aplicações. Porém, seu bom desempenho depende fortemente da escolha
adequada de seus parâmetros de controle. Como a abordagem de tentativa e erro se torna
impraticável devido às combinações entre os possíveis valores dos parâmetros, a seleção de
parâmetros passou a ser tratada como um problema de otimização, de modo que o objetivo é
encontrar a combinação de valores dos parâmetros mais adequada para um determinado problema.
Embora a utilização de algoritmos de otimização e busca automatizem a seleção de
parâmetros de SVM, ela pode se tornar inviável caso o número de parâmetros a serem selecionados
aumente consideravelmente. Uma alternativa é o uso de Meta-Aprendizado (MA), que
trata a tarefa de seleção de parâmetros como uma tarefa de aprendizado supervisionado. Cada
exemplo de treinamento para o MA (meta-exemplo) armazena características de problemas passados
e o desempenho obtido pelas configurações de parâmetros candidatas. Este conjunto de
meta-exemplos forma a meta-base, sendo esta utilizada para auxiliar no módulo de sugestão ou
meta-aprendiz. O meta-aprendiz tem a função de prever as configurações de parâmetros mais
adequadas para um problema novo baseado em suas características. Deste modo, MA se torna
uma alternativa menos custosa comparada aos algoritmos de otimização, pois faz uso de execuções
passadas no processo de sugestão. Neste trabalho, as sugestões do meta-aprendiz são
utilizadas como soluções iniciais da técnica de busca, sendo esta responsável pelo refinamento
das soluções sugeridas.
Neste trabalho, foi criada uma arquitetura híbrida multi-objetivo, que combina MA com
algoritmos de otimização, inspirados em enxames de partículas, com múltiplos objetivos aplicado
ao problema de seleção de parâmetros de SVMs. Os algoritmos de otimização utilizados
no experimento foram: MOPSO, MOPSO-CDR, MOPSO-CDRS, CSS-MOPSO, m-DNPSO e
MOPSO-CDLS, e os objetivos levados em consideração foram: maximização da taxa de acerto
na classificação e minimização do número de vetores de suporte. De acordo com os resultados
alcançados, ficou comprovado o potencial do MA na sugestão de soluções para os algoritmos
de otimização. O início da busca em regiões promissoras favoreceu a convergência e geração de
soluções ainda melhores, quando comparada a aplicação de algoritmos de busca tradicionais.
Os Pareto fronts gerados foram analisado em 4 perspectivas (spacing, max. spread, hypervolume
e coverage), sendo os resultados da abordagem híbrida superiores aos das técnicas de
otimização tradicionais.
|
18 |
Recomenda??o de algoritmos de aprendizado de m?quina para predi??o de falhas de software por meio de meta-aprendizadoAlves, Luciano 23 September 2016 (has links)
Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-10-04T18:59:57Z
No. of bitstreams: 1
LUCIANO_ ALVES_DIS.pdf: 1077045 bytes, checksum: ddcbf3be03bec1c7a82f3e07252439a0 (MD5) / Rejected by Sheila Dias (sheila.dias@pucrs.br), reason: Devolvido deviso ? inconsist?ncia de datas no arquivo pdf. Na capa institucional, na ficha catalogr?fica e na folha da banca est? 2016 e na folha de rosto 2018. on 2018-10-05T16:43:09Z (GMT) / Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-10-08T18:31:55Z
No. of bitstreams: 1
LUCIANO_ ALVES_DIS.pdf: 1076874 bytes, checksum: 70823493135f9ec1a577db83eefbd19c (MD5) / Approved for entry into archive by Caroline Xavier (caroline.xavier@pucrs.br) on 2018-10-09T16:36:57Z (GMT) No. of bitstreams: 1
LUCIANO_ ALVES_DIS.pdf: 1076874 bytes, checksum: 70823493135f9ec1a577db83eefbd19c (MD5) / Made available in DSpace on 2018-10-09T16:43:56Z (GMT). No. of bitstreams: 1
LUCIANO_ ALVES_DIS.pdf: 1076874 bytes, checksum: 70823493135f9ec1a577db83eefbd19c (MD5)
Previous issue date: 2016-09-23 / Software fault prediction is a significant part of software quality assurance and it is commonly used to detect faulty software modules based on software measurement data. Several machine learning based approaches have been proposed for generating predictive models from collected data, although none has become standard given the specificities of each software project. Hence, we believe that recommending the best algorithm for each project is much more important and useful than developing a single algorithm for being used in any project. For achieving that goal, we propose in this dissertation a novel framework for recommending machine learning algorithms that is capable of automatically identifying the most suitable algorithm according to the software project that is being considered. Our solution, namely FMA-PFS, makes use of the metalearning paradigm in order to learn the best learner for a particular project. Results show that the FMA-PFS framework provides both the best single algorithm recommendation and also the best ranking recommendation for the software fault prediction problem. / A predi??o de falhas de software ? uma parte significativa da garantia de qualidade do software e ? normalmente utilizada para detectar m?dulos propensos a falhar baseados em dados coletados ap?s o processo de desenvolvimento do projeto. Diversas t?cnicas de aprendizado de m?quina t?m sido propostas para gera??o de modelos preditivos a partir da coleta dos dados, por?m nenhuma se tornou a solu??o padr?o devido as especificidades de cada projeto. Por isso, a hip?tese levantada por este trabalho ? que recomendar algoritmos de aprendizado de m?quina para cada projeto ? mais importante e ?til do que o desenvolvimento de um ?nico algoritmo de aprendizado de m?quina a ser utilizado em qualquer projeto. Para alcan?ar este objetivo, prop?e-se nesta disserta??o um framework para recomendar algoritmos de aprendizado de m?quina capaz de identificar automaticamente o algoritmo mais adequado para aquele projeto espec?fico. A solu??o, chamada FMA-PFS, faz uso da t?cnica de meta-aprendizado, a fim de aprender o melhor algoritmo para um projeto em particular. Os resultados mostram que o framework FMA-PFS recomenda tanto o melhor algoritmo, quanto o melhor ranking de algoritmos no contexto de predi??o de falhas de software.
|
19 |
Uma hiper-heurística híbrida para a otimização de algorítmosMIRANDA, Pericles Barbosa Cunha de 22 August 2016 (has links)
Submitted by Rafael Santana (rafael.silvasantana@ufpe.br) on 2017-05-04T18:13:43Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Teste - Péricles Miranda.pdf: 1959669 bytes, checksum: 8b0b1e3f94dd3295bce6153865564a12 (MD5) / Made available in DSpace on 2017-05-04T18:13:43Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Teste - Péricles Miranda.pdf: 1959669 bytes, checksum: 8b0b1e3f94dd3295bce6153865564a12 (MD5)
Previous issue date: 2016-08-22 / A escolha de algoritmos ou heurísticas para a resolução de um dado problema é uma tarefa
desafiadora devido à variedade de possíveis escolhas de variações/configurações de algoritmos e
a falta de auxílio em como escolhê-las ou combiná-las. Por exemplo, o desempenho de algoritmo
de otimização depende da escolha dos seus operadores de busca e do ajuste adequado de seus
hiper-parâmetros, cada um deles com muitas possibilidades de opções a serem escolhidas. Por
este motivo, existe um interesse de pesquisa crescente na automatização da otimização de
algoritmos de modo a tornar esta tarefa mais independente da interação humana. Diferentes
abordagens têm lidado com a tarefa de ajuste de algoritmos como sendo outro problema de
(meta)otimização. Estas abordagens são comumente chamadas de hiper-heurísticas, onde cada
solução do espaço de busca, neste caso, é um possível algoritmo avaliado em um dado problema.
Inicialmente, hiper-heurísticas foram aplicadas na seleção de valores de hiper-parâmetros em
um espaço de busca pré-definido e limitado. No entanto, recentemente, hiper-heurísticas têm
sido desenvolvidas para gerar algoritmos a partir de componentes e funções especificados. Hiperheurísticas
de geração são consideradas mais flexíveis que as de seleção devido à sua capacidade
de criar algoritmos novos e personalizados para um dado problema. As hiper-heurísticas têm sido
largamente utilizadas na otimização de meta-heurísticas. No entanto, o processo de busca torna-se
bastante custoso, pois a avaliação das soluções trata-se da execução do algoritmo no problema
de entrada. Neste trabalho, uma nova hiper-heurística foi desenvolvida para a otimização de
algoritmos considerando um dado problema. Esta solução visa prover algoritmos otimizados que
sejam adequados para o problema dado e reduzir o custo computacional do processo de geração
significativamente quando comparado ao de outras hiper-heurísticas. A hiper-heurística proposta
combina uma abordagem de seleção de algoritmos com uma hiper-heurística de geração. A hiperheurística
de geração é responsável por criar uma base de conhecimento, que contém algoritmos
que foram gerados para um conjunto de problemas. Uma vez que esta base de conhecimento
esteja disponível, ela é usada como fonte de algoritmos a serem recomendados pela abordagem de
seleção de algoritmos. A ideia é reusar algoritmos previamente construídos pela hiper-heurística
de geração em problemas similares. Vale salientar que a criação de hiper-heurísticas visando
reduzir o custo de geração de algoritmos sem comprometer a qualidade destes algoritmos não foi
estudada na literatura. Além disso, hiper-heurísticas híbridas que combinam de abordagens de
seleção de algoritmos e hiper-heurísticas de geração para a otimização de algoritmos, proposta
nesta tese, é novidade. Para avaliar o algoritmo proposto, foi considerada como estudo de caso
a otimização do algoritmo baseado em enxames (PSO). Nos experimentos realizados, foram
considerados 32 problemas de otimização. O algoritmo proposto foi avaliado quanto à sua
capacidade de recomendar bons algoritmos para problemas de entrada, se estes algoritmos
atingem resultados competitivos frente à literatura. Além disso, o sistema foi avaliado quanto à
sua precisão na recomendação, ou seja, se o algoritmo recomendado seria, de fato, o melhor a
ser selecionado. Os resultados mostraram que a hiper-heurística proposta é capaz de recomendar
algoritmos úteis para os problemas de entrada e de forma eficiente. Adicionalmente, os algoritmos
recomendados atingiram resultados competitivos quando comparados com algoritmos estado da
arte e a recomendação dos algoritmos atingiu um alto percentual de precisão. / Designing an algorithm or heuristic to solve a given problem is a challenging task due to the
variety of possible design choices and the lack of clear guidelines on how to choose and/or
combine them. For instance, the performance of an optimization algorithm depends on the
designofitssearchoperatorsaswellasanadequatesettingofspecifichyper-parameters,eachof
them with many possible options to choose from. Because of that, there is a growing research
interest in automating the design of algorithms by exploring mainly optimization and machine
learningapproaches,aimingtomakethealgorithmdesignprocessmoreindependentfromhuman
interaction. Different approaches have dealt with the task of optimizing algorithms as another
(meta)optimization problem. These approaches are commonly called hyper-heuristics, where
each solution of the search space is a possible algorithm. Initially, hyper-heuristics were applied
for the selection of parameters in a predefined and limited search space. Nonetheless, recently,
generation hyper-heuristics have been developed to generate algorithms from a set of specified
components and functions. Generation hyper-heuristics are considered more flexible than the
selection ones due to its capacity to create new and customized algorithms for a given problem.
Hyper-heuristics have been widely used for the optimization of meta-heuristics. However, the
search process becomes expensive because the evaluation of each solution depends on the
execution of an algorithm in a problem. In this work, a novel hyper-heuristic was developed
to optimize algorithms considering a given problem. The proposed approach aims to provide
optimizedalgorithmsfortheinputproblemandreducethecomputationalcostoftheoptimization
process significantly when compared to other hyper-heuristics. The proposed hyper-heuristics
combines an automated algorithm selection method with a generation hyper-heuristic. The
generation hyper-heuristic is responsible for the creation of the knowledge base, which contains
previously built algorithms for a set of problems. Once the knowledge base is available, it
is used as a source of algorithms to be recommended by the automated algorithm selection
method. The idea is to reuse the algorithms already built by the generation hyper-heuristic on
similar problems. It is worth mentioning that the creation of hyper-heuristics aiming to reduce
the cost of the algorithm generation without harming the quality of these algorithms were not
studied yet. Besides, hybrid hyper-heuristics which combine an algorithm selection approach
with a generation hyper-heuristic for the algorithm optimization, proposed in this thesis, are a
novelty. To evaluate the proposed algorithm, it was considered as case study the optimization
of the Particle Swarm Optimization algorithm (PSO). In our experiments, we considered 32
optimizationproblems.Theproposedsystemwasevaluatedregardingitscapacitytorecommend
adequate algorithms for an input problem, the quality of the recommended algorithms, and,
finally, regarding its accuracy to recommend algorithms. The results showed that the proposed
system recommends useful algorithms for the input problem. Besides, the algorithms achieved
competitive results when compared to state-of-the-art algorithms, and also, the system presented
a high percentage of accuracy in the recommendation.
|
20 |
Uso de meta-aprendizado na recomendação de meta-heurísticas para o problema do caixeiro viajante / Using meta-learning on the recommendation of meta-heuristics for the traveling salesman problemKanda, Jorge Yoshio 07 December 2012 (has links)
O problema do caixeiro viajante (PCV) é um problema clássico de otimização que possui diversas variações, aplicações e instâncias. Encontrar a solução ótima para muitas instâncias desse problema é geralmente muito difícil devido o alto custo computacional. Vários métodos de otimização, conhecidos como meta-heurísticas (MHs), são capazes de encontrar boas soluções para o PCV. Muitos algoritmos baseados em diversas MHs têm sido propostos e investigados para diferentes variações do PCV. Como não existe um algoritmo universal que encontre a melhor solução para todas as instâncias de um problema, diferentes MHs podem prover a melhor solução para diferentes instâncias do PCV. Desse modo, a seleção a priori da MH que produza a melhor solução para uma dada instância é uma tarefa difícil. A pesquisa desenvolvida nesta tese investiga o uso de abordagens de meta-aprendizado para selecionar as MHs mais promissoras para novas instâncias de PCV. Essas abordagens induzem meta-modelos preditivos a partir do treinamento das técnicas de aprendizado de máquina em um conjunto de meta-dados. Cada meta-exemplo, em nosso conjunto de meta-dados, representa uma instância de PCV descrita por características (meta-atributos) do PCV e pelo desempenho das MHs (meta-atributo alvo) para essa instância. Os meta-modelos induzidos são usados para indicar os valores do meta-atributo alvo para novas instâncias do PCV. Vários experimentos foram realizados durante a investigação desta pesquisa e resultados importantes foram obtidos / The traveling salesman problem (TSP) is a classical optimization problem that has several variations, applications and instances. To find the optimal solution for many instances of this problem is usually a very hard task due to high computational cost. Various optimization methods, known as metaheuristics (MHs), are capable to generate good solutions for the TSP. Many algorithms based on different MHs have been proposed and investigated for different variations of the TSP. Different MHs can provide the best optimization solution for different TSP instances, since there is no a universal algorithm able to find the best solution for all instances. Thus, a priori selection of the MH that produces the best solution for a given instance is a hard task. The research developed in this thesis investigates the use of meta-learning approaches to select the most promising MHs for new TSP instances. These approaches induce predictive meta-models from the training of machine learning techniques on a set of meta-data. In our meta-data, each meta-example is a TSP instance described by problem characteristics (meta-features) and performance of MHs (target meta-features) for this instance. The induced meta-models are used to indicate the values of the target meta-feature for new TSP instances. During the investigation of this research, several experiments were performed and important results were obtained
|
Page generated in 0.0491 seconds