1 |
[en] HYBRID GENETIC ALGORITHM FOR THE MINIMUM SUM-OF-SQUARES CLUSTERING PROBLEM / [pt] ALGORITMO GENÉTICO HÍBRIDO PARA O PROBLEMA DE CLUSTERIZAÇÃO MINIMUM SUM-OF-SQUARESDANIEL LEMES GRIBEL 27 July 2017 (has links)
[pt] Clusterização desempenha um papel importante em data mining, sendo útil em muitas áreas que lidam com a análise exploratória de dados, tais como recuperação de informações, extração de documentos e segmentação de imagens. Embora sejam essenciais em aplicações de data mining, a maioria
dos algoritmos de clusterização são métodos ad-hoc. Eles carecem de garantias na qualidade da solução, que em muitos casos está relacionada a uma convergência prematura para um mínimo local no espaço de busca. Neste trabalho, abordamos o problema de clusterização a partir da perspectiva de otimização, onde propomos um algoritmo genético híbrido para resolver o problema Minimum Sum-of-Squares Clustering (MSSC, em inglês). A meta-heurística proposta é capaz de escapar de mínimos locais e gerar soluções quase ótimas para o problema MSSC. Os resultados mostram que o método proposto superou os resultados atuais da literatura – em termos de qualidade da solução – para quase todos os conjuntos de instâncias considerados para o problema MSSC. / [en] Clustering plays an important role in data mining, being useful in many fields that deal with exploratory data analysis, such as information retrieval, document extraction, and image segmentation. Although they are essential in data mining applications, most clustering algorithms are adhoc methods. They have a lack of guarantee on the solution quality, which in many cases is related to a premature convergence to a local minimum of the search space. In this research, we address the problem of data clustering from an optimization perspective, where we propose a hybrid genetic algorithm to solve the Minimum Sum-of-Squares Clustering (MSSC) problem. This meta-heuristic is capable of escaping from local minima and generating near-optimal solutions to the MSSC problem. Results show that the proposed method outperformed the best current literature results - in terms of solution quality - for almost all considered sets of benchmark
instances for the MSSC objective.
|
2 |
[pt] MONITORAMENTO DE VIBRAÇÃO EM SISTEMAS MECÂNICOS USANDO APRENDIZADO PROFUNDO E RASO EM COMPUTADORES NA PONTA / [en] VIBRATION MONITORING OF MECHANICAL SYSTEMS USING DEEP AND SHALLOW LEARNING ON EDGE-COMPUTERSCAROLINA DE OLIVEIRA CONTENTE 30 June 2022 (has links)
[pt] O monitoramento de integridade estrutural tem sido o foco de desenvolvimentos recentes no campo da avaliação baseada em vibração e, mais recentemente, no escopo da internet das coisas à medida que medição e computação se
tornam distribuídas. Os dados se tornaram abundantes, embora a transmissão
nem sempre seja viável em frequências mais altas especialmente em aplicações
remotas. Portanto, é importante conceber fluxos de trabalho de modelo orientados por dados que garantam a melhor relação entre a precisão do modelo
para avaliação de condição e os recursos computacionais necessários para soluções incorporadas, tópico que não tem sido amplamente utilizado no contexto
de medições baseadas em vibração. Neste contexto, a presente pesquisa propõe
abordagens para duas aplicações: na primeira foi proposto um fluxo de trabalho
de modelagem capaz de reduzir a dimensão dos parâmetros de modelos autorregressivos usando análise de componentes principais e classificar esses dados
usando algumas técnicas de aprendizado de máquina como regressão logística,
máquina de vetor de suporte, árvores de decisão, k-vizinhos próximos e floresta
aleatória. O exemplo do prédio de três andares foi usado para demonstrar a
eficácia do método. No segundo caso, é utilizado um equipamento de teste
composto por inércias rotativas onde a solução de monitoramento foi testada
em uma plataforma baseada em GPU embarcada. Os modelos implementados
para distinguir eficazmente os diferentes estados de atrito foram análise de
componentes principais, deep autoencoders e redes neurais artificiais. Modelos
rasos têm melhor desempenho em tempo de execução e precisão na detecção
de condições de falha. / [en] Structural health monitoring has been the focus of recent developments
in vibration-based assessment and, more recently, in the scope of the internet
of things as measurement and computation become distributed. Data has become abundant even though the transmission is not always feasible, especially
in remote applications. It is thus essential to devise data-driven model workflows that ensure the best compromise between model accuracy for condition
assessment and the computational resources needed for embedded solutions.
This topic has not been widely used in the context of vibration-based measurements. In this context, the present research proposes two approaches for
two applications, a static and a rotating one. In case one, a modeling workflow capable of reducing the dimension of autoregressive model features using
principal component analysis and classifying this data using some of the main
machine learning techniques such as logistic regression, support vector machines, decision tree classifier, k-nearest neighborhood and random forest classifier was proposed. The three-story building example was used to demonstrate
the method s effectiveness, together with ways to assess the best compromise
between accuracy and model size. In case two, a test rig composed of rotating inertias and slender connecting rods is used, and the monitoring solution
was tested in an embedded GPU-based platform. The models implemented to
effectively distinguish between different friction states were principal component analysis, deep autoencoder and artificial neural networks. Shallow models
perform better concerning running time and accuracy in detecting faulty conditions.
|
3 |
[en] A MIP APPROACH FOR COMMUNITY DETECTION IN THE STOCHASTIC BLOCK MODEL / [pt] UMA ABORDAGEM DE PROGRAMAÇÃO INTEIRA MISTA PARA DETECÇÃO DE COMUNIDADES NO STOCHASTIC BLOCK MODELBRENO SERRANO DE ARAUJO 04 November 2020 (has links)
[pt] O Degree-Corrected Stochastic Block Model (DCSBM) é um modelo popular para geração de grafos aleatórios com estrutura de comunidade, dada uma sequência de graus esperados. O princípio básico de algoritmos que utilizam o DCSBM para detecção de comunidades é ajustar os parâmetros do modelo a dados observados, de forma a encontrar a estimativa de máxima verossimilhança, ou maximum likelihood estimate (MLE), dos parâmetros do modelo. O problema de otimização para o MLE é comumente resolvido por meio de heurísticas. Neste trabalho, propomos métodos de programação matemática, para resolver de forma exata o problema de otimização descrito, e comparamos os métodos propostos com heurísticas baseadas no algoritmo de expectation-maximization (EM). Métodos exatos são uma ferramenta fundamental para a avaliação de heurísticas, já que nos permitem identificar se uma solução heurística é sub-ótima e medir seu gap de otimalidade. / [en] The Degree-Corrected Stochastic Block Model (DCSBM) is a popular model to generate random graphs with community structure given an expected degree sequence. The standard approach of community detection algorithms based on the DCSBM is to search for the model parameters which are the most likely to have produced the observed network data, via maximum likelihood estimation (MLE). Current techniques for the MLE problem are heuristics and therefore do not guarantee convergence to the optimum. We present
mathematical programming formulations and exact solution methods that can provably find the model parameters and community assignments of maximum likelihood given an observed graph. We compare the proposed exact methods with classical heuristic algorithms based on expectation-maximization (EM).
The solutions given by exact methods give us a principled way of recognizing when heuristic solutions are sub-optimal and measuring how far they are from optimality.
|
4 |
[pt] ESTIMAÇÃO DA TENSÃO MECÂNICA USANDO ONDAS ULTRASSÔNICAS GUIADAS E MACHINE LEARNING / [en] MECHANICAL STRESS ESTIMATION USING GUIDED ULTRASONIC WAVES AND MACHINE LEARNINGCHRISTIAN DEYVI VILLARES HOLGUIN 11 July 2022 (has links)
[pt] Devido ao efeito acoustoelástico, as Ondas guiadas ultrassônicas (UGWs)
têm sido usadas para estimar a tensão mecânica com baixo custo de forma não
destrutiva. O Aprendizado de maquina (ML) tem sido aplicado para mapear
formas complexas de ondas para estimar a tensão mecânica, embora aspectos
importantes como precisão e consumo computacional não tenham sido explorados. Na literatura também não há muito trabalho sobre o uso do aprendizado
não supervisionado para a rotulagem automática de amostras com diferentes
estados de tensão. Portanto, esta tese apresenta duas abordagens: i) a abordagem supervisionada propõe uma metodologia de modelagem de dados que
otimiza a precisão e a implementação computacional, para a estimação da tensão baseada em UGWs em tempo real e ii) a abordagem não supervisionada
compara estruturas não supervisionadas para rotular um pequeno conjunto de
dados de acordo com o estado de tensão. Para o primeiro, foram avaliados
modelos de aprendizagem superficial e profunda com redução de dimensionalidade, estes modelos são criados e testados usando um procedimento de
hold-out Monte-Carlo para avaliar sua robustez. Os resultados mostram que,
utilizando modelos superficiais e Análise de componentes principais (PCA),
foi obtida uma melhoria de precisão e no consumo de hardware em comparação com o estado da arte com modelos de redes neurais profundas. Para o
segundo, métodos de redução de dimensionalidade: PCA e t-distributed stochastic neighbor embedding (t-SNE), são usados para extrair características
de sinais UGWs. As características são usadas para agrupar as amostras em
estados de baixa, média e alta tensão. Uma análise qualitativa e quantitativa
dos resultados foi realizada, considerando a análise de métricas para agrupamento, o PCA realizou o melhor agrupamento, qualitativamente, mostrando
menos sobreposição en grupos do que t-SNE. As duas abordagens utilizadas
nesta tese, conseguiram extrair características significativas que ajudam tanto
na estimativa quanto tanto na rotulagem de dados, contribuindo para a criação
de modelos de ML mais eficientes e no problema de interpretação de UGWs. / [en] Due to the acoustoelastic effect, Ultrasonic Guided Waves (UGWs)
have been used to estimate mechanical stress in a non-expensive and nondestructively fashion. Machine Learning (ML) has been applied to map complex waveforms to stress estimates, though important aspects, such as accuracy
and hardware consumption, have not been explored. Previously in the literature, there are also not many works on the use of unsupervised learning for
automatic labeling of samples with different stress states. Therefore, this thesis
presents two approaches, (i) the supervised approach aims to propose a data
modeling methodology that optimizes accuracy and computational implementation, for real-time ultrasonic based stress estimation and (ii) the unsupervised approach aims at comparing unsupervised frameworks to label a small
dataset according to the stress state. For the former, shallow and deep learning
models with dimensionality reduction were evaluated, these models are created
and tested using a Monte-Carlo holdout procedure to evaluate their robustness
under different stress conditions. The results show that, using shallow models and Principal Component Analysis (PCA), an accuracy improvement and
hardware consumption as compared to the state of the art reported with deep
neural network models were obtained. For the latter, dimensionality reduction
methods: PCA and t-distributed stochastic neighbor embedding (t-SNE), are
used to extract features from UGWs signals with different stress levels. The
features are used to group the samples into low, medium and high stress states.
A qualitative and quantitative analysis of the results was performed. Considering the analysis of metrics for clustering, PCA performed the best clustering,
qualitatively, showing less overlapping of clusters than t-SNE. The two approaches used in this thesis, managed to extract meaningful features which
helped in both estimation and stress labeling, contributing to the creation of
more efficient ML models and in the problem of interpreting UGWs.
|
Page generated in 0.031 seconds