101 |
[en] A MODEL-BASED FRAMEWORK FOR SEMI-SUPERVISED CLUSTERING AND COMMUNITY DETECTION / [pt] UM FRAMEWORK BASEADO EM MODELO PARA CLUSTERIZAÇÃO SEMISSUPERVISIONADA E DETECÇÃO DE COMUNIDADESDANIEL LEMES GRIBEL 09 September 2021 (has links)
[pt] Em clusterização baseada em modelos, o objetivo é separar amostras de
dados em grupos significativos, otimizando a aderência dos dados observados a
um modelo matemático. A recente adoção de clusterização baseada em modelos
tem permitido a profissionais e usuários mapearem padrões complexos nos
dados e explorarem uma ampla variedade de aplicações. Esta tese investiga
abordagens orientadas a modelos para detecção de comunidades e para o estudo
de clusterização semissupervisionada, adotando uma perspectiva baseada em
máxima verossimilhança. Focamos primeiramente na exploração de técnicas
de otimização com restrições para apresentar um novo modelo de detecção de
comunidades por meio de modelos de blocos estocásticos (SBMs). Mostramos
que a formulação com restrições revela comunidades estruturalmente diferentes
daquelas obtidas com modelos clássicos. Em seguida, estudamos um cenário
onde anotações imprecisas são fornecidas na forma de relações must-link e
cannot-link, e propomos um modelo de clusterização semissupervisionado.
Nossa análise experimental mostra que a incorporação de supervisão parcial
e de conhecimento prévio melhoram significativamente os agrupamentos. Por
fim, examinamos o problema de clusterização semissupervisionada na presença
de rótulos de classe não confiáveis. Investigamos o caso em que grupos de
anotadores deliberadamente classificam incorretamente as amostras de dados
e propomos um modelo para lidar com tais anotações incorretas. / [en] In model-based clustering, we aim to separate data samples into meaningful
groups by optimizing the fit of some observed data to a mathematical model.
The recent adoption of model-based clustering has allowed practitioners to
model complex patterns in data and explore a wide range of applications. This thesis investigates model-driven approaches for community detection and semisupervised clustering by adopting a maximum-likelihood perspective. We first focus on exploiting constrained optimization techniques to present a new model for community detection with stochastic block models (SBMs). We show that the proposed constrained formulation reveals communities structurally different from those obtained with classical community detection models. We then study a setting where inaccurate annotations are provided as must-link and cannot-link relations, and propose a novel semi-supervised clustering model.
Our experimental analysis shows that incorporating partial supervision and
appropriately encoding prior user knowledge significantly enhance clustering performance. Finally, we examine the problem of semi-supervised clustering in the presence of unreliable class labels. We focus on the case where groups of untrustworthy annotators deliberately misclassify data samples and propose a model to handle such incorrect statements.
|
102 |
[en] ADAPTIVE ROUTING IN DATA COMMUNICATION NETWORKS THROUGH REINFORCEMENT LEARNING / [pt] ROTEAMENTO ADAPTATIVO EM REDES DE COMUNICAÇÃO DE DADOS POR REINFORCEMENT LEARNING / [es] RUTEAMIENTO ADAPTATIVO EN REDES DE COMUNICACIÓN DE DATOR POR REINFORCEMENT LEARNINGYVAN JESUS TUPAC VALDIVIA 13 March 2001 (has links)
[pt] Esta dissertação investiga a aplicação dos métodos de
Reinforcement Learning na descoberta de rotas ótimas em uma
rede de comunicação. Uma rede de comunicação real possui um
comportamento dinâmico, mudando seu estado com o tempo. Os
algoritmos de roteamento devem, portanto, oferecer rapidez
na resposta às mudanças do estado da rede. O objetivo do
trabalho é avaliar a aplicação de técnicas de Reinforcement
Learning (RL) como base de algoritmos adaptativos de
roteamento de pacotes. O problema de roteamento de pacotes
sob a visão de RL consiste na definição de cada nó na rede
como um agente RL, sendo que este agente deve definir ações
de forma a minimizar uma função objetivo que pode ser o
tempo de roteamento dos pacotes. Um dos objetivos do RL é
precisamente aprender a tomar as ações que minimizem uma
função. O trabalho consistiu de 4 etapas principais: um
estudo sobre a área de Reinforcement Learning (RL); um
estudo sobre a área de redes de comunicação e roteamento de
pacotes; a modelagem do problema de roteamento como um
sistema RL e implementação de diferentes métodos de RL para
obter algoritmos de roteamento; e o estudo de casos.
O estudo na área de Reinforcement Learning abrangeu desde
as definições mais fundamentais: suas características, os
elementos de um sistema RL e modelagem do ambiente como um
Processo de Decisão de Markov, até os métodos básicos de
solução: Programação Dinâmica, método de Monte Carlo, e o
método de Diferenças Temporais. Neste último método, foram
considerados dois algoritmos específicos: TD e Q-Learning.
Em seguida, foi avaliado o parâmetro Eligibility Traces
como uma alternativa para apressar o processo de
aprendizado, obtendo o TD(lambda) e o Q(lambda)
respectivamente. O estudo sobre Redes de Comunicação e
Roteamento de pacotes envolveu os conceitos básicos de
redes de comunicações, comutação por pacotes, a questão do
roteamento de pacotes e os algoritmos existentes
adaptativos e não adaptativos, que são utilizados na
atualidade. Nas redes de comunicação, definidas como um
conjunto de nós ligados através de enlaces de comunicação,
para se enviar uma mensagem de um nó a outro, geralmente, a
mensagem é quebrada em pedaços, chamados pacotes, e
enviados através de outros nós, até chegar ao destino.
Deste modo surge o problema de escolher os nós que levem o
pacote o mais rápido possível até o nó destino. Os
algoritmos analisados foram: Shortest Path Routing que
procura os caminhos com menor número de nós
intermediários, não sendo sensível às mudanças na carga nem
na topologia da rede; Weighted Shortest Path Routing, que
oferece um melhor desempenho a partir de uma visão global
do estado da rede, que nem sempre é fácil de obter em redes
reais e o algoritmo de Bellman-Ford, baseado em decisões de
roteamento locais e atualizações periódicas, com algumas
limitações para obter políticas em altas cargas. Este
último é um dos algoritmos mais utilizados na atualidade,
sendo base de muitos protocolos de roteamento existentes.
A modelagem do problema de roteamento como um sistema RL
foi inspirada por uma característica na definição de um
sistema RL: um agente que interage com o ambiente e aprende
a atingir um objetivo. Assim, a modelagem dos algoritmos
tem como objetivo aprender a descobrir as rotas que
minimizem o tempo de roteamento de pacotes desde uma origem
até um dado destino. A avaliação de uma rota escolhida não
pode ser obtida antes que o pacote alcance o seu destino
final. Este fato faz com que os processos de aprendizado
supervisionado tenham dificuldade de se aplicar a esse
problema. Por outro lado, o Reinforcement Learning não
necessita de um par entrada-resposta para fazer o
aprendizado, permitindo-lhe abordar o problema com relativa
facilidade. Na modelagem efetuada, cada nó na rede se
comporta como um agente de RL que age na própria rede, a
qual é o ambiente. A informação das rotas é armazenada nas
funções de valor existentes em todos os nós da rede para / [en] This dissertation investigates the application of
Reinforcement Learning methods to the discovery of
optimal routes in communication networks. Any current
communication network displays dynamic behavior,
changing its states over time. Therefore, the routing
algorithms must react swiftly to changes in the network
status. The objective of this work is to evaluate the
application of some Reinforcement Learning techniques to
define adaptive packet routing algorithms. The packet
routing problem under the RL vision consists in the
definition of each node on network as an RL agent. Thus,
each agent must take actions in order to minimize an
objective function such as end to end packet routing delay.
One main objective of the RL is precisely learning to
take the actions that minimize a given function.
This thesis is consists of 4 main parts: first, a study of
Reinforcement Learning (RL); a study of the
communication networks and packet routing; the routing
problem model as a RL system and the implementation
of several RL methods in order to obtain some routing
algorithms; e finally, the case study.
The study of Reinforcement Learning extends from the more
basic definitions, Reinforcement Learning
features, elements of a RL system and environment modeling
as a Markovian Decision Process, to the basic
methods of solution: Dynamic Programming, Monte Carlo
methods and Temporal Differences methods. In this
last case, two specific algorithms have been considered: TD
and Q-Learning, and, finally, the Eligibility Traces
are evaluated as a useful tool that permits us to
accelerate the learning process leading to the TD(lambda)
and the Q(lambda) routing algorithms. The study on
communication networks and packet routing
involves the foundations of communication networks, packet
switching, the packet routing problem, and adaptive and non-
adaptive routing algorithms used
at the present time. Communication networks are defined as
a set of nodes connected through communication
links. In order to send a message from a source node to a
destination node usually the message is broken into
segments called packets, and these are sent through other
nodes until arriving at the destination. In this way the
problem appears to choose the path which takes the shortest
possible time for the packet to reach the destination
node. The following algorithms have been analyzed: Shortest
Path Routing that looks for paths with minimal
hop number, not being sensible to the changes of load level
and network topology; Weighted Shortest Path
Routing that offers better performance from a global vision
of the state of the network, which is not always easy
to get in real networks; on the other hand, the Bellman-
Ford routing algorithm was studied, this is based on local
routing decisions and periodic updates, with some
limitations to obtain policies in high load conditions.
Bellman-Ford
is one of the algorithms most used at the present time,
being the basis for many existing routing protocols.
The modeling of the routing problem as a RL system was
inspired by one of the main features of the
definition of an RL system: an agent who interacts with the
environment and learns to reach an objective;
therefore, the modeling of the routing algorithms has as
its objective to learn to discover the paths that minimize
packet routing time from an origin to an destination. The
evaluation of a chosen route cannot be completed
before the package reaches its final destination. This fact
implies that supervised learning cannot be applied to
the routing problem. On the other hand, Reinforcement
Learning does not need a input-output pair for the
learning process, allowing it to approach the problem with
relative ease. In the modeling, each network node is
viewed as a RL agent that acts in the same network; the
network is the environment. The routing information is
stored in the existing value functions in all nodes in the
network, for each node and all another destination node / [es] Esta disertación investiga la aplicación de los métodos de
Reinforcement Learning en la determinación de rutas óptimas
en una red de comunicación. Una red de comunicación real
posee un comportamiento dinámico, donde su estado varia en
el tiempo. Los algoritmos de ruta óptima deben, por lo
tanto, ofrecer rapidez en la respuesta a las variaciones
del estado de la red. El objetivo de este trabajo es
evaluar la aplicación de técnicas de Reinforcement Learning
(RL) como base de algoritmos adaptativos de problemas de
ruteamiento en redes. Este problema consiste en la
definición de cada nodo de la red como un agente RL. Este
agente debe definir acciones de modo a minimizar una
función objetivo que puede ser el tiempo de ruteamiento.
El trabajo consta de 4 etapas principais: un estudio sobre
el área de Reinforcement Learning (RL); un estudio sobre
redes de comunicación y problema de ruteamiento; el modelo
de ruta óptima como un sistema RL y la implementación de
diferentes métodos de RL para obtener algoritmos de ruta
óptima; y un estudio de casos.
El estudio en el área de Reinforcement Learning va desde
las definiciones fundamentales: características, elementos
de un sistema RL y modelaje del ambiente como un Proceso de
Decisión de Markov, hasta los métodos básicos de solución:
Programación Dinámica, método de Monte Carlo, y método de
Diferencias Temporales. En este último método, fueron
considerados dos algoritmos específicos: TD e Q-Learning.
A seguir, fue evaluado el parámetro Eligibility Traces como
una alternativa para agilizar el proceso de aprendizaje,
obteniendo el TD(lambda) y el Q(lambda) respectivamente.
El estudio sobre Redes de Comunicación y Problema de
Transporte incluye los conceptos básicos de redes de
comunicaciones, la cuestión de la ruta óptima y los
algoritmos adaptativos y no adaptativos existentes, que se
utilizan actualmente. Los algoritmos analizados fueron:
Shortest Path Routing, que busca los caminos con menor
número de nodos intermedios, no siendo sensible a
variaciones en la carga ni en la topología de la red;
Weighted Shortest Path Routing, que ofrece un mejor
desempeño a partir de una visión global del estado de la
red, que no siempre es fácil de obtener en redes reales; y
el algoritmo de Bellman-Ford, que tiene como base
decisiones de rutas locales y actualizaciones periódicas,
con algunas limitaciones para obtener políticas en altas
cargas. Este último es uno de los algoritmos más utilizados
en la actualidad, siendo base de muchos protocolos de
trazado de ruta existentes. La solución para modelar el
problema de ruteamiento como un
sistema RL fue inspirada por una característica en la
definición de un sistema RL: un agente que interactúa con
el ambiente y aprende a alcanzar un objetivo. Así, el
modelo tiene como objetivo aprender a determinar las rutas
que minimizen el timpo desde el origen hasta un destino
dado. La evaluación de uma ruta seleccionada no puede ser
obtenida antes que el paquete alcance su destino final.
Esto hace que los procesos de aprendizaje supervisionado
tengan dificultades para ser aplicados a este problema. Por
otro lado, Reinforcement Learning no necesita de un par
entrada-salida para el aprendizaje, permitiendo así,
abordar el problema con relativa facilidad. En el modelo
establecido, cada nodo en la red se comporta como un agente
de RL que actúa en la propria red.
La información de las rutas se almacena en las funciones de
valor existentes en todos los nodos de la red para cada
nodo destino diferente. Esta información contiene un valor
estimado del tiempo requerido para un paquete para llegar
hasta el nodo destino. La actualización de esos valores se
realiza durante la transición del paquete hasta el vecino
seleccionado. En este trabajo se implementaron varios
algoritmos de ruta óptima. Cada uno de los algoritmos
aplica características de las técnicas en Reinforcement
Learning: o Q(lambda)-Routing, y el TD-Routing. En el
estudio d
|
103 |
[pt] EXPLORANDO A FRONTEIRA DE OTIMIZAÇÃO COMBINATÓRIA E APRENDIZADO DE MÁQUINA: APLICAÇÕES PARA ROTEAMENTO DE VEÍCULOS E MÁQUINAS DE VETORES DE SUPORTE / [en] EXPLORING THE FRONTIER OF COMBINATORIAL OPTIMIZATION AND MACHINE LEARNING: APPLICATIONS TO VEHICLE ROUTING AND SUPPORT VECTOR MACHINESITALO GOMES SANTANA 04 November 2022 (has links)
[pt] A otimização combinatória (OC) está presente em inúmeras aplicações
práticas (por exemplo, planejamento de produção, logística, etc.). Ao longo dos
anos, OC e aprendizado de máquina (AM) surgiram, juntas, como uma área
prospectiva de pesquisa para melhorar processos de tomada de decisão. Nesse
contexto, há interesse em utilizar algoritmos de AM para melhorar métodos
de OC. Por outro lado, como muitas tarefas de AM podem ser reformuladas
como problemas de otimização, há um amplo interesse em utilizar métodos de
OC para resolver esses problemas. Nesta tese, três estudos que conectam OC
e AM em torno de duas aplicações importantes são conduzidos: o problema de
roteamento de veículos capacitado (PRVC) e máquinas de vetores de suporte
com perda em margem rígida (SVM-HML – do inglês support vector machines
with hard-margin loss). No primeiro estudo, uma estratégia para explorar
vizinhanças de busca local de alta ordem por mineração de padrões em duas
meta-heurísticas estado da arte para o PRVC é proposta. Em um segundo
estudo, também no contexto do PRVC, critérios de relacionamento para nós
de clientes baseados em saídas de redes neurais em grafos são explorados. Com
base nessas saídas, medidas de relação podem ser exploradas para orientar a
busca local e estender operadores de cruzamento em um algoritmo genético
estado da arte. Por fim, no terceiro estudo, uma abordagem eficiente de
programação inteira mista baseada em cortes combinatórios de Benders e
estratégias de amostragem são utilizadas para treinar modelos de SVM-HML
de maneira mais eficiente. / [en] Combinatorial optimization (CO) is ubiquitous in myriad practical applications (e.g., production planning, scheduling, logistics, etc.). Over the years, CO and machine learning (ML) have emerged, together, as a prospective area of research for improving decision-making processes. There is interest to harness
ML algorithms to improve existing CO methods. Conversely, since many ML tasks can be reformulated as optimization problems, there is broad interest in leveraging state-of-the-art CO methods for them. In this thesis, we conduct three studies that connect CO and ML around two important applications:
the capacitated vehicle routing problem (CVRP) and support vector machines with hard-margin loss (SVM-HML). Our first study proposes a strategy to explore high-order local-search neighborhoods by pattern mining into two state-of-the-art metaheuristics for the CVRP. In a second study, also in the
context of the CVRP, we exploit relatedness criteria for customer nodes using predictions from graph neural networks. We show that relatedness measures can be exploited to steer local search and extend crossover operators in a stateof- the-art genetic algorithm. Lastly, in a third study, we propose an efficient
mixed-integer programming approach based on Combinatorial Benders cuts and sampling strategies for optimally training the SVM-HML.
|
104 |
[pt] APRENDIZADO DE MÁQUINA PARA DETECÇÃO DE FALHAS NO TRATAMENTO DE EFLUENTES INDUSTRIAIS DA INDÚSTRIA DE PANIFICAÇÃO POR ELETROCOAGULAÇÃO / [en] MACHINE LEARNING FOR FAILURE DETECTION IN BAKERY INDUSTRIAL EFFLUENTS TREATMENT BY ELECTROCOAGULATIONTHIAGO DA SILVA RIBEIRO 19 October 2023 (has links)
[pt] A eletrocoagulação é um método emergente de tratamento de efluentes que
combina os benefícios da coagulação, flotação e eletroquímica. Devido à
complexidade inerente às operações de uma estação de tratamento de efluentes, é
um desafio reagir com rapidez e precisão às condições dinâmicas necessárias para
manter a qualidade do efluente. Portanto, esta tese tem como objetivo identificar a
condição operacional de uma estação de tratamento de efluentes que adotou a
eletrocoagulação para o tratamento de efluentes de panificação. Três condições
operacionais baseadas em clarificação do efluente e lodo da reação foram as
variáveis-alvo. A tese está dividida em dois ensaios. O primeiro usou sete métodos
de seleção de atributos para selecionar as variáveis mais importantes em um
determinado conjunto de dados. O desempenho dos modelos de classificação de
redes neurais treinados no conjunto de atributos original foi comparado ao
desempenho daqueles que foram treinados em um subconjunto curado usando
técnicas de seleção de atributos. O modelo que utilizou a seleção de atributos
apresentou o melhor desempenho (F1-score = 0,92) e uma melhoria de mais de 30 por cento
na prevenção de falsos positivos. A segunda contribuição trouxe um modelo que
poderia detectar o comportamento anômalo do processo usando apenas imagens
coloridas da superfície do efluente obtidas através de dois módulos de câmera de
tamanho pequeno. O desempenho de vários métodos, incluindo MLP, LSTM, SVM
e XGBoost foi avaliado. O modelo LSTM superou os outros em termos de Precisão
(84,620 por cento), Recall (84,531 por cento) e F1-score (84,499 por cento), mas o modelo XGBoost vem
em segundo lugar com Precisão (83,922 por cento), Recall (82,272 por cento) e F1-score
(83,005 por cento). / [en] Electrocoagulation is an emerging wastewater treatment method that
combines the benefits of coagulation, flotation, and electrochemistry. As a result of
the inherent complexity of processes associated with wastewater treatment plants,
it is difficult to respond swiftly and correctly to the dynamic circumstances that are
necessary to ensure effluent quality. Therefore, this thesis aims to identify the
operational condition of a wastewater treatment plant that has adopted
electrocoagulation for treating bakery wastewater. Three operational conditions
based on effluent clarification and reaction sludge were the target variables. The
thesis is divided into two essays. The first endeavor used seven feature selection
methods to select the most important features in a given dataset. The performance
of neural network classification models trained on the original feature set was
compared to the performance of those that were trained on a subset of features that
had been curated using feature selection techniques. The model that utilised feature
selection was found to have the best performance (F1-score = 0.92) and an
improvement of more than 30 percent in preventing false positives. The second
contribution brought a model that could detect anomalous process behavior using
only wastewater surface color images from two small-size camera modules. The
performance of various methods, including MLP, LSTM, SVM, and XGBoost was
assessed. The LSTM model outperformed the others in terms of macro average
Precision (84.620 percent), Recall (84.531 percent), and F1-score (84.499 percent), but the XGBoost
model comes closely in second with Precision (83.922 percent), Recall (82.272 percent), and
F1-score (83.005 percent).
|
105 |
[en] PORTFOLIO SELECTION USING ROBUST OPTIMIZATION AND SUPPORT VECTOR MACHINE (SVM) / [pt] SELEÇÃO DE PORTFÓLIO USANDO OTIMIZAÇÃO ROBUSTA E MÁQUINAS DE SUPORTE VETORIALROBERTO PEREIRA GARCIA JUNIOR 26 October 2021 (has links)
[pt] A dificuldade de se prever movimento de ativos financeiros é objeto
de estudo de diversos autores. A fim de se obter ganhos, se faz necessário
estimar a direção (subida ou descida) e a magnitude do retorno do ativo
no qual pretende-se comprar ou vender. A proposta desse trabalho consiste
em desenvolver um modelo de otimização matemática com variáveis
binárias capaz de prever movimentos de subidas e descidas de ativos financeiros
e utilizar um modelo de otimização de portfólio para avaliar os
resultados obtidos. O modelo de previsão será baseado no Support Vector
Machine (SVM), no qual faremos modificações na regularização do modelo
tradicional. Para o gerenciamento de portfólio será utilizada otimização robusta.
As técnicas de otimização estão sendo cada vez mais aplicadas no
gerenciamento de portfólio, pois são capazes de lidar com os problemas das
incertezas introduzidas na estimativa dos parâmetros. Vale ressaltar que o
modelo desenvolvido é data-driven, i.e, as previsões são feitas utilizando sinais
não-lineares baseados em dados de retorno/preço histórico passado sem
ter nenhum tipo de intervenção humana.
Como os preços dependem de muitos fatores é de se esperar que um
conjunto de parâmetros só consiga descrever a dinâmica dos preços dos
ativos financeiros por um pequeno intervalo de dias. Para capturar de forma
mais precisa essa mudança na dinâmica, a estimação dos parâmetros dos
modelos é feita em janela móvel.
Para testar a acurácia dos modelos e os ganhos obtidos foi feito um estudo de
caso utilizando 6 ativos financeiros das classes de moedas, renda fixa, renda
variável e commodities. Os dados abrangem o período de 01/01/2004 até
30/05/2018 totalizando um total de 3623 cotações diárias. Considerando
os custos de transações e os resultados out-of-sample obtidos no período
analisado percebe-se que a carteira de investimentos desenvolvida neste
trabalho exibe resultados superiores aos dos índices tradicionais com risco
limitado. / [en] The difficulty of predicting the movement of financial assets is the
subject of study by several authors. In order to obtain gains, it is necessary
to estimate the direction (rise or fall) and the magnitude of the return on
the asset in which it is intended to be bought or sold. The purpose of this
work is to develop a mathematical optimization model with binary variables
capable of predicting up and down movements of financial assets and using
a portfolio optimization model to evaluate the results obtained. The prediction
model will be based on the textit Support Vector Machine (SVM),
in which we will make modifications in the regularization of the traditional
model. For the portfolio management will be used robust optimization. The
robust optimization techniques are being increasingly applied in portfolio
management, since they are able to deal with the problems of the uncertainties
introduced in the estimation of the parameters. It is noteworthy that
the developed model is data-driven, i.e., the predictions are made using
nonlinear signals based on past historical price / return data without any
human intervention. As prices depend on many factors it is to be expected that a set of
parameters can only describe the dynamics of the prices of financial assets
for a small interval of days. In order to more accurately capture this change
in dynamics, the estimation of model parameters is done in a moving window
To test the accuracy of the models and the gains obtained, a case study
was made using 6 financial assets of the currencies, fixed income, variable
income and commodities classes. The data cover the period from 01/01/2004
until 05/30/2018 totaling a total of 3623 daily quotations. Considering the
transaction costs and out-of-sample results obtained in the analyzed period,
it can be seen that the investment portfolio developed in this work shows
higher results than the traditional indexes with limited risk.
|
106 |
[en] A CRITICAL VIEW ON THE INTERPRETABILITY OF MACHINE LEARNING MODELS / [pt] UMA VISÃO CRÍTICA SOBRE A INTERPRETABILIDADE DE MODELOS DE APRENDIZADO DE MÁQUINAJORGE LUIZ CATALDO FALBO SANTO 29 July 2019 (has links)
[pt] À medida que os modelos de aprendizado de máquina penetram áreas críticas como medicina, sistema de justiça criminal e mercados financeiros, sua opacidade, que impede que as pessoas interpretem a maioria deles, se tornou um problema a ser resolvido. Neste trabalho, apresentamos uma nova taxonomia para classificar qualquer método, abordagem ou estratégia para lidar com o problema da interpretabilidade de modelos de aprendizado de máquina. A taxonomia proposta que preenche uma lacuna existente nas estruturas de taxonomia atuais em relação à percepção subjetiva de diferentes intérpretes sobre um mesmo modelo. Para avaliar a taxonomia proposta, classificamos as contribuições de artigos científicos relevantes da área. / [en] As machine learning models penetrate critical areas like medicine, the criminal justice system, and financial markets, their opacity, which hampers humans ability to interpret most of them, has become a problem to be solved. In this work, we present a new taxonomy to classify any method, approach or strategy to deal with the problem of interpretability of machine learning models. The proposed taxonomy fills a gap in the current taxonomy frameworks regarding the subjective perception of different interpreters about the same model. To evaluate the proposed taxonomy, we have classified the contributions of some relevant scientific articles in the area.
|
107 |
[pt] GERAÇÃO DE DESCRIÇÕES DE PRODUTOS A PARTIR DE AVALIAÇÕES DE USUÁRIOS USANDO UM LLM / [en] PRODUCT DESCRIPTION GENERATION FROM USER REVIEWS USING A LLMBRUNO FREDERICO MACIEL GUTIERREZ 04 June 2024 (has links)
[pt] No contexto de comércio eletrônico, descrições de produtos exercem
grande influência na experiência de compra. Descrições bem feitas devem
idealmente informar um potencial consumidor sobre detalhes relevantes do
produto, esclarecendo potenciais dúvidas e facilitando a compra. Gerar boas
descrições, entretanto, é uma atividade custosa, que tradicionalmente exige
esforço humano. Ao mesmo tempo, existe uma grande quantidade de produtos
sendo lançados a cada dia. Nesse contexto, este trabalho apresenta uma nova
metodologia para a geração automatizada de descrições de produtos, usando
as avaliações deixadas por usuários como fonte de informações. O método
proposto é composto por três etapas: (i) a extração de sentenças adequadas
para uma descrição a partir das avaliações (ii) a seleção de sentenças dentre
as candidatas (iii) a geração da descrição de produto a partir das sentenças
selecionadas usando um Large Language Model (LLM) de forma zero-shot.
Avaliamos a qualidade das descrições geradas pelo nosso método comparando-as com descrições de produto reais postadas pelos próprios anunciantes. Nessa
avaliação, contamos com a colaboração de 30 avaliadores, e verificamos que
nossas descrições são preferidas mais vezes do que as descrições originais,
sendo consideradas mais informativas, legíveis e relevantes. Além disso, nessa
mesma avaliação replicamos um método da literatura recente e executamos
um teste estatístico comparando seus resultados com o nosso método, e dessa
comparação verificamos que nosso método gera descrições mais informativas e
preferidas no geral. / [en] In the context of e-commerce, product descriptions have a great influence on the shopping experience. Well-made descriptions should ideally inform a potential consumer about relevant product details, clarifying potential doubt sand facilitating the purchase. Generating good descriptions, however, is a costly activity, which traditionally requires human effort. At the same time, there are a large number of products being launched every day. In this context, this work presents a new methodology for the automated generation of product descriptions, using reviews left by users as a source of information. The proposed method consists of three steps: (i) the extraction of suitable sentences for a description from the reviews (ii) the selection of sentences among the candidates (iii) the generation of the product description from the selected sentences using a Large Language Model (LLM) in a zero-shot way. We evaluate the quality of descriptions generated by our method by comparing them to real product descriptions posted by sellers themselves. In this evaluation, we had the collaboration of 30 evaluators, and we verified that our descriptions are preferred more often than the original descriptions, being considered more informative, readable and relevant. Furthermore, in this same evaluation we replicated a method from recent literature and performed a statistical test comparing its results with our method, and from this comparison we verified that our method generates more informative and preferred descriptions overall.
|
108 |
[pt] ESTIMAÇÃO DA TENSÃO MECÂNICA USANDO ONDAS ULTRASSÔNICAS GUIADAS E MACHINE LEARNING / [en] MECHANICAL STRESS ESTIMATION USING GUIDED ULTRASONIC WAVES AND MACHINE LEARNINGCHRISTIAN DEYVI VILLARES HOLGUIN 11 July 2022 (has links)
[pt] Devido ao efeito acoustoelástico, as Ondas guiadas ultrassônicas (UGWs)
têm sido usadas para estimar a tensão mecânica com baixo custo de forma não
destrutiva. O Aprendizado de maquina (ML) tem sido aplicado para mapear
formas complexas de ondas para estimar a tensão mecânica, embora aspectos
importantes como precisão e consumo computacional não tenham sido explorados. Na literatura também não há muito trabalho sobre o uso do aprendizado
não supervisionado para a rotulagem automática de amostras com diferentes
estados de tensão. Portanto, esta tese apresenta duas abordagens: i) a abordagem supervisionada propõe uma metodologia de modelagem de dados que
otimiza a precisão e a implementação computacional, para a estimação da tensão baseada em UGWs em tempo real e ii) a abordagem não supervisionada
compara estruturas não supervisionadas para rotular um pequeno conjunto de
dados de acordo com o estado de tensão. Para o primeiro, foram avaliados
modelos de aprendizagem superficial e profunda com redução de dimensionalidade, estes modelos são criados e testados usando um procedimento de
hold-out Monte-Carlo para avaliar sua robustez. Os resultados mostram que,
utilizando modelos superficiais e Análise de componentes principais (PCA),
foi obtida uma melhoria de precisão e no consumo de hardware em comparação com o estado da arte com modelos de redes neurais profundas. Para o
segundo, métodos de redução de dimensionalidade: PCA e t-distributed stochastic neighbor embedding (t-SNE), são usados para extrair características
de sinais UGWs. As características são usadas para agrupar as amostras em
estados de baixa, média e alta tensão. Uma análise qualitativa e quantitativa
dos resultados foi realizada, considerando a análise de métricas para agrupamento, o PCA realizou o melhor agrupamento, qualitativamente, mostrando
menos sobreposição en grupos do que t-SNE. As duas abordagens utilizadas
nesta tese, conseguiram extrair características significativas que ajudam tanto
na estimativa quanto tanto na rotulagem de dados, contribuindo para a criação
de modelos de ML mais eficientes e no problema de interpretação de UGWs. / [en] Due to the acoustoelastic effect, Ultrasonic Guided Waves (UGWs)
have been used to estimate mechanical stress in a non-expensive and nondestructively fashion. Machine Learning (ML) has been applied to map complex waveforms to stress estimates, though important aspects, such as accuracy
and hardware consumption, have not been explored. Previously in the literature, there are also not many works on the use of unsupervised learning for
automatic labeling of samples with different stress states. Therefore, this thesis
presents two approaches, (i) the supervised approach aims to propose a data
modeling methodology that optimizes accuracy and computational implementation, for real-time ultrasonic based stress estimation and (ii) the unsupervised approach aims at comparing unsupervised frameworks to label a small
dataset according to the stress state. For the former, shallow and deep learning
models with dimensionality reduction were evaluated, these models are created
and tested using a Monte-Carlo holdout procedure to evaluate their robustness
under different stress conditions. The results show that, using shallow models and Principal Component Analysis (PCA), an accuracy improvement and
hardware consumption as compared to the state of the art reported with deep
neural network models were obtained. For the latter, dimensionality reduction
methods: PCA and t-distributed stochastic neighbor embedding (t-SNE), are
used to extract features from UGWs signals with different stress levels. The
features are used to group the samples into low, medium and high stress states.
A qualitative and quantitative analysis of the results was performed. Considering the analysis of metrics for clustering, PCA performed the best clustering,
qualitatively, showing less overlapping of clusters than t-SNE. The two approaches used in this thesis, managed to extract meaningful features which
helped in both estimation and stress labeling, contributing to the creation of
more efficient ML models and in the problem of interpreting UGWs.
|
109 |
[en] DESIGN AND ACTIVATION OF A PNEUMATIC GECKO ROBOT WITH APPLICATION OF MACHINE LEARNING / [pt] PROJETO E ACIONAMENTO DE UM ROBÔ LAGARTIXA PNEUMÁTICO COM APLICAÇÃO DE APRENDIZADO COMPUTACIONALMATHEUS RODRIGUES GOEBEL 07 November 2022 (has links)
[pt] Este trabalho apresenta um projeto mecânico de um robô lagartixa pneumática, capaz de se locomover em superfícies inclinadas em relação ao solo, através apenas de atuadores lineares que utilizam o ar comprimido como fonte de energia. Como parte fundamental do projeto mecânico neste trabalho, um sistema de garra é desenvolvido gerando vácuo mecanicamente, para haver uma economia de consumo energético no robô em comparação com os acessórios comerciais geralmente utilizados para esta tarefa de fixação. Com o protótipo de conceito fabricado e montado, o mesmo é submetido a uma bateria de testes com o intuito de posteriormente aplicar os dados obtidos em uma rede neural artificial, visando o aprendizado computacional dos movimentos do robô e, assim, sua otimização de velocidade em determinada sequência de movimentação. Após o treinamento desta rede neural, o protótipo é submetido a novos experimentos para verificar a eficiência do treinamento realizado e qual o impacto real obtido no robô. Finalmente, com a utilização de um sistema de câmeras, os deslocamentos do robô em diversas situações distintas são rastreados, visando gerar gráficos comparativos e analisar a repetibilidade e confiabilidade do sistema. / [en] This work presents the mechanical design of a pneumatic gecko robot, capable of moving on inclined surfaces with respect to the ground, using only linear actuators with compressed air as a source of energy. As a fundamental part of the mechanical design in this work, a claw system is developed by generating vacuum mechanically, significantly reducing the energy consumption of the robot when compared to commercial accessories generally used for this clamping task. With the concept prototype manufactured and assembled, a series of tests are conducted to later apply the collected data in an artificial neural network. This network allows the computational learning of the robot movements, and thus its speed optimization for a certain defined gait. After training this neural network, the prototype is submitted to new experiments to verify the efficiency of the training performed and the real impact obtained on the robot. Furthermore, with the use of a camera system, the movements of the robot along several different situations are tracked, generating comparative graphs to analyze the repeatability and reliability of the system.
|
110 |
[en] ON MACHINE LEARNING TECHNIQUES TOWARD PATH LOSS MODELING IN 5G AND BEYOND WIRELESS SYSTEMS / [pt] SOBRE TÉCNICAS DE APRENDIZADO DE MÁQUINA EM DIREÇÃO À MODELAGEM DE PERDA DE PROPAGAÇÃO EM SISTEMAS SEM FIO 5G E ALÉMYOIZ ELEDUVITH NUNEZ RUIZ 09 November 2023 (has links)
[pt] A perda de percurso (PL) é um parâmetro essencial em modelos de propagação e crucial na determinação da área de cobertura de sistemas móveis. Osmétodos de aprendizado de máquina (ML) tornaram-se ferramentas promissoras para a previsão de propagação de rádio. No entanto, ainda existem algunsdesafios para sua implantação completa, relacionados à seleção das entradasmais significativas do modelo, à compreensão de suas contribuições para asprevisões do modelo e à avaliação adicional da capacidade de generalizaçãopara amostras desconhecidas. Esta tese tem como objetivo projetar modelosde PL baseados em ML otimizados para diferentes aplicações das tecnologias5G e além. Essas aplicações abrangem links de ondas milimétricas (mmWave)para ambientes indoor e outdoor na faixa de frequência de 26,5 a 40 GHz,cobertura de macrocélulas no espectro sub-6 GHz e comunicações veicularesusando campanhas de medições desenvolvidas em CETUC, Rio de Janeiro,Brazil. Vários algoritmos de ML são explorados, como redes neurais artificiais(ANN), regressão de vetor de suporte (SVR), floresta aleatória (RF) e aumentode árvore de gradiente (GTB). Além disso, estendemos dois modelos empíricospara mmWave com previsão de PL melhorada. Propomos uma metodologiapara seleção robusta de modelos de ML e uma metodologia para selecionar ospreditores mais adequados para as máquinas consideradas com base na melhoria de desempenho e na interpretabilidade do modelo. Além disso, para o canalveículo-veículo (V2V), uma técnica de rede neural convolucional (CNN) também é proposta usando uma abordagem de aprendizado por transferência paralidar com conjuntos de dados pequenos. Os testes de generalização propostosmostram a capacidade dos modelos de ML de aprender o padrão entre as entradas do modelo e a PL, mesmo em ambientes e cenários mais desafiadoresde amostras desconhecidas. / [en] Path loss (PL) is an essential parameter in propagation models and critical in determining mobile systems coverage area. Machine learning (ML)
methods have become promising tools for radio propagation prediction. However, there are still some challenges for its full deployment, concerning to selection of the most significant model s inputs, understanding their contributions
to the model s predictions, and a further evaluation of the generalization capacity for unknown samples. This thesis aims to design optimized ML-based PL
models for different applications for the 5G and beyond technologies. These applications encompass millimeter wave (mmWave) links for indoor and outdoor
environments in the frequency band from 26.5 to 40 GHz, macrocell coverage in
the sub-6 GHz spectrum, and vehicular communications using measurements
campaign carried out by the Laboratory of Radio-propagation, CETUC, in Rio
de Janeiro, Brazil. Several ML algorithms are exploited, such as artificial neural network (ANN), support vector regression (SVR), random forest (RF), and
gradient tree boosting (GTB). Furthermore, we have extended two empirical
models for mmWave with improved PL prediction. We proposes a methodology
for robust ML model selection and a methodology to select the most suitable
predictors for the machines considered based on performance improvement and
the model s interpretability. In adittion, for the vehicle-to-vehicle (V2V) channel, a convolutional neural network (CNN) technique is also proposed using a
transfer learning approach to deal with small datasets. The generalization tests
proposed shows the ability of the ML models to learn the pattern between the
model’s inputs and PL, even in more challenging environments and scenarios
of unknown samples.
|
Page generated in 0.0508 seconds