Spelling suggestions: "subject:"aprendizagem dde maquinas"" "subject:"aprendizagem dde maquinaria""
61 |
[en] A MACHINE LEARNING APPROACH FOR PORTUGUESE TEXT CHUNKING / [pt] UMA ABORDAGEM DE APRENDIZADO DE MÁQUINA PARA SEGMENTAÇÃO TEXTUAL NO PORTUGUÊSGUILHERME CARLOS DE NAPOLI FERREIRA 10 February 2017 (has links)
[pt] A segmentação textual é uma tarefa de Processamento de Linguagem Natural
muito relevante, e consiste na divisão de uma sentença em sequências disjuntas
de palavras sintaticamente relacionadas. Um dos fatores que contribuem
fortemente para sua importância é que seus resultados são usados como significativos
dados de entrada para problemas linguísticos mais complexos. Dentre
esses problemas estão a análise sintática completa, a identificação de orações,
a análise sintática de dependência, a identificação de papéis semânticos e a
tradução automática. Em particular, abordagens de Aprendizado de Máquina
para estas tarefas beneficiam-se intensamente com o uso de um atributo de
segmentos textuais. Um número respeitável de eficazes estratégias de extração
de segmentos para o inglês foi apresentado ao longo dos últimos anos. No entanto,
até onde podemos determinar, nenhum estudo abrangente foi feito sobre
a segmentação textual para o português, de modo a demonstrar seus benefícios.
O escopo deste trabalho é a língua portuguesa, e seus objetivos são dois. Primeiramente,
analisamos o impacto de diferentes definições de segmentação,
utilizando uma heurística para gerar segmentos que depende de uma análise
sintática completa previamente anotada. Em seguida, propomos modelos de
Aprendizado de Máquina para a extração de segmentos textuais baseados na
técnica Aprendizado de Transformações Guiado por Entropia. Fazemos uso do
corpus Bosque, do projeto Floresta Sintá(c)tica, nos nossos experimentos. Utilizando
os valores determinados diretamente por nossa heurística, um atributo
de segmentos textuais aumenta a métrica F beta igual 1 de um sistema de identificação
de orações para o português em 6.85 e a acurácia de um sistema de análise
sintática de dependência em 1.54. Ademais, nosso melhor extrator de segmentos
apresenta um F beta igual 1 de 87.95 usando anotaçoes automáticas de categoria
gramatical. As descobertas indicam que, de fato, a informação de segmentação
textual derivada por nossa heurística é relevante para tarefas mais elaboradas
cujo foco é o português. Além disso, a eficácia de nossos extratores é comparável à dos similares do estado-da-arte para o inglês, tendo em vista que os
modelos propostos são razoavelmente simples. / [en] Text chunking is a very relevant Natural Language Processing task, and
consists in dividing a sentence into disjoint sequences of syntactically correlated
words. One of the factors that highly contribute to its importance is that its
results are used as a significant input to more complex linguistic problems.
Among those problems we have full parsing, clause identification, dependency
parsing, semantic role labeling and machine translation. In particular, Machine
Learning approaches to these tasks greatly benefit from the use of a chunk
feature. A respectable number of effective chunk extraction strategies for the
English language has been presented during the last few years. However, as
far as we know, no comprehensive study has been done on text chunking for
Portuguese, showing its benefits. The scope of this work is the Portuguese
language, and its objective is twofold. First, we analyze the impact of different
chunk definitions, using a heuristic to generate chunks that relies on previous
full parsing annotation. Then, we propose Machine Learning models for chunk
extraction based on the Entropy Guided Transformation Learning technique.
We employ the Bosque corpus, from the Floresta Sintá(c)tica project, for our
experiments. Using golden values determined by our heuristic, a chunk feature
improves the F beta equal 1 score of a clause identification system for Portuguese by 6.85
and the accuracy of a dependency parsing system by 1.54. Moreover, our best
chunk extractor achieves a F beta equal 1 of 87.95 when automatic part-of-speech tags
are applied. The empirical findings indicate that, indeed, chunk information
derived by our heuristic is relevant to more elaborate tasks targeted on
Portuguese. Furthermore, the effectiveness of our extractors is comparable to
the state-of-the-art similars for English, taking into account that our proposed
models are reasonably simple.
|
62 |
[en] CLASSIFICATION OF OBJECTS IN REAL CONTEXT BY CONVOLUTIONAL NEURAL NETWORKS / [pt] CLASSIFICAÇÃO DE OBJETOS EM CONTEXTO REAL POR REDES NEURAIS CONVOLUTIVASLUIS MARCELO VITAL ABREU FONSECA 08 June 2017 (has links)
[pt] A classificação de imagens em contexto real é o ápice tecnológico do reconhecimento de objetos. Esse tipo de classificação é complexo, contendo diversos problemas de visão computacional em abundância. Este projeto
propõe solucionar esse tipo de classificação através do uso do conhecimento no aprendizado de máquina aplicado ao dataset do MS COCO. O algoritmo implementado neste projeto consiste de um modelo de Rede Neural Convolutiva que consegue aprender características dos objetos e realizar predições sobre suas classes. São elaborados alguns experimentos que comparam diferentes resultados de predições a partir de diferentes técnicas de aprendizado. É também realizada uma comparação dos resultados da implementação com o estado da arte na segmentação de objetos em contexto. / [en] The classification of objects in real contexts is the technological apex of object recognition. This type of classification is complex, containing diverse computer vision problems in abundance. This project proposes
to solve that type of classification through the use of machine learning knowledge applied to the MS COCO dataset. The implemented algorithm in this project consists of a Convolutional Neural Network model that
is able to learn characteristics of the objects and predict their classes. Some experiments are made that compare different results of predictions using different techniques of learning. There is also a comparison of the results from the implementation with state of art in contextual objects segmentation.
|
63 |
[en] FIOT: AN AGENT-BASED FRAMEWORK FOR SELF-ADAPTIVE AND SELF-ORGANIZING INTERNET OF THINGS APPLICATIONS / [pt] FIOT: UM FRAMEWORK BASEADO EM AGENTES PARA APLICAÇÕES AUTO-ORGANIZÁVEIS E AUTOADAPTATIVAS DE INTERNET DAS COISASNATHALIA MORAES DO NASCIMENTO 01 June 2016 (has links)
[pt] A ideia principal da Internet das Coisas (IoT) é conectar bilhões de
coisas à Internet nos próximos anos, a exemplo de carros, roupas e comidas.
Entretanto, muitos problemas precisam ser resolvidos antes que essa
ideia possa ser concretizada. Alguns desses problemas estão relacionados à
necessidade de construir sistemas para IoT que sejam auto-organizáveis e
autoadaptativos. Este trabalho, portanto, apresenta a elaboração do Framework
para Internet das Coisas (FIoT), que oferece suporte ao desenvolvimento
de aplicações para IoT com essas características. Ele é baseado nos
paradigmas de Sistemas Multiagente (SMA) e algumas técnicas abordadas
em Aprendizado de Máquina, a exemplo de redes neurais e algoritmos evolutivos.
Um agente pode ter algumas características, como autonomia e
sociabilidade, que tornam SMAs compatíveis com sistemas que requerem
auto-organização. Redes neurais e algoritmos de evolução vêm sendo comumente
usados nos estudos de robótica, no intuito de prover autonomia e
adaptação à agentes físicos (ex.: robôs, sensores). Para demonstrar o uso
do FIoT, dois grupos de problemas em IoT serão instanciados: (i) Cidades
Inteligentes e (ii) Quantificação de Coisas. / [en] The agreed fact about the Internet of Things (IoT) is that, within
the coming years, billions of resources, such as cars, clothes and foods will
be connected to the Internet. However, several challenging issues need to
be addressed before the IoT vision becomes a reality. Some open problems
are related to the need of building self-organizing and self-adaptive IoT
systems. To create IoT applications with these features, this work presents a
Framework for Internet of Things (FIoT). Our approach is based on concepts
from Multi-Agent Systems (MAS) and Machine Learning Techniques, such
as a neural network and evolutionary algorithms. An agent could have
characteristics, such as autonomy and social ability, which makes MAS
suitable for systems requiring self-organization (SO). Neural networks and
algorithms of evolution have been commonly used in robotic studies to
provide embodied agents (as robots and sensors) with autonomy and
adaptive capabilities. To illustrate the use of FIoT, we derived two different
instances from IoT applications: (i) Quantified Things and (ii) Smart Cities.
We show how exible points of our framework are instantiated to generate
an application.
|
64 |
[en] ARTIFICIAL INTELLIGENCE METHODS APPLIED TO MECHANICAL ENGINEERING PROBLEMS / [pt] MÉTODOS DE INTELIGÊNCIA ARTIFICIAL APLICADOS A PROBLEMAS DE ENGENHARIA MECÂNICAPEDRO HENRIQUE LEITE DA SILVA PIRES DOMINGUES 05 June 2020 (has links)
[pt] Problemas reais de engenharia mecânica podem compreender tarefas de i) otimização multi-objetivo (MO) ou ii) regressão, classificação e predição. Os métodos baseados em inteligência artificial (AI) são bastante difundidos na resolução desses problemas por i) demandarem menor custo computacional e informações do domínio do problema para a resolução de uma MO, quando comparados com métodos de programação matemática, por exemplo; e ii) apresentarem melhores resultados com estrutura mais simples, adaptabilidade e interpretabilidade, em contraste com outros métodos. Sendo assim, o presente trabalho busca i) otimizar um controle proporcional-integral-derivativo (PID) aplicado a um sistema de frenagem anti-travamento de rodas (ABS) e o projeto de trocadores de calor de placas
aletadas (PFHE) e casco-tubo (STHE) através de métodos de otimização baseados AI, buscando o desenvolvimento de novas versões dos métodos aplicados, e.g. multi-objective salp swarm algorithm (MSSA) e multi-objective heuristic Kalman algorithm (MOHKA), que melhorem a performance da
otimização; ii) desenvolver um sistema de detecção de vazamento em dutos (LDS) sensível ao roubo de combustível a partir do treinamento de árvores de decisão (DTs) com features baseadas no tempo e na análise de componentes principais (PCA), ambas exraídas de dados de transiente de pressão de operação normal do duto e de roubo de combustível; iii) constituir um guia de aplicação para problemas de MO de controle e projeto, processo de extração de features e treinamento de classificadores baseados em aprendizado de máquina (MLCs), através de aprendizado supervisionado; e, por fim iv) demonstrar o potencial das técnicas baseadas em AI. / [en] Real-world mechanical engineering problems may comprise tasks of i) multi-objective optimization (MO) or ii) regression, classification and prediction. The use of artificial intelligence (AI) based methods for solving these problems are widespread for i) demanding less computational cost and problem domain information to solve the MO, when compared with mathematical programming for an example; and ii) presenting better results with simpler structure, adaptability and interpretability, in contrast to other methods. Therefore, the present work seeks to i) optimize a proportional-integral-derivative control (PID) applied to an anti-lock braking system (ABS) and the heat exchanger design of plate-fin (PFHE) and shell-tube (STHE) types through AI based optimization methods, seeking to develop new versions of the applied methods, e.g. multi-objective salp swarm algorithm (MSSA) and multi-objective heuristic Kalman algorithm (MOHKA), which enhance the optimization performance; ii) develop a pipeline leak detection system (LDS) sensitive to fuel theft by training decision trees (DTs) with features based on time and principal component analysis (PCA), both extracted from pressure transient data of regular pipeline operation and fuel theft; iii) constitute an application guide for control and design MO problems, feature extraction process and machine learning classifiers (MLCs) training through supervised learning; and, finally, iv) demonstrate the potential of AI-based techniques.
|
65 |
[pt] ENSAIOS SOBRE PREVISÃO DE INFLAÇÃO: DESAGREGAÇÃO, COMBINAÇÃO DE PREVISÕES E DADOS NÃO ESTRUTURADOS / [en] ESSAYS CONCERNING INFLATION FORECASTING: DISAGGREGATION, COMBINATION OF FORECASTS, AND UNSTRUCTURED DATAGILBERTO OLIVEIRA BOARETTO 07 August 2023 (has links)
[pt] Esta tese consiste em três ensaios sobre previsão de inflação, com foco na
inflação brasileira. No primeiro ensaio, examinamos a eficácia de vários métodos
de previsão para prever a inflação, com foco na agregação de previsões desagregadas.
Consideramos diferentes níveis de desagregação para a inflação e empregamos
uma variedade de técnicas tradicionais de séries temporais, bem como
modelos lineares e não lineares de aprendizado de máquina que lidam com um
número grande de preditores. Para muitos horizontes de previsão, a agregação
de previsões desagregadas performa tão bem quanto expectativas baseadas em
coleta e modelos que geram previsões a partir do agregado. No geral, os métodos
de aprendizado de máquina superam os modelos de séries temporais tradicionais
em precisão preditiva, com excelente desempenho para os desagregados da inflação.
Em nosso segundo ensaio, investigamos os potenciais benefícios de combinar
previsões de inflação individuais ao propor uma correção para viés variável no
tempo da média de previsões. Nossa análise inclui estimações empregando janelas
rolantes e modelos em espaço de estados que usam a recursividade do filtro
de Kalman. Obtivemos um bom desempenho de previsão para modelos baseados
em janelas rolantes pequenas em horizontes de previsão curtos e intermediários,
enquanto um modelo em espaço de estados obtem um desempenho um pouco
pior do que os procedimentos baseados em janelas rolantes. No terceiro ensaio,
usamos aprendizado supervisionado para gerar índices prospectivos baseados
em tweets e notícias para inflação acumulada e investigamos se esses índices podem
melhorar o desempenho da previsão de inflação. Nossos resultados indicam
que os índices baseados em notícias fornecem ganhos preditivos significativos,
principalmente para os horizontes de 3 e 12 meses à frente. Esses achados sugerem
que a incorporação de mais fontes de informação do que apenas expectativas
baseadas em opiniões de especialistas pode levar a previsões mais precisas. / [en] This dissertation consists of three essays concerning inflation forecasting,
taking the Brazilian case as an application. In the first essay, we examine the effectiveness
of several forecasting methods for predicting inflation, focusing on
aggregating disaggregated forecasts. We consider different disaggregation levels
for inflation and employ a range of traditional time series techniques, as well as linear
and nonlinear machine learning (ML) models that deal with a larger number
of predictors. For many forecast horizons, aggregation of disaggregated forecasts
performs just as well as survey-based expectations and models generating forecasts
directly from the aggregate. Overall, ML methods outperform traditional
time series models in predictive accuracy, with outstanding performance in forecasting
disaggregates. In our second essay, we investigate the potential benefits of
combining individual inflation forecasts by proposing a time-varying bias correction
for the average forecast. Our analysis includes estimations using both rolling
windows and state-space models that use the recursiveness of the Kalman filter.
We achieve good forecast performance for models based on small rolling windows
for shorter and intermediate forecast horizons, while a state-space model
performs slightly worse than procedures based on rolling windows. In the third
essay, we use supervised learning to generate forward-looking indexes based on
tweets and news articles for accumulated inflation and investigate whether these
indexes can improve inflation forecasting performance. Our results indicate that
news-based indexes provide significant predictive gains, particularly for 3- and
12-month-ahead horizons. These findings suggest that incorporating more information
sources than just expectations based on experts opinions can lead to more
accurate forecasts.
|
66 |
[en] ALGORITHMS FOR TABLE STRUCTURE RECOGNITION / [pt] ALGORITMOS PARA RECONHECIMENTO DE ESTRUTURAS DE TABELASYOSVENI ESCALONA ESCALONA 26 June 2020 (has links)
[pt] Tabelas são uma forma bastante comum de organizar e publicar dados. Por exemplo, a Web possui um enorme número de tabelas publicadas em HTML, embutidas em documentos em PDF, ou que podem ser simplesmente baixadas de páginas Web. Porém, tabelas nem sempre são fáceis de interpretar pois possuem uma grande variedade de características e são organizadas de diversas formas. De fato, um grande número de métodos e ferramentas foram desenvolvidos para interpretação de tabelas. Esta dissertação apresenta a implementação de um algoritmo, baseado em Conditional Random Fields (CRFs), para classificar as linhas de uma tabela em linhas de cabeçalho, linhas de dados e linhas de metadados.
A implementação é complementada por dois algoritmos para reconhecimento de tabelas em planilhas, respectivamente baseados em regras e detecção de regiões. Por fim, a dissertação descreve os resultados e os benefícios obtidos pela aplicação dos algoritmos a tabelas em formato HTML, obtidas da Web, e a tabelas em forma de planilhas, baixadas do Web site da Agência Nacional de Petróleo. / [en] Tables are widely adopted to organize and publish data. For example, the Web has an enormous number of tables, published in HTML, imbedded in PDF documents, or that can be simply downloaded from Web pages. However, tables are not always easy to interpret because of the variety of features and formats used. Indeed, a large number of methods and tools have been developed to interpret tables. This dissertation presents the implementation of an algorithm, based on Conditional Random Fields (CRFs), to classify the rows of a table as header rows, data rows or metadata rows. The implementation is complemented by two algorithms for table recognition in a spreadsheet document, respectively based on rules and on region detection. Finally, the dissertation describes the results and the benefits obtained by applying the implemented algorithms to HTML tables, obtained from the Web, and to spreadsheet tables, downloaded from the Brazilian National Petroleum Agency.
|
67 |
[pt] MONITORAMENTO DE VIBRAÇÃO EM SISTEMAS MECÂNICOS USANDO APRENDIZADO PROFUNDO E RASO EM COMPUTADORES NA PONTA / [en] VIBRATION MONITORING OF MECHANICAL SYSTEMS USING DEEP AND SHALLOW LEARNING ON EDGE-COMPUTERSCAROLINA DE OLIVEIRA CONTENTE 30 June 2022 (has links)
[pt] O monitoramento de integridade estrutural tem sido o foco de desenvolvimentos recentes no campo da avaliação baseada em vibração e, mais recentemente, no escopo da internet das coisas à medida que medição e computação se
tornam distribuídas. Os dados se tornaram abundantes, embora a transmissão
nem sempre seja viável em frequências mais altas especialmente em aplicações
remotas. Portanto, é importante conceber fluxos de trabalho de modelo orientados por dados que garantam a melhor relação entre a precisão do modelo
para avaliação de condição e os recursos computacionais necessários para soluções incorporadas, tópico que não tem sido amplamente utilizado no contexto
de medições baseadas em vibração. Neste contexto, a presente pesquisa propõe
abordagens para duas aplicações: na primeira foi proposto um fluxo de trabalho
de modelagem capaz de reduzir a dimensão dos parâmetros de modelos autorregressivos usando análise de componentes principais e classificar esses dados
usando algumas técnicas de aprendizado de máquina como regressão logística,
máquina de vetor de suporte, árvores de decisão, k-vizinhos próximos e floresta
aleatória. O exemplo do prédio de três andares foi usado para demonstrar a
eficácia do método. No segundo caso, é utilizado um equipamento de teste
composto por inércias rotativas onde a solução de monitoramento foi testada
em uma plataforma baseada em GPU embarcada. Os modelos implementados
para distinguir eficazmente os diferentes estados de atrito foram análise de
componentes principais, deep autoencoders e redes neurais artificiais. Modelos
rasos têm melhor desempenho em tempo de execução e precisão na detecção
de condições de falha. / [en] Structural health monitoring has been the focus of recent developments
in vibration-based assessment and, more recently, in the scope of the internet
of things as measurement and computation become distributed. Data has become abundant even though the transmission is not always feasible, especially
in remote applications. It is thus essential to devise data-driven model workflows that ensure the best compromise between model accuracy for condition
assessment and the computational resources needed for embedded solutions.
This topic has not been widely used in the context of vibration-based measurements. In this context, the present research proposes two approaches for
two applications, a static and a rotating one. In case one, a modeling workflow capable of reducing the dimension of autoregressive model features using
principal component analysis and classifying this data using some of the main
machine learning techniques such as logistic regression, support vector machines, decision tree classifier, k-nearest neighborhood and random forest classifier was proposed. The three-story building example was used to demonstrate
the method s effectiveness, together with ways to assess the best compromise
between accuracy and model size. In case two, a test rig composed of rotating inertias and slender connecting rods is used, and the monitoring solution
was tested in an embedded GPU-based platform. The models implemented to
effectively distinguish between different friction states were principal component analysis, deep autoencoder and artificial neural networks. Shallow models
perform better concerning running time and accuracy in detecting faulty conditions.
|
68 |
[pt] AVALIAÇÃO NÃO-DESTRUTIVA DE DUTOS E SOLDAS BASEADA EM DADOS ULTRASSÔNICOS NO CONTEXTO DA INDÚSTRIA DE ÓLEO E GÁS / [en] DATA-DRIVEN ULTRASONIC NON-DESTRUCTIVE EVALUATION OF PIPES AND WELDS IN THE CONTEXT OF THE OIL AND GAS INDUSTRYGUILHERME REZENDE BESSA FERREIRA 31 January 2022 (has links)
[pt] A avaliação não destrutiva ultrassônica é de extrema importância na
indústria de óleo e gás, principalmente para ativos e estruturas sujeitos
a condições que aceleram os mecanismos de falha. Apesar de amplamente
difundidos, os métodos ultrassônicos não destrutivos dependem de uma força
de trabalho especializada, sendo, portanto, suscetíveis a erros e demorados.
Nesse contexto, métodos de reconhecimento de padrões, como o aprendizado de
máquina, se encaixam convenientemente para solucionar os desafios da tarefa.
Assim, este trabalho tem como objetivo a aplicação de técnicas de inteligência
artificial para abordar a interpretação de dados adquiridos por meio de
avaliação não destrutiva ultrassônica no contexto da indústria de óleo e gás.
Para tanto, esta dissertação envolve três estudos de caso. Primeiramente, sinais
de ondas guiadas ultrassônicas são usados para classificar os defeitos presentes
em juntas soldadas de compósito termoplástico. Os resultados mostraram que,
ao usar atributos extraídos com modelos autoregressivos, a acurácia do modelo
de aprendizado de máquina melhora em pelo menos 72,5 por cento. Em segundo lugar,
dados ultrassônicos em formato de imagens são usados para construir um
sistema de diagnóstico de solda automático. A estrutura proposta resultou
em um modelo computacionalmente eficiente, capaz de realizar classificações
com acurácia superior à 99 por cento. Por fim, dados obtidos por simulação numérica
foram usados para criar um modelo de aprendizado profundo visando estimar
a severidade de defeitos semelhantes à corrosão em dutos. Resultados de R2
superiores a 0,99 foram alcançados. / [en] Ultrasonic non-destructive evaluation is of extreme importance in the oil
and gas industry, especially for assets and structures subjected to conditions
that accelerate failure mechanisms. Despite being widely spread, ultrasonic
non-destructive methods depend on a specialized workforce, thus being errorprone and time-consuming. In this context, pattern recognition methods, like
machine learning, fit conveniently to solve the challenges of the task. Hence,
this work aims at applying artificial intelligence techniques to address the
interpretation of data acquired through ultrasonic non-destructive evaluation
in the context of the oil and gas industry. For that purpose, this dissertation
involves three case studies. Firstly, ultrasonic guided wave signals are used to
classify defects present in welded thermoplastic composite joints. Results have
shown that, when using features extracted with autoregressive models, the
accuracy of the machine learning model improves by at least 72.5 percent. Secondly,
ultrasonic image data is used to construct an automatic weld diagnostic system.
The proposed framework resulted in a lightweight model capable of performing
classification with over 99 percent accuracy. Finally, simulation data was used to
create a deep learning model for estimating the severity of corrosion-like defects
in pipelines. R2 results superior to 0.99 were achieved.
|
69 |
[en] ASSESSMENT OF REDUCED ORDER MODELS APPLIED TO STEADY-STATE BI-DIMENSIONAL LAMINAR METHANE AIR DIFFUSION FLAME / [pt] AVALIAÇÃO DE MODELOS DE ORDEM REDUZIDA APLICADOS À SIMULAÇÃO BIDIMENSIONAL EM REGIME ESTACIONÁRIO DE CHAMAS LAMINARES DE DIFUSÃO DE METANO E ARNICOLE LOPES M DE B JUNQUEIRA 03 May 2022 (has links)
[pt] Dinâmica dos Fluidos Computacional (CFD) é frequentemente aplicada
ao estudo da combustão, permitindo otimizar o processo e controlar a emissão
de poluentes. Entretanto, reproduzir o comportamento observado nos sistemas
de engenharia tem uma elevada carga computacional. Para superar este custo,
técnicas de aprendizagem de máquinas, tais como modelos de ordem reduzida
(ROM), têm sido aplicadas a várias aplicações de engenharia com o objetivo
de criar modelos para sistemas complexos com custo computacional reduzido.
Aqui, o ROM é criado usando dados de simulação de chama laminar não
pré-misturada de CFD, decompondo-os, e depois aplicando um algoritmo de
aprendizagem de máquinas, criando um ROM estático. Este trabalho analisa
o efeito de cinco abordagens diferentes de pré-processamento de dados sobre o
ROM, sendo estas: (1) as propriedades tratadas como um sistema desacoplado
ou como um sistema acoplado, (2) sem normalização, (3) com temperatura
e velocidade normalizadas, (4) todas as propriedades normalizadas, e (5) o
logaritmo da espécie química. Para todos os ROM construídos são analisados a
energia do processo de redução e a reconstrução dos campos das propriedades
da chama. Em relação a análise da energia da redução, o ROM acoplado,
exceto o ROM (4), e o ROM do logaritmo convergem rapidamente, semelhante
ao ROM da temperatura desacoplado, enquanto o ROM da espécie química
minoritária desacoplado exibe uma lenta convergência, tal como o ROM
acoplado com todas as propriedades normalizadas. Assim, a aprendizagem é
atingida com um número menor de modos para a ROM (2), (3) e (5). Quanto à
reconstrução dos campos de propriedades, nota-se que existem regiões de fração
mássica negativa, o que sugere que a metodologia do ROM não preserva a
monotonicidade ou a delimitação das propriedades. A abordagem do logaritmo
mostra que estes problemas são superados e reproduzem os dados originais. / [en] Computational fluid dynamics (CFD) is often applied to the study of
combustion, enabling to optimize the process and control the emission of
pollutants. However, reproducing the behavior observed in engineering systems
has a high computational burden. To overcome this cost, machine learning
techniques, such as reduced order models (ROM), have been applied to several
engineering applications aiming to create models for complex systems with
reduced computational cost. Here, the ROM is created using CFD laminar
non premixed flame simulation data, decomposing it, and then applying a
machine learning algorithm, creating a static ROM. This work analyzes the
effect of five different data pre-processing approaches on the ROM, these being:
(1) the properties treated as an uncoupled system or as a coupled system, (2)
without normalization, (3) with temperature and velocity normalized, (4) all
properties normalized, and (5) the logarithm of the chemical species. For all
ROM constructed are analyzed the energy of the reduction process and the
reconstruction of the flame properties fields. Regarding the reduction energy
analysis, the coupled ROM, except the ROM (4), and the logarithm ROM
converges faster, similarly to the uncoupled temperature ROM, whereas the
uncoupled minor chemical species ROM exhibits a slower convergence, as does
the coupled ROM with all properties normalized. So, the learning is achieved
with a smaller number of modes for the ROM (2), (3) and (5). As for the
reconstruction of the property fields, it is noted that there are regions of
negative mass fraction, which suggest that the ROM methodology does not
preserve the monocity or the boundedness of the properties. The logarithm
approach shows that these problems are overcome and reproduce the original
data.
|
70 |
[en] PREDICTING THE ACQUISITION OF RESISTANT PATHOGENS IN ICUS USING MACHINE LEARNING TECHNIQUES / [pt] PREVENDO A AQUISIÇÃO DE PATÓGENOS RESISTENTES EM UTIS UTILIZANDO TÉCNICAS DE APRENDIZADO DE MÁQUINALEILA FIGUEIREDO DANTAS 01 February 2021 (has links)
[pt] As infecções por bactérias Gram-negativas Resistentes aos Carbapenêmicos (CR-GNB) estão entre as maiores preocupações atuais da área da, especialmente em Unidades de Terapia Intensiva (UTI), e podem estar associadas ao aumento do tempo de hospitalização, morbidade, custos e mortalidade. Esta tese tem como objetivo desenvolver uma abordagem abrangente e sistemática aplicando técnicas de aprendizado de máquina para construir modelos para prever a aquisição de CR-GNB em UTIs de hospitais brasileiros. Propusemos modelos de triagem para detectar pacientes que não precisam ser testados e um modelo de risco que estima a probabilidade de pacientes de UTI adquirirem CR-GNB. Aplicamos métodos de seleção de características, técnicas de aprendizado de máquina e estratégias de balanceamento para construir e comparar os modelos. Os critérios de desempenho escolhidos para avaliação foram Negative Predictive Value (NPV) and Matthews Correlation Coefficient (MCC) para o modelo de triagem e Brier score e curvas de calibração para o modelo de risco de aquisição de CR-GNB. A estatística de Friedman e os testes post hoc de Nemenyi foram usados para testar a significância das diferenças entre as técnicas. O método de ganho de informações e a mineração de regras de associação avaliam a importância e a força entre os recursos. Nosso banco de dados reúne dados de pacientes, antibióticos e microbiologia de cinco hospitais brasileiros de 8 de maio de 2017 a 31 de agosto de 2019, envolvendo pacientes hospitalizados em 24 UTIs adultas. As informações do laboratório foram usadas para identificar todos os pacientes com teste positivo ou negativo para CR-GNB, A. baumannii, P. aeruginosa ou Enterobacteriaceae. Há um total de 539 testes positivos e 7.462 negativos, resultando em 3.604 pacientes com pelo menos um exame após 48 horas de hospitalização. Dois modelos de triagem foram propostos ao tomador de decisão do hospital. O modelo da floresta aleatória reduz aproximadamente 39 por cento dos testes desnecessários e prevê corretamente 92 por cento dos positivos. A rede neural evita testes desnecessários em 64 por cento dos casos, mas 24 por cento dos testes positivos são classificados incorretamente. Os resultados mostram que as estratégias de amostragem tradicional, SMOTEBagging e UnderBagging obtiveram melhores resultados. As técnicas lineares como Regressão Logística com regularização apresentam bom desempenho e são mais interpretáveis; elas não são significativamente diferentes dos classificadores mais complexos. Para o modelo de risco de aquisição, o Centroides Encolhidos Mais Próximos é o melhor modelo com um Brier score de 0,152 e um cinto de calibração aceitável. Desenvolvemos uma validação externa a partir de 624 pacientes de dois outros hospitais da mesma rede, encontrando bons valores de Brier score (0,128 and 0,079) em ambos. O uso de antibióticos e procedimentos invasivos, principalmente ventilação mecânica, são os atributos mais importantes e significativos para a colonização ou infecção de CR-GNB. Os modelos preditivos podem ajudar a evitar testes de rastreamento e tratamento inadequado em pacientes de baixo risco. Políticas de controle de infecção podem ser estabelecidas para controlar a propagação dessas bactérias. A identificação de pacientes que não precisam ser testados diminui os custos hospitalares e o tempo de espera do laboratório. Concluímos que nossos modelos apresentam bom desempenho e parecem suficientemente confiáveis para prever um paciente com esses patógenos. Esses modelos preditivos podem ser incluídos no sistema hospitalar. A metodologia proposta pode ser replicada em diferentes ambientes de saúde. / [en] Infections by Carbapenem-Resistant Gram-negative bacteria (CR-GNB) are among the most significant contemporary health concerns, especially in intensive care units (ICUs), and may be associated with increased hospitalization time, morbidity, costs, and mortality. This thesis aims to develop a comprehensive and systematic approach applying machine-learning techniques to build models to predict the CR-GNB acquisition in ICUs from Brazilian hospitals. We proposed screening models to detect ICU patients who do not need to be tested and a risk model that estimates ICU patients probability of acquiring CR-GNB. We applied feature selection methods, machine-learning techniques, and balancing strategies to build and compare the models. The performance criteria chosen to evaluate the models were Negative Predictive Value (NPV) and Matthews Correlation Coefficient (MCC) for the screening model and Brier score and calibration curves for the CR-GNB acquisition risk model. Friedman s statistic and Nemenyi post hoc tests are used to test the significance of differences among techniques. Information gain method and association rules mining assess the importance and strength among features. Our database gathers the patients, antibiotic, and microbiology data from five Brazilian hospitals from May 8th, 2017 to August 31st, 2019, involving hospitalized patients in 24 adult ICUs. Information from the laboratory was used to identify all patients with a positive or negative test for carbapenem-resistant GNB, A. baumannii, P. aeruginosa, or Enterobacteriaceae. We have a total of 539 positive and 7,462 negative tests, resulting in 3,604 patients with at least one exam after 48 hours hospitalized. We proposed to the hospital s decision-maker two screening models. The random forest s model would reduce approximately 39 percent of the
unnecessary tests and correctly predict 92 percent of positives. The Neural Network model avoids unnecessary tests in 64 percent of the cases, but 24 percent of positive tests are misclassified as negatives. Our results show that the sampling, SMOTEBagging, and UnderBagging approaches obtain better results. The linear techniques such as Logistic Regression with regularization give a relatively good performance and are more interpretable; they are not significantly different from the more complex classifiers. For the acquisition risk model, the Nearest Shrunken Centroids is the best model with a Brier score of 0.152 and a calibration belt acceptable. We developed an external validation of 624 patients from two other hospitals in the same network, finding good Brier score (0.128 and 0.079) values in both. The antibiotic and invasive procedures used, especially mechanical ventilation, are the most important attributes for the colonization or infection of CR-GNB. The predictive models can help avoid screening tests and inappropriate treatment in patients at low risk. Infection control policies can be established to control these bacteria s spread. Identifying patients who do not need to be tested decreases hospital costs and laboratory waiting times. We concluded that our models present good performance and seem sufficiently reliable to predict a patient with these pathogens. These predictive models can be included in the hospital system. The proposed methodology can be replicated in different healthcare settings.
|
Page generated in 0.1028 seconds