Global ETD Search

61	[en] A MACHINE LEARNING APPROACH FOR PORTUGUESE TEXT CHUNKING / [pt] UMA ABORDAGEM DE APRENDIZADO DE MÁQUINA PARA SEGMENTAÇÃO TEXTUAL NO PORTUGUÊS GUILHERME CARLOS DE NAPOLI FERREIRA 10 February 2017 (has links) [pt] A segmentação textual é uma tarefa de Processamento de Linguagem Natural muito relevante, e consiste na divisão de uma sentença em sequências disjuntas de palavras sintaticamente relacionadas. Um dos fatores que contribuem fortemente para sua importância é que seus resultados são usados como significativos dados de entrada para problemas linguísticos mais complexos. Dentre esses problemas estão a análise sintática completa, a identificação de orações, a análise sintática de dependência, a identificação de papéis semânticos e a tradução automática. Em particular, abordagens de Aprendizado de Máquina para estas tarefas beneficiam-se intensamente com o uso de um atributo de segmentos textuais. Um número respeitável de eficazes estratégias de extração de segmentos para o inglês foi apresentado ao longo dos últimos anos. No entanto, até onde podemos determinar, nenhum estudo abrangente foi feito sobre a segmentação textual para o português, de modo a demonstrar seus benefícios. O escopo deste trabalho é a língua portuguesa, e seus objetivos são dois. Primeiramente, analisamos o impacto de diferentes definições de segmentação, utilizando uma heurística para gerar segmentos que depende de uma análise sintática completa previamente anotada. Em seguida, propomos modelos de Aprendizado de Máquina para a extração de segmentos textuais baseados na técnica Aprendizado de Transformações Guiado por Entropia. Fazemos uso do corpus Bosque, do projeto Floresta Sintá(c)tica, nos nossos experimentos. Utilizando os valores determinados diretamente por nossa heurística, um atributo de segmentos textuais aumenta a métrica F beta igual 1 de um sistema de identificação de orações para o português em 6.85 e a acurácia de um sistema de análise sintática de dependência em 1.54. Ademais, nosso melhor extrator de segmentos apresenta um F beta igual 1 de 87.95 usando anotaçoes automáticas de categoria gramatical. As descobertas indicam que, de fato, a informação de segmentação textual derivada por nossa heurística é relevante para tarefas mais elaboradas cujo foco é o português. Além disso, a eficácia de nossos extratores é comparável à dos similares do estado-da-arte para o inglês, tendo em vista que os modelos propostos são razoavelmente simples. / [en] Text chunking is a very relevant Natural Language Processing task, and consists in dividing a sentence into disjoint sequences of syntactically correlated words. One of the factors that highly contribute to its importance is that its results are used as a significant input to more complex linguistic problems. Among those problems we have full parsing, clause identification, dependency parsing, semantic role labeling and machine translation. In particular, Machine Learning approaches to these tasks greatly benefit from the use of a chunk feature. A respectable number of effective chunk extraction strategies for the English language has been presented during the last few years. However, as far as we know, no comprehensive study has been done on text chunking for Portuguese, showing its benefits. The scope of this work is the Portuguese language, and its objective is twofold. First, we analyze the impact of different chunk definitions, using a heuristic to generate chunks that relies on previous full parsing annotation. Then, we propose Machine Learning models for chunk extraction based on the Entropy Guided Transformation Learning technique. We employ the Bosque corpus, from the Floresta Sintá(c)tica project, for our experiments. Using golden values determined by our heuristic, a chunk feature improves the F beta equal 1 score of a clause identification system for Portuguese by 6.85 and the accuracy of a dependency parsing system by 1.54. Moreover, our best chunk extractor achieves a F beta equal 1 of 87.95 when automatic part-of-speech tags are applied. The empirical findings indicate that, indeed, chunk information derived by our heuristic is relevant to more elaborate tasks targeted on Portuguese. Furthermore, the effectiveness of our extractors is comparable to the state-of-the-art similars for English, taking into account that our proposed models are reasonably simple. [pt] APRENDIZADO DE MAQUINA [en] MACHINE LEARNING [pt] PROCESSAMENTO DE LINGUAGEM NATURAL [en] NATURAL LANGUAGE PROCESSING [pt] SEGMENTACAO TEXTUAL [pt] ANALISE SINTATICA SUPERFICIAL
62	[en] CLASSIFICATION OF OBJECTS IN REAL CONTEXT BY CONVOLUTIONAL NEURAL NETWORKS / [pt] CLASSIFICAÇÃO DE OBJETOS EM CONTEXTO REAL POR REDES NEURAIS CONVOLUTIVAS LUIS MARCELO VITAL ABREU FONSECA 08 June 2017 (has links) [pt] A classificação de imagens em contexto real é o ápice tecnológico do reconhecimento de objetos. Esse tipo de classificação é complexo, contendo diversos problemas de visão computacional em abundância. Este projeto propõe solucionar esse tipo de classificação através do uso do conhecimento no aprendizado de máquina aplicado ao dataset do MS COCO. O algoritmo implementado neste projeto consiste de um modelo de Rede Neural Convolutiva que consegue aprender características dos objetos e realizar predições sobre suas classes. São elaborados alguns experimentos que comparam diferentes resultados de predições a partir de diferentes técnicas de aprendizado. É também realizada uma comparação dos resultados da implementação com o estado da arte na segmentação de objetos em contexto. / [en] The classification of objects in real contexts is the technological apex of object recognition. This type of classification is complex, containing diverse computer vision problems in abundance. This project proposes to solve that type of classification through the use of machine learning knowledge applied to the MS COCO dataset. The implemented algorithm in this project consists of a Convolutional Neural Network model that is able to learn characteristics of the objects and predict their classes. Some experiments are made that compare different results of predictions using different techniques of learning. There is also a comparison of the results from the implementation with state of art in contextual objects segmentation. [pt] APRENDIZADO DE MAQUINA [en] MACHINE LEARNING [pt] MINERACAO DE DADOS [en] DATA MINING [pt] PROCESSAMENTO DE IMAGENS [en] IMAGE PROCESSING [pt] REDES NEURAIS CONVOLUTIVAS [pt] CLASSIFICACAO DE OBJETOS
63	[en] FIOT: AN AGENT-BASED FRAMEWORK FOR SELF-ADAPTIVE AND SELF-ORGANIZING INTERNET OF THINGS APPLICATIONS / [pt] FIOT: UM FRAMEWORK BASEADO EM AGENTES PARA APLICAÇÕES AUTO-ORGANIZÁVEIS E AUTOADAPTATIVAS DE INTERNET DAS COISAS NATHALIA MORAES DO NASCIMENTO 01 June 2016 (has links) [pt] A ideia principal da Internet das Coisas (IoT) é conectar bilhões de coisas à Internet nos próximos anos, a exemplo de carros, roupas e comidas. Entretanto, muitos problemas precisam ser resolvidos antes que essa ideia possa ser concretizada. Alguns desses problemas estão relacionados à necessidade de construir sistemas para IoT que sejam auto-organizáveis e autoadaptativos. Este trabalho, portanto, apresenta a elaboração do Framework para Internet das Coisas (FIoT), que oferece suporte ao desenvolvimento de aplicações para IoT com essas características. Ele é baseado nos paradigmas de Sistemas Multiagente (SMA) e algumas técnicas abordadas em Aprendizado de Máquina, a exemplo de redes neurais e algoritmos evolutivos. Um agente pode ter algumas características, como autonomia e sociabilidade, que tornam SMAs compatíveis com sistemas que requerem auto-organização. Redes neurais e algoritmos de evolução vêm sendo comumente usados nos estudos de robótica, no intuito de prover autonomia e adaptação à agentes físicos (ex.: robôs, sensores). Para demonstrar o uso do FIoT, dois grupos de problemas em IoT serão instanciados: (i) Cidades Inteligentes e (ii) Quantificação de Coisas. / [en] The agreed fact about the Internet of Things (IoT) is that, within the coming years, billions of resources, such as cars, clothes and foods will be connected to the Internet. However, several challenging issues need to be addressed before the IoT vision becomes a reality. Some open problems are related to the need of building self-organizing and self-adaptive IoT systems. To create IoT applications with these features, this work presents a Framework for Internet of Things (FIoT). Our approach is based on concepts from Multi-Agent Systems (MAS) and Machine Learning Techniques, such as a neural network and evolutionary algorithms. An agent could have characteristics, such as autonomy and social ability, which makes MAS suitable for systems requiring self-organization (SO). Neural networks and algorithms of evolution have been commonly used in robotic studies to provide embodied agents (as robots and sensors) with autonomy and adaptive capabilities. To illustrate the use of FIoT, we derived two different instances from IoT applications: (i) Quantified Things and (ii) Smart Cities. We show how exible points of our framework are instantiated to generate an application. [pt] APRENDIZADO DE MAQUINA [pt] INTERNET DAS COISAS - IOT [pt] AUTOADAPTACAO [pt] AUTO-ORGANIZACAO [pt] SISTEMA MULTIAGENTE [en] MACHINE LEARNING [en] INTERNET OF THINGS - IOT [en] SELF-ORGANIZATION [en] MULTI-AGENT SYSTEM
64	[en] ARTIFICIAL INTELLIGENCE METHODS APPLIED TO MECHANICAL ENGINEERING PROBLEMS / [pt] MÉTODOS DE INTELIGÊNCIA ARTIFICIAL APLICADOS A PROBLEMAS DE ENGENHARIA MECÂNICA PEDRO HENRIQUE LEITE DA SILVA PIRES DOMINGUES 05 June 2020 (has links) [pt] Problemas reais de engenharia mecânica podem compreender tarefas de i) otimização multi-objetivo (MO) ou ii) regressão, classificação e predição. Os métodos baseados em inteligência artificial (AI) são bastante difundidos na resolução desses problemas por i) demandarem menor custo computacional e informações do domínio do problema para a resolução de uma MO, quando comparados com métodos de programação matemática, por exemplo; e ii) apresentarem melhores resultados com estrutura mais simples, adaptabilidade e interpretabilidade, em contraste com outros métodos. Sendo assim, o presente trabalho busca i) otimizar um controle proporcional-integral-derivativo (PID) aplicado a um sistema de frenagem anti-travamento de rodas (ABS) e o projeto de trocadores de calor de placas aletadas (PFHE) e casco-tubo (STHE) através de métodos de otimização baseados AI, buscando o desenvolvimento de novas versões dos métodos aplicados, e.g. multi-objective salp swarm algorithm (MSSA) e multi-objective heuristic Kalman algorithm (MOHKA), que melhorem a performance da otimização; ii) desenvolver um sistema de detecção de vazamento em dutos (LDS) sensível ao roubo de combustível a partir do treinamento de árvores de decisão (DTs) com features baseadas no tempo e na análise de componentes principais (PCA), ambas exraídas de dados de transiente de pressão de operação normal do duto e de roubo de combustível; iii) constituir um guia de aplicação para problemas de MO de controle e projeto, processo de extração de features e treinamento de classificadores baseados em aprendizado de máquina (MLCs), através de aprendizado supervisionado; e, por fim iv) demonstrar o potencial das técnicas baseadas em AI. / [en] Real-world mechanical engineering problems may comprise tasks of i) multi-objective optimization (MO) or ii) regression, classification and prediction. The use of artificial intelligence (AI) based methods for solving these problems are widespread for i) demanding less computational cost and problem domain information to solve the MO, when compared with mathematical programming for an example; and ii) presenting better results with simpler structure, adaptability and interpretability, in contrast to other methods. Therefore, the present work seeks to i) optimize a proportional-integral-derivative control (PID) applied to an anti-lock braking system (ABS) and the heat exchanger design of plate-fin (PFHE) and shell-tube (STHE) types through AI based optimization methods, seeking to develop new versions of the applied methods, e.g. multi-objective salp swarm algorithm (MSSA) and multi-objective heuristic Kalman algorithm (MOHKA), which enhance the optimization performance; ii) develop a pipeline leak detection system (LDS) sensitive to fuel theft by training decision trees (DTs) with features based on time and principal component analysis (PCA), both extracted from pressure transient data of regular pipeline operation and fuel theft; iii) constitute an application guide for control and design MO problems, feature extraction process and machine learning classifiers (MLCs) training through supervised learning; and, finally, iv) demonstrate the potential of AI-based techniques. [pt] APRENDIZADO DE MAQUINA [pt] ALGORITMOS BIOINSPIRADOS [pt] OTIMIZACAO MULTIOBJETIVO [pt] APRENDIZADO SUPERVISIONADO [pt] INTELIGENCIA ARTIFICIAL [en] MACHINE LEARNING [en] BIO INSPIRED ALGORITHMS [en] MULTIOBJECTIVE OPTIMIZATION [en] SUPERVISED LEARNING [en] ARTIFICIAL INTELLIGENCE
65	[pt] ENSAIOS SOBRE PREVISÃO DE INFLAÇÃO: DESAGREGAÇÃO, COMBINAÇÃO DE PREVISÕES E DADOS NÃO ESTRUTURADOS / [en] ESSAYS CONCERNING INFLATION FORECASTING: DISAGGREGATION, COMBINATION OF FORECASTS, AND UNSTRUCTURED DATA GILBERTO OLIVEIRA BOARETTO 07 August 2023 (has links) [pt] Esta tese consiste em três ensaios sobre previsão de inflação, com foco na inflação brasileira. No primeiro ensaio, examinamos a eficácia de vários métodos de previsão para prever a inflação, com foco na agregação de previsões desagregadas. Consideramos diferentes níveis de desagregação para a inflação e empregamos uma variedade de técnicas tradicionais de séries temporais, bem como modelos lineares e não lineares de aprendizado de máquina que lidam com um número grande de preditores. Para muitos horizontes de previsão, a agregação de previsões desagregadas performa tão bem quanto expectativas baseadas em coleta e modelos que geram previsões a partir do agregado. No geral, os métodos de aprendizado de máquina superam os modelos de séries temporais tradicionais em precisão preditiva, com excelente desempenho para os desagregados da inflação. Em nosso segundo ensaio, investigamos os potenciais benefícios de combinar previsões de inflação individuais ao propor uma correção para viés variável no tempo da média de previsões. Nossa análise inclui estimações empregando janelas rolantes e modelos em espaço de estados que usam a recursividade do filtro de Kalman. Obtivemos um bom desempenho de previsão para modelos baseados em janelas rolantes pequenas em horizontes de previsão curtos e intermediários, enquanto um modelo em espaço de estados obtem um desempenho um pouco pior do que os procedimentos baseados em janelas rolantes. No terceiro ensaio, usamos aprendizado supervisionado para gerar índices prospectivos baseados em tweets e notícias para inflação acumulada e investigamos se esses índices podem melhorar o desempenho da previsão de inflação. Nossos resultados indicam que os índices baseados em notícias fornecem ganhos preditivos significativos, principalmente para os horizontes de 3 e 12 meses à frente. Esses achados sugerem que a incorporação de mais fontes de informação do que apenas expectativas baseadas em opiniões de especialistas pode levar a previsões mais precisas. / [en] This dissertation consists of three essays concerning inflation forecasting, taking the Brazilian case as an application. In the first essay, we examine the effectiveness of several forecasting methods for predicting inflation, focusing on aggregating disaggregated forecasts. We consider different disaggregation levels for inflation and employ a range of traditional time series techniques, as well as linear and nonlinear machine learning (ML) models that deal with a larger number of predictors. For many forecast horizons, aggregation of disaggregated forecasts performs just as well as survey-based expectations and models generating forecasts directly from the aggregate. Overall, ML methods outperform traditional time series models in predictive accuracy, with outstanding performance in forecasting disaggregates. In our second essay, we investigate the potential benefits of combining individual inflation forecasts by proposing a time-varying bias correction for the average forecast. Our analysis includes estimations using both rolling windows and state-space models that use the recursiveness of the Kalman filter. We achieve good forecast performance for models based on small rolling windows for shorter and intermediate forecast horizons, while a state-space model performs slightly worse than procedures based on rolling windows. In the third essay, we use supervised learning to generate forward-looking indexes based on tweets and news articles for accumulated inflation and investigate whether these indexes can improve inflation forecasting performance. Our results indicate that news-based indexes provide significant predictive gains, particularly for 3- and 12-month-ahead horizons. These findings suggest that incorporating more information sources than just expectations based on experts opinions can lead to more accurate forecasts. [pt] APRENDIZADO DE MAQUINA [pt] COMBINACAO DE PREVISOES [pt] ANALISE DESAGREGADA [pt] PREVISAO DE INFLACAO [pt] NOTICIA [en] MACHINE LEARNING [en] COMBINATION OF FORECASTS [en] DISAGGREGATED ANALYSIS [en] INFLATION FORECASTING [en] NEW
66	[en] ALGORITHMS FOR TABLE STRUCTURE RECOGNITION / [pt] ALGORITMOS PARA RECONHECIMENTO DE ESTRUTURAS DE TABELAS YOSVENI ESCALONA ESCALONA 26 June 2020 (has links) [pt] Tabelas são uma forma bastante comum de organizar e publicar dados. Por exemplo, a Web possui um enorme número de tabelas publicadas em HTML, embutidas em documentos em PDF, ou que podem ser simplesmente baixadas de páginas Web. Porém, tabelas nem sempre são fáceis de interpretar pois possuem uma grande variedade de características e são organizadas de diversas formas. De fato, um grande número de métodos e ferramentas foram desenvolvidos para interpretação de tabelas. Esta dissertação apresenta a implementação de um algoritmo, baseado em Conditional Random Fields (CRFs), para classificar as linhas de uma tabela em linhas de cabeçalho, linhas de dados e linhas de metadados. A implementação é complementada por dois algoritmos para reconhecimento de tabelas em planilhas, respectivamente baseados em regras e detecção de regiões. Por fim, a dissertação descreve os resultados e os benefícios obtidos pela aplicação dos algoritmos a tabelas em formato HTML, obtidas da Web, e a tabelas em forma de planilhas, baixadas do Web site da Agência Nacional de Petróleo. / [en] Tables are widely adopted to organize and publish data. For example, the Web has an enormous number of tables, published in HTML, imbedded in PDF documents, or that can be simply downloaded from Web pages. However, tables are not always easy to interpret because of the variety of features and formats used. Indeed, a large number of methods and tools have been developed to interpret tables. This dissertation presents the implementation of an algorithm, based on Conditional Random Fields (CRFs), to classify the rows of a table as header rows, data rows or metadata rows. The implementation is complemented by two algorithms for table recognition in a spreadsheet document, respectively based on rules and on region detection. Finally, the dissertation describes the results and the benefits obtained by applying the implemented algorithms to HTML tables, obtained from the Web, and to spreadsheet tables, downloaded from the Brazilian National Petroleum Agency. [pt] APRENDIZADO DE MAQUINA [pt] PLANILHA [pt] TABELA HTML [pt] DADOS TABULARES [pt] CONDITIONAL RANDOM FIELD [en] MACHINE LEARNING [en] SPREADSHEETS [en] HTML TABLES [en] TABULAR DATA [en] CONDITIONAL RANDOM FIELD
67	[pt] MONITORAMENTO DE VIBRAÇÃO EM SISTEMAS MECÂNICOS USANDO APRENDIZADO PROFUNDO E RASO EM COMPUTADORES NA PONTA / [en] VIBRATION MONITORING OF MECHANICAL SYSTEMS USING DEEP AND SHALLOW LEARNING ON EDGE-COMPUTERS CAROLINA DE OLIVEIRA CONTENTE 30 June 2022 (has links) [pt] O monitoramento de integridade estrutural tem sido o foco de desenvolvimentos recentes no campo da avaliação baseada em vibração e, mais recentemente, no escopo da internet das coisas à medida que medição e computação se tornam distribuídas. Os dados se tornaram abundantes, embora a transmissão nem sempre seja viável em frequências mais altas especialmente em aplicações remotas. Portanto, é importante conceber fluxos de trabalho de modelo orientados por dados que garantam a melhor relação entre a precisão do modelo para avaliação de condição e os recursos computacionais necessários para soluções incorporadas, tópico que não tem sido amplamente utilizado no contexto de medições baseadas em vibração. Neste contexto, a presente pesquisa propõe abordagens para duas aplicações: na primeira foi proposto um fluxo de trabalho de modelagem capaz de reduzir a dimensão dos parâmetros de modelos autorregressivos usando análise de componentes principais e classificar esses dados usando algumas técnicas de aprendizado de máquina como regressão logística, máquina de vetor de suporte, árvores de decisão, k-vizinhos próximos e floresta aleatória. O exemplo do prédio de três andares foi usado para demonstrar a eficácia do método. No segundo caso, é utilizado um equipamento de teste composto por inércias rotativas onde a solução de monitoramento foi testada em uma plataforma baseada em GPU embarcada. Os modelos implementados para distinguir eficazmente os diferentes estados de atrito foram análise de componentes principais, deep autoencoders e redes neurais artificiais. Modelos rasos têm melhor desempenho em tempo de execução e precisão na detecção de condições de falha. / [en] Structural health monitoring has been the focus of recent developments in vibration-based assessment and, more recently, in the scope of the internet of things as measurement and computation become distributed. Data has become abundant even though the transmission is not always feasible, especially in remote applications. It is thus essential to devise data-driven model workflows that ensure the best compromise between model accuracy for condition assessment and the computational resources needed for embedded solutions. This topic has not been widely used in the context of vibration-based measurements. In this context, the present research proposes two approaches for two applications, a static and a rotating one. In case one, a modeling workflow capable of reducing the dimension of autoregressive model features using principal component analysis and classifying this data using some of the main machine learning techniques such as logistic regression, support vector machines, decision tree classifier, k-nearest neighborhood and random forest classifier was proposed. The three-story building example was used to demonstrate the method s effectiveness, together with ways to assess the best compromise between accuracy and model size. In case two, a test rig composed of rotating inertias and slender connecting rods is used, and the monitoring solution was tested in an embedded GPU-based platform. The models implemented to effectively distinguish between different friction states were principal component analysis, deep autoencoder and artificial neural networks. Shallow models perform better concerning running time and accuracy in detecting faulty conditions. [pt] APRENDIZADO DE MAQUINA [pt] APRENDIZADO NAO SUPERVISIONADO [pt] IDENTIFICACAO DE SISTEMAS [pt] APRENDIZADO SUPERVISIONADO [en] MACHINE LEARNING [en] UNSUPERVISED LEARNING [en] SYSTEM IDENTIFICATION [en] STRUCTURAL HEALTH MONITORING [en] SUPERVISED LEARNING
68	[pt] AVALIAÇÃO NÃO-DESTRUTIVA DE DUTOS E SOLDAS BASEADA EM DADOS ULTRASSÔNICOS NO CONTEXTO DA INDÚSTRIA DE ÓLEO E GÁS / [en] DATA-DRIVEN ULTRASONIC NON-DESTRUCTIVE EVALUATION OF PIPES AND WELDS IN THE CONTEXT OF THE OIL AND GAS INDUSTRY GUILHERME REZENDE BESSA FERREIRA 31 January 2022 (has links) [pt] A avaliação não destrutiva ultrassônica é de extrema importância na indústria de óleo e gás, principalmente para ativos e estruturas sujeitos a condições que aceleram os mecanismos de falha. Apesar de amplamente difundidos, os métodos ultrassônicos não destrutivos dependem de uma força de trabalho especializada, sendo, portanto, suscetíveis a erros e demorados. Nesse contexto, métodos de reconhecimento de padrões, como o aprendizado de máquina, se encaixam convenientemente para solucionar os desafios da tarefa. Assim, este trabalho tem como objetivo a aplicação de técnicas de inteligência artificial para abordar a interpretação de dados adquiridos por meio de avaliação não destrutiva ultrassônica no contexto da indústria de óleo e gás. Para tanto, esta dissertação envolve três estudos de caso. Primeiramente, sinais de ondas guiadas ultrassônicas são usados para classificar os defeitos presentes em juntas soldadas de compósito termoplástico. Os resultados mostraram que, ao usar atributos extraídos com modelos autoregressivos, a acurácia do modelo de aprendizado de máquina melhora em pelo menos 72,5 por cento. Em segundo lugar, dados ultrassônicos em formato de imagens são usados para construir um sistema de diagnóstico de solda automático. A estrutura proposta resultou em um modelo computacionalmente eficiente, capaz de realizar classificações com acurácia superior à 99 por cento. Por fim, dados obtidos por simulação numérica foram usados para criar um modelo de aprendizado profundo visando estimar a severidade de defeitos semelhantes à corrosão em dutos. Resultados de R2 superiores a 0,99 foram alcançados. / [en] Ultrasonic non-destructive evaluation is of extreme importance in the oil and gas industry, especially for assets and structures subjected to conditions that accelerate failure mechanisms. Despite being widely spread, ultrasonic non-destructive methods depend on a specialized workforce, thus being errorprone and time-consuming. In this context, pattern recognition methods, like machine learning, fit conveniently to solve the challenges of the task. Hence, this work aims at applying artificial intelligence techniques to address the interpretation of data acquired through ultrasonic non-destructive evaluation in the context of the oil and gas industry. For that purpose, this dissertation involves three case studies. Firstly, ultrasonic guided wave signals are used to classify defects present in welded thermoplastic composite joints. Results have shown that, when using features extracted with autoregressive models, the accuracy of the machine learning model improves by at least 72.5 percent. Secondly, ultrasonic image data is used to construct an automatic weld diagnostic system. The proposed framework resulted in a lightweight model capable of performing classification with over 99 percent accuracy. Finally, simulation data was used to create a deep learning model for estimating the severity of corrosion-like defects in pipelines. R2 results superior to 0.99 were achieved. [pt] APRENDIZADO DE MAQUINA [pt] AVALIACAO NAO DESTRUTIVA [pt] OLEODUTO [pt] ULTRASSOM [pt] SOLDAGEM [pt] ONDAS GUIADAS [en] MACHINE LEARNING [en] NON-DESTRUCTIVE EVALUATION [en] PIPELINE [en] ULTRASONIC [en] WELDING [en] ELASTIC GUIDED WAVES
69	[en] ASSESSMENT OF REDUCED ORDER MODELS APPLIED TO STEADY-STATE BI-DIMENSIONAL LAMINAR METHANE AIR DIFFUSION FLAME / [pt] AVALIAÇÃO DE MODELOS DE ORDEM REDUZIDA APLICADOS À SIMULAÇÃO BIDIMENSIONAL EM REGIME ESTACIONÁRIO DE CHAMAS LAMINARES DE DIFUSÃO DE METANO E AR NICOLE LOPES M DE B JUNQUEIRA 03 May 2022 (has links) [pt] Dinâmica dos Fluidos Computacional (CFD) é frequentemente aplicada ao estudo da combustão, permitindo otimizar o processo e controlar a emissão de poluentes. Entretanto, reproduzir o comportamento observado nos sistemas de engenharia tem uma elevada carga computacional. Para superar este custo, técnicas de aprendizagem de máquinas, tais como modelos de ordem reduzida (ROM), têm sido aplicadas a várias aplicações de engenharia com o objetivo de criar modelos para sistemas complexos com custo computacional reduzido. Aqui, o ROM é criado usando dados de simulação de chama laminar não pré-misturada de CFD, decompondo-os, e depois aplicando um algoritmo de aprendizagem de máquinas, criando um ROM estático. Este trabalho analisa o efeito de cinco abordagens diferentes de pré-processamento de dados sobre o ROM, sendo estas: (1) as propriedades tratadas como um sistema desacoplado ou como um sistema acoplado, (2) sem normalização, (3) com temperatura e velocidade normalizadas, (4) todas as propriedades normalizadas, e (5) o logaritmo da espécie química. Para todos os ROM construídos são analisados a energia do processo de redução e a reconstrução dos campos das propriedades da chama. Em relação a análise da energia da redução, o ROM acoplado, exceto o ROM (4), e o ROM do logaritmo convergem rapidamente, semelhante ao ROM da temperatura desacoplado, enquanto o ROM da espécie química minoritária desacoplado exibe uma lenta convergência, tal como o ROM acoplado com todas as propriedades normalizadas. Assim, a aprendizagem é atingida com um número menor de modos para a ROM (2), (3) e (5). Quanto à reconstrução dos campos de propriedades, nota-se que existem regiões de fração mássica negativa, o que sugere que a metodologia do ROM não preserva a monotonicidade ou a delimitação das propriedades. A abordagem do logaritmo mostra que estes problemas são superados e reproduzem os dados originais. / [en] Computational fluid dynamics (CFD) is often applied to the study of combustion, enabling to optimize the process and control the emission of pollutants. However, reproducing the behavior observed in engineering systems has a high computational burden. To overcome this cost, machine learning techniques, such as reduced order models (ROM), have been applied to several engineering applications aiming to create models for complex systems with reduced computational cost. Here, the ROM is created using CFD laminar non premixed flame simulation data, decomposing it, and then applying a machine learning algorithm, creating a static ROM. This work analyzes the effect of five different data pre-processing approaches on the ROM, these being: (1) the properties treated as an uncoupled system or as a coupled system, (2) without normalization, (3) with temperature and velocity normalized, (4) all properties normalized, and (5) the logarithm of the chemical species. For all ROM constructed are analyzed the energy of the reduction process and the reconstruction of the flame properties fields. Regarding the reduction energy analysis, the coupled ROM, except the ROM (4), and the logarithm ROM converges faster, similarly to the uncoupled temperature ROM, whereas the uncoupled minor chemical species ROM exhibits a slower convergence, as does the coupled ROM with all properties normalized. So, the learning is achieved with a smaller number of modes for the ROM (2), (3) and (5). As for the reconstruction of the property fields, it is noted that there are regions of negative mass fraction, which suggest that the ROM methodology does not preserve the monocity or the boundedness of the properties. The logarithm approach shows that these problems are overcome and reproduce the original data. [pt] APRENDIZADO DE MAQUINA [pt] COMBUSTAO DE METANO AR [pt] CHAMAS NAO PRE-MISTURADAS [pt] DINAMICA DOS FLUIDOS COMPUTACIONAL [en] MACHINE LEARNING [en] METHANE AIR COMBUSTION [en] NON-PREMIXED FLAMES [en] COMPUTATIONAL FLUIDS DYNAMICS
70	[en] PREDICTING THE ACQUISITION OF RESISTANT PATHOGENS IN ICUS USING MACHINE LEARNING TECHNIQUES / [pt] PREVENDO A AQUISIÇÃO DE PATÓGENOS RESISTENTES EM UTIS UTILIZANDO TÉCNICAS DE APRENDIZADO DE MÁQUINA LEILA FIGUEIREDO DANTAS 01 February 2021 (has links) [pt] As infecções por bactérias Gram-negativas Resistentes aos Carbapenêmicos (CR-GNB) estão entre as maiores preocupações atuais da área da, especialmente em Unidades de Terapia Intensiva (UTI), e podem estar associadas ao aumento do tempo de hospitalização, morbidade, custos e mortalidade. Esta tese tem como objetivo desenvolver uma abordagem abrangente e sistemática aplicando técnicas de aprendizado de máquina para construir modelos para prever a aquisição de CR-GNB em UTIs de hospitais brasileiros. Propusemos modelos de triagem para detectar pacientes que não precisam ser testados e um modelo de risco que estima a probabilidade de pacientes de UTI adquirirem CR-GNB. Aplicamos métodos de seleção de características, técnicas de aprendizado de máquina e estratégias de balanceamento para construir e comparar os modelos. Os critérios de desempenho escolhidos para avaliação foram Negative Predictive Value (NPV) and Matthews Correlation Coefficient (MCC) para o modelo de triagem e Brier score e curvas de calibração para o modelo de risco de aquisição de CR-GNB. A estatística de Friedman e os testes post hoc de Nemenyi foram usados para testar a significância das diferenças entre as técnicas. O método de ganho de informações e a mineração de regras de associação avaliam a importância e a força entre os recursos. Nosso banco de dados reúne dados de pacientes, antibióticos e microbiologia de cinco hospitais brasileiros de 8 de maio de 2017 a 31 de agosto de 2019, envolvendo pacientes hospitalizados em 24 UTIs adultas. As informações do laboratório foram usadas para identificar todos os pacientes com teste positivo ou negativo para CR-GNB, A. baumannii, P. aeruginosa ou Enterobacteriaceae. Há um total de 539 testes positivos e 7.462 negativos, resultando em 3.604 pacientes com pelo menos um exame após 48 horas de hospitalização. Dois modelos de triagem foram propostos ao tomador de decisão do hospital. O modelo da floresta aleatória reduz aproximadamente 39 por cento dos testes desnecessários e prevê corretamente 92 por cento dos positivos. A rede neural evita testes desnecessários em 64 por cento dos casos, mas 24 por cento dos testes positivos são classificados incorretamente. Os resultados mostram que as estratégias de amostragem tradicional, SMOTEBagging e UnderBagging obtiveram melhores resultados. As técnicas lineares como Regressão Logística com regularização apresentam bom desempenho e são mais interpretáveis; elas não são significativamente diferentes dos classificadores mais complexos. Para o modelo de risco de aquisição, o Centroides Encolhidos Mais Próximos é o melhor modelo com um Brier score de 0,152 e um cinto de calibração aceitável. Desenvolvemos uma validação externa a partir de 624 pacientes de dois outros hospitais da mesma rede, encontrando bons valores de Brier score (0,128 and 0,079) em ambos. O uso de antibióticos e procedimentos invasivos, principalmente ventilação mecânica, são os atributos mais importantes e significativos para a colonização ou infecção de CR-GNB. Os modelos preditivos podem ajudar a evitar testes de rastreamento e tratamento inadequado em pacientes de baixo risco. Políticas de controle de infecção podem ser estabelecidas para controlar a propagação dessas bactérias. A identificação de pacientes que não precisam ser testados diminui os custos hospitalares e o tempo de espera do laboratório. Concluímos que nossos modelos apresentam bom desempenho e parecem suficientemente confiáveis para prever um paciente com esses patógenos. Esses modelos preditivos podem ser incluídos no sistema hospitalar. A metodologia proposta pode ser replicada em diferentes ambientes de saúde. / [en] Infections by Carbapenem-Resistant Gram-negative bacteria (CR-GNB) are among the most significant contemporary health concerns, especially in intensive care units (ICUs), and may be associated with increased hospitalization time, morbidity, costs, and mortality. This thesis aims to develop a comprehensive and systematic approach applying machine-learning techniques to build models to predict the CR-GNB acquisition in ICUs from Brazilian hospitals. We proposed screening models to detect ICU patients who do not need to be tested and a risk model that estimates ICU patients probability of acquiring CR-GNB. We applied feature selection methods, machine-learning techniques, and balancing strategies to build and compare the models. The performance criteria chosen to evaluate the models were Negative Predictive Value (NPV) and Matthews Correlation Coefficient (MCC) for the screening model and Brier score and calibration curves for the CR-GNB acquisition risk model. Friedman s statistic and Nemenyi post hoc tests are used to test the significance of differences among techniques. Information gain method and association rules mining assess the importance and strength among features. Our database gathers the patients, antibiotic, and microbiology data from five Brazilian hospitals from May 8th, 2017 to August 31st, 2019, involving hospitalized patients in 24 adult ICUs. Information from the laboratory was used to identify all patients with a positive or negative test for carbapenem-resistant GNB, A. baumannii, P. aeruginosa, or Enterobacteriaceae. We have a total of 539 positive and 7,462 negative tests, resulting in 3,604 patients with at least one exam after 48 hours hospitalized. We proposed to the hospital s decision-maker two screening models. The random forest s model would reduce approximately 39 percent of the unnecessary tests and correctly predict 92 percent of positives. The Neural Network model avoids unnecessary tests in 64 percent of the cases, but 24 percent of positive tests are misclassified as negatives. Our results show that the sampling, SMOTEBagging, and UnderBagging approaches obtain better results. The linear techniques such as Logistic Regression with regularization give a relatively good performance and are more interpretable; they are not significantly different from the more complex classifiers. For the acquisition risk model, the Nearest Shrunken Centroids is the best model with a Brier score of 0.152 and a calibration belt acceptable. We developed an external validation of 624 patients from two other hospitals in the same network, finding good Brier score (0.128 and 0.079) values in both. The antibiotic and invasive procedures used, especially mechanical ventilation, are the most important attributes for the colonization or infection of CR-GNB. The predictive models can help avoid screening tests and inappropriate treatment in patients at low risk. Infection control policies can be established to control these bacteria s spread. Identifying patients who do not need to be tested decreases hospital costs and laboratory waiting times. We concluded that our models present good performance and seem sufficiently reliable to predict a patient with these pathogens. These predictive models can be included in the hospital system. The proposed methodology can be replicated in different healthcare settings. [pt] APRENDIZADO DE MAQUINA [pt] BACTERIAS GRAM-NEGATIVAS [pt] RESISTENCIA AOS CARBAPENEMICOS [pt] MODELO PREDITIVO [pt] ESTRATEGIAS DE BALANCEAMENTO [en] MACHINE LEARNING [en] GRAM-NEGATIVE BACTERIA [en] CARBAPENEM-RESISTANT [en] PREDICTIVE MODEL [en] BALANCING STRATEGIES

Search results