• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 9
  • 1
  • Tagged with
  • 10
  • 10
  • 10
  • 10
  • 10
  • 6
  • 6
  • 5
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] CONVOLUTIONAL NEURAL NETWORK FOR SEISMIC HORIZONS IDENTIFICATION / [pt] IDENTIFICAÇÃO DE HORIZONTES EM SÍSMICA USANDO REDE NEURAL CONVOLUCIONAL

MAYARA GOMES SILVA 07 November 2022 (has links)
[pt] O petróleo e gás são importantes na economia mundial, utilizados como matéria-prima em vários produtos. Para a extração desses produtos é necessário realizar a caracterização dos reservatórios de hidrocarbonetos. A partir dessa caracterização são extraídos um volume com dados sísmicos da região de interesse. Esses dados são interpretados para identificação de várias características, como a classificação de fácies sísmicas, horizontes, falhas, e gás. A grande quantidade de dados do volume de sísmica, torna a interpretação manual cada vez mais desafiadora. Muitos pesquisadores da área de interpretação sísmica tem investido em métodos utilizando redes neurais. As redes neurais convolucionais (CNN) são muito utilizadas em problemas de visão computacional, e obtém ótimos resultados em muitos problemas com dados 2D. O presente trabalho tem como objetivo a aplicação de redes neurais convolucionais no mapeamento supervisionado de horizontes sísmicos. Avaliamos nossa proposta usando o bloco F3 com as anotações de fácies sísmicas. Os dados foram utilizados baseados em modelo de seção e patches. Na previsão de horizonte foram avaliadas as arquiteturas da ResUnet e DC-Unet. Como função de perda foram analisadas a Generalized Dice e a perda Focal Tversky. O método mostrou resultados promissores com a ResUnet e função de perda Focal Tversky, nos dados baseados em patches de 128x128, alcançando aproximadamente 56 por cento na métrica Dice. A implementação completa e as redes treinadas estão disponíveis em https://github.com/mayaragomys/seismic_horizons. / [en] Oil and gas are important in the world economy, used as raw materials in various products. For the extraction of these products, it is necessary to carry out the characterization of the hydrocarbon reservoirs. This characterization extracts a volume with seismic data from the region of interest. These data are interpreted to identify various features, such as the classification of seismic facies, horizons, faults, and gas. A large amount of seismic volume data makes manual interpretation increasingly challenging. Many researchers in the field of seismic interpretation have invested in methods using neural networks. Convolutional Neural Networks (CNN) are widely used in computer vision problems and get great results in many situations with 2D data. The present work aimed to apply convolutional neural networks in the supervised mapping of seismic horizons. We evaluated our proposal using the F3 block with seismic facies annotations. The data representation in the input layer are patches of sections. In the horizon forecast, we evaluate the architectures of ResUnet and DC-Unet. We use the Generalized Dice and the Focal Tversky loss functions for the loss function. The method delivered promising results with the ResUnet and Focal Tversky loss function on data based on 128x128 patches, reaching approximately 56 percent on the Dice metric. The full implementation and the trained networks are available at https://github.com/mayaragomys/seismic_horizons.
2

Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos

Silva, Leandro Pereira da 27 March 2018 (has links)
Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-06-15T16:40:47Z No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5) / Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2018-06-26T13:25:28Z (GMT) No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5) / Made available in DSpace on 2018-06-26T13:34:22Z (GMT). No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5) Previous issue date: 2018-03-27 / Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores. / A vis?o computacional ? a ci?ncia que permite fornecer aos computadores a ca- pacidade de verem o mundo em sua volta. Entre as tarefas, o reconhecimento de objetos pretende classificar objetos e identificar a posi??o onde cada objeto est? em uma imagem. Como objetos costumam ocorrer em ambientes particulares, a utiliza??o de seus contex- tos pode ser vantajosa para melhorar a tarefa de reconhecimento de objetos. Para utilizar o contexto na tarefa de reconhecimento de objetos, a abordagem proposta realiza a iden- tifica??o do contexto da cena separadamente da identifica??o do objeto, fundindo ambas informa??es para a melhora da detec??o do objeto. Para tanto, propomos uma nova arquite- tura composta de duas redes neurais convolucionais em paralelo: uma para a identifica??o do objeto e outra para a identifica??o do contexto no qual o objeto est? inserido. Por fim, a informa??o de ambas as redes ? concatenada para realizar a classifica??o do objeto. Ava- liamos a arquitetura proposta com os datasets p?blicos PASCAL VOC 2007 e o MS COCO, comparando o desempenho da abordagem proposta com abordagens que n?o utilizam o contexto. Os resultados mostram que nossa abordagem ? capaz de aumentar a probabili- dade de classifica??o para objetos que est?o em contexto e reduzir para objetos que est?o fora de contexto.
3

MÉTODO DE CLASSIFICAÇÃO DE PRAGAS POR MEIO DE REDE NEURAL CONVOLUCIONAL PROFUNDA

Rosa, Renan de Paula 19 November 2018 (has links)
Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2019-02-28T17:58:29Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Renan Rosa.pdf: 4067327 bytes, checksum: eb0bd9e84fbd89a24b4a397c9655fa62 (MD5) / Made available in DSpace on 2019-02-28T17:58:29Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Renan Rosa.pdf: 4067327 bytes, checksum: eb0bd9e84fbd89a24b4a397c9655fa62 (MD5) Previous issue date: 2018-11-19 / As pragas em lavouras causam prejuízos econômicos na agricultura, reduzindo a produção e consequentemente os lucros. O manejo de pragas é essencial, para reduzir estes prejuízos, e consiste na identificação e posterior controle desse tipo de ameaça. O controle é fundamentalmente dependente da identificação, pois é a partir dela que o manejo é feito. A identificação é feita visualmente, baseando-se nas características da praga. Essas características são inerentes e diferem de espécie para espécie. Devido à dificuldade da identificação, esse processo é realizado principalmente por profissionais especializados na área, o que acarreta na concentração do conhecimento. Esta dissertação apresenta uma metodologia para classificação de pragas por meio de técnicas de computação, onde um sistema computacional do tipo clienteservidor foi criado a fim de prover a classificação de pragas por meio de serviço, que é realizado pelo uso de rede neural convolucional baseada na arquitetura Inception V3. As pragas Anticarsia Gemmatalis, Helicoverpa armigera e Spodoptera Cosmioides, foram escolhidas para classificação por serem bastante comuns no estado do Paraná. A rede neural convolucional obteve índice de acerto de 92,5%. / Pests on crops cause economic damage to agriculture, reducing production and consequently profits. Pest management is essential to reduce these losses, and consists in the identification and subsequent control of this type of threat. Control is fundamentally dependent on identification, because management is done from it. The identification is made visually, based on the characteristics of the pest. These characteristics are inherent and differ from species to species. Due to the difficulty of identification, this process is carried out mainly by professionals specialized in the area, which entails the concentration of knowledge. This dissertation presents a methodology for pest classification by means of computational techniques, in which a client-server computational system was created in order to provide pest classification by means of a service, which is performed by the use of convolutional neural network based in the Inception V3 architecture. The pests Anticarsia Gemmatalis, Helicoverpa armigera and Spodoptera Cosmioides, were chosen for classification because they are quite common in the state of Paraná. The convolutional neural network obtained a success rate of 92.5%.
4

Diagnóstico de nódulos pulmonares em imagens de tomografia computadorizada usando redes neurais convolucionais evolutivas

Silva, Giovanni Lucca França da 31 January 2017 (has links)
Submitted by Rosivalda Pereira (mrs.pereira@ufma.br) on 2017-05-30T19:36:59Z No. of bitstreams: 1 GiovanniLucca.pdf: 1608375 bytes, checksum: 90ad0a568a12b861d1a2a3467c275a12 (MD5) / Made available in DSpace on 2017-05-30T19:36:59Z (GMT). No. of bitstreams: 1 GiovanniLucca.pdf: 1608375 bytes, checksum: 90ad0a568a12b861d1a2a3467c275a12 (MD5) Previous issue date: 2017-01-31 / CAPES / Lung cancer is the leading cause of cancer death worldwide, which accounts for more than 17% percent of the total cancer related deaths. However, its early detection may help in a sharp drop in this mortality rate. Because of the arduous analysis process, alternatives such as computational tools that use image processing techniques and pattern recognition have been widely developed and explored for the early diagnosis of this disease, providing a second opinion to the specialist and making this process faster. Therefore, this work proposes a methodology for the diagnosis of slice-based lung nodules extracted from computed tomography images using evolutionary convolutional neural networks. Firstly, the nodules are divided into two sub-regions using the Otsu algorithm based on the particle swarm optimization algorithm. Then, the slices of the nodules and the slices of their sub-regions were resized to the 28 x 28 dimension and given as input simultaneously to the networks. The architecture of the model was composed of three convolutional neural networks sharing the same fully connected layer at the end. Being a parameterized model, the genetic algorithm was applied to optimize some parameters, such as the number of filters in the convolution layers and the number of neurons in the hidden layer. The proposed methodology was tested on the Lung Image Database Consortium and the Image Database Resource Initiative, resulting in a sensitivity of 94.66 %, specificity of 95.14 %, accuracy of 94.78 % and area under the ROC curve of 0.949. / O câncer de pulmão é a maior causa de morte por câncer em todo mundo, representando mais de 17% do total de mortes relacionadas com câncer. No entanto, sua detecçãao precoce pode ajudar em uma queda acentuada nesta taxa de mortalidade. Devido ao árduo processo na análise dos exames por imagens, alternativas como sistemas computacionais que utilizam técnicas de processamento de imagens e reconhecimento de padrões têm sido amplamente desenvolvidos e explorados para o diagnóstico precoce desta doen¸ca, provendo uma segunda opinião para o especialista e tornando esse processo mais rápido. Diante disso, este trabalho propõe uma metodologia para o diagnóstico de nódulos pulmonares baseado nas fatias extraídas da tomografia computadorizada usando as redes neurais convolucionais evolutivas. Primeiramente, os nódulos são divididos em duas sub-regiões utilizando o algoritmo de Otsu baseado no algoritmo de otimização por enxame de partículas. Em seguida, as fatias dos nódulos e as fatias das suas sub-regiões foram redimensionadas para a dimensão 28 x 28 e dadas como entrada simultaneamente às redes. A arquitetura do modelo foi composta por três redes neurais convolucionais compartilhando a mesma camada completamente conectada no final. Tratando-se de um modelo parametrizado, o algoritmo genético foi aplicado para otimização de alguns parâmetros, tais como a quantidade de filtros nas camadas de convolução e a quantidade de neurônios na camada oculta. A metodologia proposta foi testada na base de imagens Lung Image Database Consortium e a Image Database Resource Initiative, resultando em uma sensibilidade de 94,66%, especifidade de 95,14%, acurácia de 94,78% e área sob a curva ROC de 0,949.
5

Detecção de distorção arquitetural mamária em mamografia digital utilizando rede neural convolucional profunda / Detection of architectural distortion in digital mammography using deep convolutional neural network

Costa, Arthur Chaves 08 March 2019 (has links)
A proposta deste trabalho foi analisar diferentes metodologias de treinamento de uma rede neural convolucional profunda (CNN) para a detecção de distorção arquitetural mamária (DA) em imagens de mamografia digital. A DA é uma contração sutil do tecido mamário que pode representar o sinal mais precoce de um câncer de mama em formação. Os sistemas computacionais de auxílio ao diagnóstico (CAD) existentes ainda apresentam desempenho insatisfatório para a detecção da DA. Sistemas baseados em CNN têm atraído a atenção da comunidade científica, inclusive na área médica para a otimização dos sistemas CAD. No entanto, as CNNs necessitam de um grande volume de dados para serem treinadas adequadamente, o que é particularmente difícil na área médica. Dessa forma, foi realizada neste trabalho, uma comparação de diferentes abordagens de treinamento para uma arquitetura CNN avaliando-se o efeito de técnicas de geração de novas amostras (data augmentation) sobre o desempenho da rede. Para isso, foram utilizadas 240 mamografias digitais clínicas. Uma das redes (CNN-SW) foi treinada com recortes extraídos por varredura em janela sobre a área interna da mama (aprox. 21600 em média) e a outra rede (CNN-SW+) contou com o mesmo conjunto ampliado por data augmentation (aprox. 345000 em média). Para avaliar o método, foi utilizada validação cruzada por k-fold, gerando-se em rodízio, 10 modelos de cada rede. Os testes analisaram todas as ROIs extraídas da mama, sendo testados 14 mamogramas por fold, e obtendo-se uma diferença estatisticamente significativa entre os resultados (AUC de 0,81 para a CNN-SW e 0,83 para a CNN-SW+). Mapas de calor ilustraram as predições da rede, permitindo uma análise visual e quantitativa do comportamento de ambos os modelos. / The purpose of this work was to analyze different training methodologies of a deep convolutional neural network (CNN) to detect breast architectural distortion (AD) in digital mammography images. AD is a subtle contraction of the breast tissue that may represent the earliest sign of a breast cancer in formation. Current Computer-Aided Detection (CAD) systems still have an unsatisfactory performance on AD detection. CNN-based systems have attracted the attention of the scientific community, including in the medical field for CAD optimization. However, CNNs require a large amount of data to be properly trained, which is particularly difficult in the medical field. Thus, in this work, different training approaches for a CNN architecture are compared evaluating the effect of data augmentation techniques on the data set. For this, 240 clinical digital mammography were used. One of the networks (CNN-SW) was trained with regions of interest (ROI) extracted by a sliding window over the inner breast area (approx 21600 on average) and the other network (CNN-SW+) had the same set enlarged by data augmentation (about 345000 on average). To evaluate the method, k-fold cross-validation was used, generating 10 instances of each model. The tests looked at all the ROIs extracted from the breast (14 mammograms per fold), and results showed a statistically significant difference between both networks (AUC of 0.81 for CNN-SW and 0.83 for CNN-SW+). Heat maps illustrated the predictions of the networks, allowing a visual and quantitative analysis of the behavior of both models.
6

[en] MODELING OF GEOBODIES: AI FOR SEISMIC FAULT DETECTION AND ALL-QUADRILATERAL MESH GENERATION / [pt] MODELAGEM DE OBJETOS GEOLÓGICOS: IA PARA DETECÇÃO AUTOMÁTICA DE FALHAS E GERAÇÃO DE MALHAS DE QUADRILÁTEROS

AXELLE DANY JULIETTE POCHET 14 December 2018 (has links)
[pt] A exploração segura de reservatórios de petróleo necessita uma boa modelagem numérica dos objetos geológicos da sub superfície, que inclui entre outras etapas: interpretação sísmica e geração de malha. Esta tese apresenta um estudo nessas duas áreas. O primeiro estudo é uma contribuição para interpretação de dados sísmicos, que se baseia na detecção automática de falhas sísmicas usando redes neurais profundas. Em particular, usamos Redes Neurais Convolucionais (RNCs) diretamente sobre mapas de amplitude sísmica, com a particularidade de usar dados sintéticos para treinar a rede com o objetivo final de classificar dados reais. Num segundo estudo, propomos um novo algoritmo para geração de malhas bidimensionais de quadrilaterais para estudos geomecânicos, baseado numa abordagem inovadora do método de quadtree: definimos novos padrões de subdivisão para adaptar a malha de maneira eficiente a qualquer geometria de entrada. As malhas obtidas podem ser usadas para simulações com o Método de Elementos Finitos (MEF). / [en] Safe oil exploration requires good numerical modeling of the subsurface geobodies, which includes among other steps: seismic interpretation and mesh generation. This thesis presents a study in these two areas. The first study is a contribution to data interpretation, examining the possibilities of automatic seismic fault detection using deep learning methods. In particular, we use Convolutional Neural Networks (CNNs) on seismic amplitude maps, with the particularity to use synthetic data for training with the goal to classify real data. In the second study, we propose a new two-dimensional all-quadrilateral meshing algorithm for geomechanical domains, based on an innovative quadtree approach: we define new subdivision patterns to efficiently adapt the mesh to any input geometry. The resulting mesh is suited for Finite Element Method (FEM) simulations.
7

[pt] DESENVOLVIMENTO DE PIV ULTRA PRECISO PARA BAIXOS GRADIENTES USANDO ABORDAGEM HÍBRIDA DE CORRELAÇÃO CRUZADA E CASCATA DE REDE NEURAIS CONVOLUCIONAIS / [en] DEVELOPMENT OF ULTRA PRECISE PIV FOR LOW GRADIENTS USING HYBRID CROSS-CORRELATION AND CASCADING NEURAL NETWORK CONVOLUTIONAL APPROACH

CARLOS EDUARDO RODRIGUES CORREIA 31 January 2022 (has links)
[pt] Ao longo da história a engenharia de fluidos vem se mostrado como uma das áreas mais importantes da engenharia devido ao seu impacto nas áreas de transporte, energia e militar. A medição de campos de velocidade, por sua vez, é muito importante para estudos nas áreas de aerodinâmica e hidrodinâmica. As técnicas de medição de campo de velocidade em sua maioria são técnicas ópticas, se destacando a técnica de Particle Image Velocimetry (PIV). Por outro lado, nos últimos anos importantes avanços na área de visão computacional, baseados em redes neurais convolucionais, se mostram promissores para a melhoria do processamento das técnicas ópticas. Nesta dissertação, foi utilizada uma abordagem híbrida entre correlação cruzada e cascata de redes neurais convolucionais, para desenvolver uma nova técnica de PIV. O projeto se baseou nos últimos trabalhos de PIV com redes neurais artificiais para desenvolver a arquitetura das redes e sua forma de treinamento. Diversos formatos de cascata de redes neurais foram testados até se chegar a um formato que permitiu reduzir o erro em uma ordem de grandeza para escoamento uniforme. Além do desenvolvimento da cascata para escoamento uniforme, gerou-se conhecimento para fazer cascatas para outros tipos de escoamentos. / [en] Throughout history, fluid engineering is one of the most important areas of engineering due to its impact in the areas of transportation, energy and the military. The measurement of velocity fields is important for studies in aerodynamics and hydrodynamics. The techniques for measuring the velocity field are mostly optical techniques, with emphasis on the PIV technique. On the other hand, in recent years, important advances in computer vision, based on convolutional neural networks, have shown promise for improving the processing of optical techniques. In this work, a hybrid approach between cross-correlation and cascade of convolutional neural networks was used to develop a new PIV technique. The project was based on the latest work of PIV with an artificial neural network to develop the architecture of the networks and their form of training. Several cascade formats of neural networks were tested until they reached a format that allowed the error to be reduced by an order of magnitude for uniform flow. In addition to the development of the cascade for uniform flow, knowledge was generated to make cascades for other types of flows.
8

[en] POPULATION DISTRIBUTION MAPPING THROUGH THE DETECTION OF BUILDING AREAS IN GOOGLE EARTH IMAGES OF HETEROGENEOUS REGIONS USING DEEP LEARNING / [pt] MAPEAMENTO DA DISTRIBUIÇÃO POPULACIONAL ATRAVÉS DA DETECÇÃO DE ÁREAS EDIFICADAS EM IMAGENS DE REGIÕES HETEROGÊNEAS DO GOOGLE EARTH USANDO DEEP LEARNING

CASSIO FREITAS PEREIRA DE ALMEIDA 08 February 2018 (has links)
[pt] Informações precisas sobre a distribuição da população são reconhecidamente importantes. A fonte de informação mais completa sobre a população é o censo, cujos os dados são disponibilizados de forma agregada em setores censitários. Esses setores são unidades operacionais de tamanho e formas irregulares, que dificulta a análise espacial dos dados associados. Assim, a mudança de setores censitários para um conjunto de células regulares com estimativas adequadas facilitaria a análise. Uma metodologia a ser utilizada para essa mudança poderia ser baseada na classificação de imagens de sensoriamento remoto para a identificação de domicílios, que é a base das pesquisas envolvendo a população. A detecção de áreas edificadas é uma tarefa complexa devido a grande variabilidade de características de construção e de imagens. Os métodos usuais são complexos e muito dependentes de especialistas. Os processos automáticos dependem de grandes bases de imagens para treinamento e são sensíveis à variação de qualidade de imagens e características das construções e de ambiente. Nesta tese propomos a utilização de um método automatizado para detecção de edificações em imagens Google Earth que mostrou bons resultados utilizando um conjunto de imagens relativamente pequeno e com grande variabilidade, superando as limitações dos processos existentes. Este resultado foi obtido com uma aplicação prática. Foi construído um conjunto de imagens com anotação de áreas construídas para 12 regiões do Brasil. Estas imagens, além de diferentes na qualidade, apresentam grande variabilidade nas características das edificações e no ambiente geográfico. Uma prova de conceito será feita na utilização da classificação de área construída nos métodos dasimétrico para a estimação de população em gride. Ela mostrou um resultado promissor quando comparado com o método usual, possibilitando a melhoria da qualidade das estimativas. / [en] The importance of precise information about the population distribution is widely acknowledged. The census is considered the most reliable and complete source of this information, and its data are delivered in an aggregated form in sectors. These sectors are operational units with irregular shapes, which hinder the spatial analysis of the data. Thus, the transformation of sectors onto a regular grid would facilitate such analysis. A methodology to achieve this transformation could be based on remote sensing image classification to identify building where the population lives. The building detection is considered a complex task since there is a great variability of building characteristics and on the images quality themselves. The majority of methods are complex and very specialist dependent. The automatic methods require a large annotated dataset for training and they are sensitive to the image quality, to the building characteristics, and to the environment. In this thesis, we propose an automatic method for building detection based on a deep learning architecture that uses a relative small dataset with a large variability. The proposed method shows good results when compared to the state of the art. An annotated dataset has been built that covers 12 cities distributed in different regions of Brazil. Such images not only have different qualities, but also shows a large variability on the building characteristics and geographic environments. A very important application of this method is the use of the building area classification in the dasimetric methods for the population estimation into grid. The concept proof in this application showed a promising result when compared to the usual method allowing the improvement of the quality of the estimates.
9

[en] A SIMULATION STUDY OF TRANSFER LEARNING IN DEEP REINFORCEMENT LEARNING FOR ROBOTICS / [pt] UM ESTUDO DE TRANSFER LEARNING EM DEEP REINFORCEMENT LEARNING EM AMBIENTES ROBÓTICOS SIMULADOS

EVELYN CONCEICAO SANTOS BATISTA 05 August 2020 (has links)
[pt] Esta dissertação de mestrado consiste em um estudo avançado sobre aprendizado profundo por reforço visual para robôs autônomos através de técnicas de transferência de aprendizado. Os ambientes de simulação testados neste estudo são ambientes realistas complexos onde o robô tinha como desafio aprender e transferir conhecimento em diferentes contextos para aproveitar a experiência de ambientes anteriores em ambientes futuros. Este tipo de abordagem, além de agregar conhecimento ao robô autônomo, diminui o número de épocas de treinamento do algoritmo, mesmo em ambientes complexos, justificando o uso de técnicas de transferência de aprendizado. / [en] This master s thesis consists of an advanced study on deep learning by visual reinforcement for autonomous robots through transfer learning techniques. The simulation environments tested in this study are highly realistic environments where the challenge of the robot was to learn and tranfer knowledge in different contexts to take advantage of the experiencia of previous environments in future environments. This type of approach besides adding knowledge to the autonomous robot reduces the number of training epochs the algorithm, even in complex environments, justifying the use of transfer learning techniques.
10

[en] BOUNDING BOXES SELECTION IN OBJECT DETECTION ARCHITECTURES / [pt] SELEÇÃO DE RETÂNGULOS ENVOLVENTES EM ARQUITETURAS PARA DETECÇÃO DE OBJETOS

CLAUDIO VIEIRA ESCUDERO 30 June 2021 (has links)
[pt] Esta dissertação estuda métodos e algoritmos para critérios de seleções dos retângulos envolventes focando em arquiteturas de detecção de objetos baseada redes neurais convolucionais para tempo real, que processam mais de 30fps, que também possibilitam a expansão para outras arquiteturas. O objetivo desta dissertação é melhorar as métricas Recall e Precision, proporcionando mais assertividade nos resultados destas arquiteturas sem a necessidade de recriá-las ou retreiná-las, diminuindo, assim, os recursos para manutenções. As arquiteturas que trabalham em tempo real normalmente não apresentam melhores resultados, pois são desenvolvidas visando a redução do tempo de execução. Para resolver estes problemas, serão testados outros métodos de critérios de seleção de retângulos envolventes em estado da arte, são eles: Nonmaximum Suppression (NMS), Soft-NMS, Non-Maximum Weighted (NMW) e Weighted Boxes Fusion (WBF). Os resultados obtidos foram comparados aos originais das arquiteturas, utilizando as métricas mAP, Recall e Precision. Através desta comparação foi possível comprovar que os novos critérios apresentaram bons resultados. O tempo de execução dos novos critérios também foi analisado com execuções de imagens em lotes, contornando alguns overheads dos critérios mais pesados. As arquiteturas utilizadas como base nos experimentos foram baseadas nos sistemas YOLOv3-Tiny e YOLOv4-Tiny, utilizando o dataset QMUL-OpenLogo público e especializado em logotipos e baseado em fotos reais. / [en] This dissertation studies methods and algorithms for bounding box selection criteria focusing on object detection architectures based on convolutional neural networks for real-time, processing over 30fps, which also allow expansion to other architectures. The goal of this study is to improve the Recall and Precision metrics, providing more assertiveness in the results of these architectures without the need to recreate or retrain them, thus reducing the resources for maintenance. Architectures that work in real-time usually do not present good results, because they are developed aiming to reduce execution time. To solve these problems, other state-of-the-art bounding box selection criteria methods will be tested: Non-maximum Suppression (NMS), Soft-NMS, Non-Maximum Weighted (NMW) and Weighted Boxes Fusion (WBF). The results obtained were compared to the original architectures, using the mAP, Recall and Precision metrics. Through this comparison it was possible to prove that the new criteria presented satisfactory results. The execution time of the new criteria was also analyzed with batch image executions, bypassing some overheads of the heavier criteria. The architectures used as basis for the experiments were based on the YOLOv3-Tiny and YOLOv4-Tiny systems, using the public dataset QMUL-OpenLogo specialized in logos and based on real photos.

Page generated in 0.1378 seconds