1 |
[pt] APLICAÇÕES DE APRENDIZADO PROFUNDO NO MONITORAMENTO DE CULTURAS: CLASSIFICAÇÃO DE TIPO, SAÚDE E AMADURECIMENTO DE CULTURAS / [en] APPLICATIONS OF DEEP LEARNING FOR CROP MONITORING: CLASSIFICATION OF CROP TYPE, HEALTH AND MATURITYGABRIEL LINS TENORIO 18 May 2020 (has links)
[pt] A eficiência de culturas pode ser aprimorada monitorando-se suas condições de forma contínua e tomando-se decisões baseadas em suas análises. Os dados para análise podem ser obtidos através de sensores de imagens e o processo de monitoramento pode ser automatizado utilizando-se algoritmos de reconhecimento de imagem com diferentes níveis de complexidade. Alguns dos algoritmos de maior êxito estão relacionados a abordagens supervisionadas de aprendizagem profunda (Deep Learning) as quais utilizam formas de Redes Neurais de Convolucionais (CNNs). Nesta dissertação de mestrado, empregaram-se modelos de aprendizagem profunda supervisionados para classificação, regressão, detecção de objetos e segmentação semântica em tarefas de monitoramento de culturas, utilizando-se amostras de imagens obtidas através de três níveis distintos: Satélites, Veículos Aéreos Não Tripulados (UAVs) e Robôs Terrestres Móveis (MLRs). Ambos satélites e UAVs envolvem o uso de imagens multiespectrais. Para o primeiro nível, implementou-se um modelo CNN baseado em Transfer Learning para a classificação de espécies vegetativas. Aprimorou-se o desempenho de aprendizagem do transfer learning através de um método de análise estatística recentemente proposto. Na sequência, para o segundo nível, implementou-se um algoritmo segmentação semântica multitarefa para a detecção de lavouras de cana-de-açúcar e identificação de seus estados (por exemplo, saúde e idade da cultura). O algoritmo também detecta a vegetação ao redor das lavouras, sendo relevante na busca por ervas daninhas. No terceiro nível, implementou-se um algoritmo Single Shot Multibox Detector para detecção de cachos de tomate. De forma a avaliar o estado dos cachos, utilizaram-se duas abordagens diferentes: uma implementação baseada em segmentação de imagens e uma CNN supervisionada adaptada para cálculos de regressão
capaz de estimar a maturação dos cachos de tomate. De forma a quantificar cachos de tomate em vídeos para diferentes estágios de maturação, empregou-se uma implementação de Região de Interesse e propôs-se um sistema de rastreamento o qual utiliza informações temporais. Para todos os
três níveis, apresentaram-se soluções e resultados os quais superam as linhas de base do estado da arte. / [en] Crop efficiency can be improved by continually monitoring their state and making decisions based on their analysis. The data for analysis can be obtained through images sensors and the monitoring process can be automated by using image recognition algorithms with different levels of complexity. Some of the most successful algorithms are related to supervised Deep Learning approaches which use a form of Convolutional Neural Networks (CNNs). In this master s dissertation, we employ supervised deep learning models for classification, regression, object detection, and semantic segmentation in crop monitoring tasks, using image samples obtained through three different levels: Satellites, Unmanned Aerial Vehicles (UAVs) and Unmanned Ground Vehicles (UGVs). Both satellites and UAVs levels involve the use of multispectral images. For the first level, we implement a CNN model based on transfer learning to classify vegetative species. We also improve the transfer learning performance by a newly proposed statistical analysis method. Next, for the second level, we implement a multi-task semantic segmentation algorithm to detect sugarcane crops and infer their state (e.g. crop health and age). The algorithm also detects the surrounding vegetation, being relevant in the search for weeds. In the third level, we implement a Single Shot Multibox detector algorithm to detect tomato clusters. To evaluate the cluster s state, we use two different approaches: an implementation based on image segmentation and a supervised CNN regressor capable of estimating their maturity. In order to quantify the tomato clusters in videos at different maturation stages, we employ a Region of Interest implementation and also a proposed tracking system which uses temporal information. For all the three levels, we present solutions and results that outperform state-of-the art baselines.
|
2 |
[pt] MONITORAMENTO DE MORANGOS: DETECÇÃO, CLASSIFICAÇÃO E SERVOVISÃO / [en] STRAWBERRY MONITORING: DETECTION, CLASSIFICATION, AND VISUAL SERVOINGGABRIEL LINS TENORIO 27 August 2024 (has links)
[pt] O presente trabalho inicia com uma investigação sobre o uso de modelos
de Aprendizado Profundo 3D para a detecção aprimorada de morangos em
túneis de cultivo. Focou-se em duas tarefas principais: primeiramente, a
detecção de frutas, comparando o modelo original MaskRCNN com uma
versão adaptada que integra informações de profundidade (MaskRCNN-D).
Ambos os modelos são capazes de classificar morangos baseados em sua
maturidade (maduro, não maduro) e estado de saúde (afetados por doença
ou fungo). Em segundo lugar, focou-se em identificar a região mais ampla
dos morangos, cumprindo um requisito para um sistema de espectrômetro
capaz de medir o conteúdo de açúcar das frutas. Nesta tarefa, comparouse um algoritmo baseado em contorno com uma versão aprimorada do
modelo VGG-16. Os resultados demonstram que a integração de dados
de profundidade no MaskRCNN-D resulta em até 13.7 por cento de melhoria no
mAP através de diversos conjuntos de teste de morangos, incluindo os
simulados, enfatizando a eficácia do modelo em cenários agrícolas reais e
simulados. Além disso, nossa abordagem de solução ponta-a-ponta, que
combina a detecção de frutas (MaskRCNN-D) e os modelos de identificação
da região mais ampla (VGG-16 aprimorado), mostra um erro de localização
notavelmente baixo, alcançando até 11.3 pixels de RMSE em uma imagem
de morango cortada de 224 × 224. Finalmente, explorou-se o desafio de
aprimorar a qualidade das leituras de dados do espectrômetro através do
posicionamento automático do sensor. Para tal, projetou-se e treinou-se um
modelo de Aprendizado Profundo com dados simulados, capaz de prever
a acurácia do sensor com base em uma imagem dada de um morango e o
deslocamento desejado da posição do sensor. Usando este modelo, calcula-se
o gradiente da saída de acurácia em relação à entrada de deslocamento. Isso
resulta em um vetor indicando a direção e magnitude com que o sensor deve
ser movido para melhorar a acurácia do sinal do sensor. Propôs-se então
uma solução de Servo Visão baseada neste vetor, obtendo um aumento
significativo na acurácia média do sensor e melhoria na consistência em
novas iterações simuladas. / [en] The present work begins with an investigation into the use of 3D Deep
Learning models for enhanced strawberry detection in polytunnels. We
focus on two main tasks: firstly, fruit detection, comparing the standard
MaskRCNN with an adapted version that integrates depth information
(MaskRCNN-D). Both models are capable of classifying strawberries based
on their maturity (ripe, unripe) and health status (affected by disease or
fungus). Secondly, we focus on identifying the widest region of strawberries,
fulfilling a requirement for a spectrometer system capable of measuring
their sugar content. In this task, we compare a contour-based algorithm
with an enhanced version of the VGG-16 model. Our findings demonstrate
that integrating depth data into the MaskRCNN-D results in up to a
13.7 percent improvement in mAP across various strawberry test sets, including
simulated ones, emphasizing the model s effectiveness in both real-world
and simulated agricultural scenarios. Furthermore, our end-to-end pipeline
approach, which combines the fruit detection (MaskRCNN-D) and widest
region identification models (enhanced VGG-16), shows a remarkably low
localization error, achieving down to 11.3 pixels of RMSE in a 224 × 224
strawberry cropped image. Finally, we explore the challenge of enhancing
the quality of the data readings from the spectrometer through automatic
sensor positioning. To this end, we designed and trained a Deep Learning
model with simulated data, capable of predicting the sensor accuracy based
on a given image of the strawberry and the subsequent displacement of
the sensor s position. Using this model, we calculate the gradient of the
accuracy output with respect to the displacement input. This results in a
vector indicating the direction and magnitude with which the sensor should
be moved to improve the sensor signal accuracy. A Visual Servoing solution
based on this vector provided a significant increase in the average sensor
accuracy and improvement in consistency across new simulated iterations.
|
Page generated in 0.0469 seconds