Spelling suggestions: "subject:"visar"" "subject:"visat""
111 |
[en] EXPLAINABLE ARTIFICIAL INTELLIGENCE FOR MEDICAL IMAGE CLASSIFIERS / [pt] INTELIGÊNCIA ARTIFICIAL EXPLICÁVEL PARA CLASSIFICADORES DE IMAGENS MÉDICASIAM PALATNIK DE SOUSA 02 July 2021 (has links)
[pt] A inteligência artificial tem gerado resultados promissores na área médica, especialmente na última década. Contudo, os modelos de melhor desempenho apresentam opacidade em relação ao seu funcionamento interno. Nesta tese, são apresentadas novas metodologias e abordagens para o desenvolvimento de classificadores explicáveis de imagens médicas. Dois principais métodos, Squaregrid e EvEx, foram desenvolvidos. O primeiro consiste em uma geração mais grosseira, porém rápida, de heatmaps explicativos via segmentações em grades quadrados, enquanto o segundo baseia-se em otimização multi-objetivo, baseada em computação evolucionária, visando ao ajuste fino de parâmetros de segmentação. Notavelmente, ambas as técnicas são agnósticas ao modelo, o que facilita sua utilização para qualquer tipo de classificador de imagens. O potencial destas abordagens foi avaliado em três estudos de
caso de classificações médicas: metástases em linfonodos, malária e COVID-19. Para alguns destes casos foram analisados modelos de classificação existentes, publicamente disponíveis. Por outro lado, em outros estudos de caso, novos modelos tiveram que ser treinados. No caso do estudo de COVID-19,
a ResNet50 treinada levou a F-scores acima de 0,9 para o conjunto de teste de uma competição para classificação de coronavirus, levando ao terceiro lugar geral. Adicionalmente, técnicas de inteligência artificial já existentes como LIME e GradCAM, bem como Vanilla, Smooth e Integrated Gradients também
foram usadas para gerar heatmaps e possibilitar comparações. Os resultados aqui descritos ajudaram a demonstrar e preencher parcialmente lacunas associadas à integração das áreas de inteligência artificial explicável e medicina. Eles também ajudaram a demonstrar que as diferentes abordagens de inteligência
artificial explicável podem gerar heatmaps que focam em características diferentes da imagem. Isso por sua vez demonstra a importância de combinar abordagens para criar um panorama mais completo sobre os modelos classificadores, bem como extrair informações sobre o que estes aprendem. / [en] Artificial Intelligence has generated promissing results for the medical
area, especially on the last decade. However, the best performing models
present opacity when it comes to their internal working. In this thesis, methodologies
and approaches are presented for the develpoment of explainable classifiers
of medical images. Two main methods, Squaregrid and EvEx, were developed.
The first consistts in a rough, but fast, generation of heatmaps via
segmentations in square grids, and the second in genetic multi objective optimizations
aiming at the fine-tuning of segmentation parameters. Notably, both
techniques are agnostic to the model,which facilitates their utilization for any
kind of image classifier. The potential of these approaches was demonstrated in
three case studies of medical classifications: lymph node mestastases, malária
and COVID-19. In some of these cases, already existing classifier models were
analyzed, while in some others new models were trained. For the COVID-19
study, the trained ResNet50 provided F-scores above 0.9 in a test set from a
coronavirus classification competition, resulting in the third place overall. Additionally,
already existing explainable artificial intelligence techniques, such
as LIME and GradCAM, as well as Vanilla, Smooth and Integrated Gradients,
were also used to generate heatmaps and enable comparisons. The results here
described help to demonstrate and improve the gaps in integrating the areas of
explainable artificial intelligence and medicine. They also aided in demonstrating
that the different types of approaches in explainable artificial intelligence
can generate heatmaps that focus on different characteristics of the image.
This shows the importance of combining approaches to create a more complete
overview of classifier models, as well as extracting informations about
what they learned from data.
|
112 |
[en] SUPER-RESOLUTION IN TOMOGRAPHIC IMAGES OF IRON ORE BRIQUETTES EMPLOYING DEEP LEARNING / [pt] SUPER-RESOLUÇÃO EM IMAGENS TOMOGRÁFICAS DE BRIQUETES DE MINÉRIO DE FERRO UTILIZANDO APRENDIZADO PROFUNDOBERNARDO AMARAL PASCARELLI FERREIRA 11 October 2023 (has links)
[pt] A indústria mineral vem presenciando, ao longo das últimas décadas, uma redução da qualidade de minério de ferro extraído e o surgimento de novas demandas ambientais. Esta conjuntura fortalece a busca por produtos provenientes do minério de ferro que atendam aos requisitos da indústria siderúrgica, como é o caso de novos aglomerados de minério de ferro. A Microtomografia de Raios-X (microCT) permite a caracterização da estrutura tridimensional de uma amostra, com resolução micrométrica, de forma não-destrutiva. Entretanto, tal técnica apresenta diversas limitações. Quanto melhor a resolução, maior o tempo de análise e menor o volume de amostra adquirido. Modelos de Super Resolução (SR), baseados em Deep Learning, são uma
poderosa ferramenta para aprimorar digitalmente a resolução de imagens tomográficas adquiridas em pior resolução. Este trabalho propõe o desenvolvimento de uma metodologia para treinar três modelos de SR, baseados na arquitetura EDSR, a partir de imagens tomográficas de briquetes de redução direta: Um modelo para aumento de resolução de 16 um para 6 um, outro para
aumento de 6 um para 2 um, e o terceiro para aumento de 4 um para 2 um. Esta proposta tem como objetivo mitigar as limitações do microCT, auxiliando o desenvolvimento de novas metodologias de Processamento Digital de Imagens para os aglomerados. A metodologia inclui diferentes propostas para avaliação do desempenho da SR, como comparação de PSNR e segmentação de poros. Os resultados apontam que a SR foi capaz de aprimorar a resolução das imagens tomográficas e mitigar ruídos habituais da tomografia. / [en] The mining industry has been witnessing a reduction of extracted iron ore s
quality and the advent of new environmental demands. This situation reinforces a
search for iron ore products that meet the requirements of the steel industry, such
as new iron ore agglomerates. X-ray microtomography (microCT) allows the
characterization of a sample s three-dimensional structure, with micrometer
resolution, in a non-destructive analysis. However, this technique presents several
limitations. Better resolutions greatly increase analysis time and decrease the
acquired sample’s volume. Super-Resolution (SR) models, based on Deep
Learning, are a powerful tool to digitally enhance the resolution of tomographic
images acquired at lower resolutions. This work proposes the development of a
methodology to train three SR models, based on EDSR architecture, using
tomographic images of direct reduction briquettes: A model for enhancing the
resolution from 16 um to 6 um, another for enhancing from 6 um to 2 um, and the
third for enhancing 4 um to 2 um. This proposal aims to mitigate the limitations of
microCT, assisting the development and implementation of new Digital Image
Processing methodologies for agglomerates. The methodology includes different
proposals for SR s performance evaluation, such as PSNR comparison and pore
segmentation. The results indicate that SR can improve the resolution of
tomographic images and reduce common tomography noise.
|
113 |
[pt] O IMPACTO DAS ESTRATÉGIAS DE SUSTENTABILIDADE AMBIENTAL NO DESEMPENHO DE EXPORTAÇÃO DA AGROINDÚSTRIA BRASILEIRA: INFLUÊNCIA DAS CAPACIDADES ORGANIZACIONAIS E AMBIENTE INSTITUCIONAL / [en] THE IMPACT OF SUSTAINABILITY STRATEGIES ON THE EXPORT PERFORMANCE OF BRAZILIAN AGROINDUSTRY: INFLUENCE OF ORGANIZATIONAL CAPACITIES AND INSTITUTIONAL ENVIRONMENTALCAMILA CARVALHO COSTA 29 November 2019 (has links)
[pt] As corporações estão sendo cada vez mais cobradas por uma atuação ambientalmente sustentável, principalmente nos mercados mais maduros, e tratam-se de importantes atores no atingimento das metas para o controle do aquecimento global. O Brasil tem uma participação protagonista no comércio
mundial de alimentos, e seu papel torna-se mais relevante ao passo que as taxas crescentes de aumento populacional colocam o mundo em alerta para as questões climáticas e de segurança alimentar. Trazendo ainda mais foco para a temática, o país possui uma das maiores biodiversidades do planeta e é detentor de grande parte da Floresta Amazônica, a maior floresta tropical do mundo e responsável por parte do equilíbrio climático do globo, ao passo que a agroindústria responde pelo consumo de mais de 78 porcento dos recursos hídricos brasileiros, ocupa em torno de 21 porcento do território nacional e é responsável por 74 porcento das emissões de gases de efeito estufa do país. Nesse contexto, fundamentado na Resource Based-View e Teoria Institucional foi construído um modelo com o objetivo de analisar o impacto dos fatores organizacionais (capacidades dinâmicas) e do ambiente institucional (sociedade, regulação e concorrência) nas estratégias de sustentabilidade ambiental e como estas estratégias impactam o desempenho de exportação das empresas da agropecuária brasileira. Na literatura há poucos estudos empíricos com foco em analisar as relações entre esses constructos e nenhum deles no âmbito da agroindústria brasileira. Ademais, buscou-se uma contribuição adicional ao analisar como o nível de maturidade em sustentabilidade ambiental dos países de destino influencia na relação entre as estratégias de sustentabilidade e o desempenho de exportação. Para o teste do modelo, foi realizado um levantamento de dados com gestores de 143 empresas exportadoras da agroindústria brasileira, através de um questionário on-line e foi utilizada a Modelagem de Equações Estruturais (PLS-SEM) para a estimativa de parâmetros. Os resultados empíricos corroboram parte das hipóteses apresentadas, revelando a significância da relação principal do estudo (estratégias de sustentabilidade e desempenho de exportação), além de apresentar o engajamento da liderança na temática da sustentabilidade como o principal fator interno da adoção deste tipo de estratégia, assim como a pressão percebida da sociedade estrangeira e da concorrência como os principais fatores externos. Contudo, a principal contribuição teórica do estudo é advinda da análise do fator de moderação. Os resultados evidenciam que no âmbito do grupo de empresas que exportam para países com uma maior maturidade na temática de sustentabilidade ambiental, a relação entre as estratégias de sustentabilidade ambiental e o desempenho de exportação foi mais expressivo do que para o grupo de empresas que exporta para países menos maduros no assunto. / [en] More and more the corporations are being charged for Environmental Sustainability performance, especially in developed markets and this indicator is essential for reaching the global warning control targets .Today Brazil has a significant share of the global food trade and has a leading hole taking into consideration the alert for climate changes and food security issues that are becoming relevant due to global population growth. Bringing even more focus on this subject, the country has one of the largest biodiversity of the planet and holds the greatest share of the Amazon, the largest rainforest in the world and responsible for part of the global climate balance, while the agroindustry is responsible for the consumption of more than 70 percent of Brazilian water resources, occupies around 21 percent of the national territory and accounts for 74 percent of the country s greenhouse gas emissions. In this context, rooted in Resource Based-
View and Institutional Theory, a model was constructed for the purpose of analyzing the impact of organizational factors (dynamic capacities) and the institutional environment (society, regulation, and competition) on environmental sustainability strategies and how these strategies impact export performance of Brazilian agricultural companies. In the literature there are few empirical studies
focused on analyzing the relationships between these constructs and none of them within the scope of the Brazilian agroindustry, besides that, an additional contribution was sought when analyzing how the level of maturity in environmental sustainability of the countries influences the relation between the sustainability strategies and export performance. For the model s test, a data survey was conducted with managers of 143 exporting companies from the Brazilian agroindustry, through an online questionnaire and the Structural Equation Modeling (PLS-SEM) was used to estimate parameters. The empirical results corroborate some of the hypotheses presented, revealing the significance of the main relationship of the study (sustainability strategies and export performance) and distinguishes between the organizational factors and the external environment that most impact on the adoption of these strategies, besides to present the leadership engagement in the sustainability as the main internal factor of the adoption of this type of strategy, as well as the perceived pressure of foreign society and competition as the main external factors. However, the main theoretical contribution of the study is derived from the analysis of the moderation factor. The results show that the relationship between environmental sustainability strategies and export performance was more significant in the group of companies that export to countries with a greater maturity in the area of environmental sustainability, than in the group of companies that export to least mature countries in this theme.
|
114 |
[pt] MONITORAMENTO DE MORANGOS: DETECÇÃO, CLASSIFICAÇÃO E SERVOVISÃO / [en] STRAWBERRY MONITORING: DETECTION, CLASSIFICATION, AND VISUAL SERVOINGGABRIEL LINS TENORIO 27 August 2024 (has links)
[pt] O presente trabalho inicia com uma investigação sobre o uso de modelos
de Aprendizado Profundo 3D para a detecção aprimorada de morangos em
túneis de cultivo. Focou-se em duas tarefas principais: primeiramente, a
detecção de frutas, comparando o modelo original MaskRCNN com uma
versão adaptada que integra informações de profundidade (MaskRCNN-D).
Ambos os modelos são capazes de classificar morangos baseados em sua
maturidade (maduro, não maduro) e estado de saúde (afetados por doença
ou fungo). Em segundo lugar, focou-se em identificar a região mais ampla
dos morangos, cumprindo um requisito para um sistema de espectrômetro
capaz de medir o conteúdo de açúcar das frutas. Nesta tarefa, comparouse um algoritmo baseado em contorno com uma versão aprimorada do
modelo VGG-16. Os resultados demonstram que a integração de dados
de profundidade no MaskRCNN-D resulta em até 13.7 por cento de melhoria no
mAP através de diversos conjuntos de teste de morangos, incluindo os
simulados, enfatizando a eficácia do modelo em cenários agrícolas reais e
simulados. Além disso, nossa abordagem de solução ponta-a-ponta, que
combina a detecção de frutas (MaskRCNN-D) e os modelos de identificação
da região mais ampla (VGG-16 aprimorado), mostra um erro de localização
notavelmente baixo, alcançando até 11.3 pixels de RMSE em uma imagem
de morango cortada de 224 × 224. Finalmente, explorou-se o desafio de
aprimorar a qualidade das leituras de dados do espectrômetro através do
posicionamento automático do sensor. Para tal, projetou-se e treinou-se um
modelo de Aprendizado Profundo com dados simulados, capaz de prever
a acurácia do sensor com base em uma imagem dada de um morango e o
deslocamento desejado da posição do sensor. Usando este modelo, calcula-se
o gradiente da saída de acurácia em relação à entrada de deslocamento. Isso
resulta em um vetor indicando a direção e magnitude com que o sensor deve
ser movido para melhorar a acurácia do sinal do sensor. Propôs-se então
uma solução de Servo Visão baseada neste vetor, obtendo um aumento
significativo na acurácia média do sensor e melhoria na consistência em
novas iterações simuladas. / [en] The present work begins with an investigation into the use of 3D Deep
Learning models for enhanced strawberry detection in polytunnels. We
focus on two main tasks: firstly, fruit detection, comparing the standard
MaskRCNN with an adapted version that integrates depth information
(MaskRCNN-D). Both models are capable of classifying strawberries based
on their maturity (ripe, unripe) and health status (affected by disease or
fungus). Secondly, we focus on identifying the widest region of strawberries,
fulfilling a requirement for a spectrometer system capable of measuring
their sugar content. In this task, we compare a contour-based algorithm
with an enhanced version of the VGG-16 model. Our findings demonstrate
that integrating depth data into the MaskRCNN-D results in up to a
13.7 percent improvement in mAP across various strawberry test sets, including
simulated ones, emphasizing the model s effectiveness in both real-world
and simulated agricultural scenarios. Furthermore, our end-to-end pipeline
approach, which combines the fruit detection (MaskRCNN-D) and widest
region identification models (enhanced VGG-16), shows a remarkably low
localization error, achieving down to 11.3 pixels of RMSE in a 224 × 224
strawberry cropped image. Finally, we explore the challenge of enhancing
the quality of the data readings from the spectrometer through automatic
sensor positioning. To this end, we designed and trained a Deep Learning
model with simulated data, capable of predicting the sensor accuracy based
on a given image of the strawberry and the subsequent displacement of
the sensor s position. Using this model, we calculate the gradient of the
accuracy output with respect to the displacement input. This results in a
vector indicating the direction and magnitude with which the sensor should
be moved to improve the sensor signal accuracy. A Visual Servoing solution
based on this vector provided a significant increase in the average sensor
accuracy and improvement in consistency across new simulated iterations.
|
115 |
[en] A SOFTWARE ARCHITECTURE TO SUPPORT DEVELOPMENT OF MEDICAL IMAGING DIAGNOSTIC SYSTEMS / [pt] UMA ARQUITETURA DE SOFTWARE PARA APOIO AO DESENVOLVIMENTO DE SISTEMAS DE DIAGNÓSTICO MÉDICOS POR IMAGEMRICARDO ALMEIDA VENIERIS 02 August 2018 (has links)
[pt] O apoio diagnóstico de exames médicos por imagem utilizando técnicas de Inteligência Artificial tem sido amplamente discutido e pesquisado academicamente. Diversas técnicas computacionais para segmentação e classificação de tais imagens são continuamente criadas, testadas e aperfeiçoadas. Destes estudos emergem sistemas com alto grau de especialização que se utilizam de técnicas de visão computacional e aprendizagem de máquina para segmentar e classificar imagens de exames utilizando conhecimento adquirido através de grandes coleções de exames devidamente laudados. No domínio médico há ainda
a dificuldade de se conseguir bases de dados qualificada para realização da extração de conhecimento pelos sistemas de aprendizagem de máquina. Neste trabalho propomos a construção de uma arquitetura de software que suporte o desenvolvimento de sistemas de apoio diagnóstico que possibilite: (i) a utilização
em múltiplos tipos exames, (ii) que consiga segmentar e classificar, (iii) utilizando não só de estratégias padrão de aprendizado de máquina como, (iv) o conhecimento do domínio médico disponível. A motivação é facilitar a tarefa de geração de classificadores que possibilite, além de buscar marcadores patológicos
específicos, ser aplicado em objetivos diversos da atividade médica, como o diagnóstico pontual, triagem e priorização do atendimento. / [en] The image medical exam diagnostic support using Artificial Intelligence techniques has been extensively discussed and academically researched. Several computational techniques for segmentation and classification of such images are continuously created, tested and improved. From these studies, highly specialized systems that use computational vision and machine learning techniques to segment and classify exam images using knowledge acquired through large collections of lauded exams. In the medical domain, there is still the difficulty of obtaining qualified databases to support the extraction of knowledge by machine learning systems. In this work we propose a software architecture construction that supports diagnostic support systems development that allows: (i) use of multiple exam types, (ii) supporting segmentation and classification, (iii) using not only machine learning techniques as, (iv) knowledge of the available medical domain. The motivation is to facilitate the generation of classifiers task that, besides searching for specific pathological markers, can be applied to different medical activity objectives, such as punctual diagnosis, triage and prioritization of care.
|
116 |
[en] CULTIVATION OF VISION: FOLKLORE, LANDSCAPE AND ROMANTICISM IN JORGE PRELORÁN S WORK (1965-1975). / [pt] O CULTIVO DO OLHAR: FOLCLORE, PAISAGEM E ROMANTISMO NA OBRA DE JORGE PRELORÁN (1965-1975)ANA CAROLINE MATIAS ALENCAR 08 August 2023 (has links)
[pt] No ano de 1965, o cineasta Jorge Prelorán deu início a uma vasta série documental, intitulada Relevamiento Cinematográfico de Expresiones Folklóricas Argentinas, direcionada à pesquisa e ao registro audiovisual de regiões interioranas do país. O projeto, que contou com o patrocínio de instituições como a Universidad Nacional de Tucumán e o Fondo Nacional de las Artes, foi desenvolvido em meio a um pulsante contexto intelectual e artístico, marcado tanto pela emergência das mais diversas propostas de renovação da linguagem cinematográfica, como pelo amplo fenômeno conhecido como boom do movimento folclórico, ocorrido nos anos 1960, na Argentina. Nesse sentido, o objetivo desta tese foi o de investigar de que maneira Jorge Prelorán teria reelaborado, nas películas por ele realizadas para o Relevamiento (1965-1975), um conjunto de temas, tópicas, metodologias, recursos narrativos e procedimentos discursivos provenientes de três amplos domínios, com os quais o diretor manteve os mais estreitos contatos: a larga tradição de ensaios de interpretação da Argentina, dedicada, ao longo do tempo, à tarefa de figuração da nação; os campos do folclore e da antropologia vigorantes no país, em suas múltiplas vertentes; e as correntes do cinema etnográfico com as quais o diretor chegou a estabelecer longevos vínculos. Os diálogos travados entre a obra de Prelorán e as tradições intelectuais e artísticas mencionadas – diálogos esses que estiveram quase sempre pautados nas estratégias de descrição da natureza, nos diferentes modos de figuração do tempo e do espaço e nos modelos de representação da arte e da cultura manejados pelo documentarista – foram concebidos, ao longo da pesquisa, como variações em torno de quatro grandes temas: a cartografia, a viagem, o compêndio e a metodologia empática de filmagem. / [en] In 1965, the filmmaker Jorge Prelorán began to develop a vast documentary series, entitled Relevamiento Cinematográfico de Expresiones Folklóricas Argentinas, dedicated to the study and filming of inlands regions of the country. The project, which was sponsored by Universidad Nacional de Tucumán and Fondo Nacional de las Artes, took place in the midst of an intellectual and artistic context marked both by the emergence of diverse proposals for the renewal of cinematographic language, and by the cultural phenomenon known as boom of the folk movement, which occurred in the 1960s in Argentina. Therefore, the purpose of this thesis was to investigate how Jorge Prelorán reformulated, in the films he made for the project between 1965 and 1975, a set of themes, topics, methodologies, narrative resources and discursive procedures originated from three broad domains, with which the director maintained close contacts: the long tradition of Argentine essays, dedicated to the interpretation of the nation; the fields of folklore and anthropology prevailing in the country, in its multiple phases; and the modalities of ethnographic cinema with which the director related in those years. The dialogues that were established between Prelorán s work and the intellectual and artistic traditions mentioned previously – dialogues that were almost always based on the strategies of describing nature, on the different modes of representing time and space and on the models of depicting art and culture used by the filmaker – were conceived throughout this research as variations around four major themes: cartography, travel, compendium and empathic filming methodology.
|
117 |
[pt] EM BUSCA DA COR LOCAL: OS MODOS DE VER E FAZER VER NAS OBRAS DE JOSÉ DE ALENCAR E EUCLIDES DA CUNHA / [en] IN THE SEARCH OF THE LOCAL COLOR: THE WAYS OF SEEING AND MAKE SEE IN THE WORKS OF JOSÉ DE ALENCAR AND EUCLIDES DA CUNHAEDUARDO WRIGHT CARDOSO 04 November 2016 (has links)
[pt] Recurso pictórico elaborado no século XVIII, a cor local amplia seu
escopo original relativo ao campo pictórico e passa a compor e regular a produção
textual de escritores, historiadores, literatos e viajantes. Seu emprego em suportes
textuais desenvolve e acentua a dimensão visual da narrativa e, portanto, pode ser
concebido como uma expressão moderna das antigas associações entre cor e
palavra, narrativa e pintura. O objetivo desta tese é, pois, investigar o emprego
da cor local em tipos discursivos diversos, notadamente nas obras de José de
Alencar e Euclides da Cunha, salientando a dimensão visual implícita ao recurso
narrativo. A fim de compreender o investimento narrativo na visualidade, é válido
recuperar, a partir da Antiguidade, os modos de ver e fazer ver que comportam
topoi como o ut pictura poesis e o ut pictura historia, construções como a
sunopsis e a enargeia, além de expedientes como, entre outros, a autópsia e a
écfrase. A cor local, eis a hipótese inicial desta tese, incorpora e expressa parte
destes modos e recursos e, portanto, é capaz de reproduzir e reelaborar, na época
moderna, o anseio visual por meio da narrativa. A pesquisa pelos modos de ver e
fazer ver requer, como temáticas relacionadas que perpassam este estudo, a
consideração do estatuto e da importância atribuída à visão e ao olhar como
elementos cognitivos e comprobatórios, além das relações entre sujeito e objeto na
constituição do conhecimento. As produções ficcional de Alencar e factual de
Euclides permitem, então, demonstrar tanto a amplitude do recurso narrativo,
empregado em tipos discursivos diversos, quanto as variações relacionadas ao seu
uso, ou seja, como a delimitação de uma determinada paisagem altera o conteúdo
da forma da cor local. / [en] Pictorial device designed in the eighteenth century, the local color has
expanded its original scope for the pictorial field and begins to compose the
production of historians, writers and travelers. Its use in textual media develops
and enhances the visual dimension of the narrative and can be considered as a
modern expression of the ancient associations between color and word, narrative
and painting. The purpose of this thesis is to investigate the use of local color in
different discursive types, especially in the works of José de Alencar and Euclides
da Cunha, stressing the implicit visual dimension to the narrative device. In order
to understand the narrative investment in visuality it is worthed to recover from
antiquity the ways of seeing and make see that includes topoi as the ut pictura
poesis and ut pictura historia, resources like sunopsis and enargeia, and
expedients as, among others, the autopsia and ekphrasis. The initial hypothesis of
this thesis is that the local color expresses these modes and features and therefore
is able to reproduce and redevelop, in modern times, the visual desire through
narrative. The search for ways of seeing and make see requires, as related themes
that pervade this study, the consideration of the status and the importance
attributed to the vision as a cognitive element and proving, beyond the relations
between subject and object in the constitution of knowledge. The fictional
writings of Alencar and factual writings of Euclides allow then to demonstrate
both the extent of the narrative device, employed in various discursive types, as
the variations related to its use, that is how the delimitation of a particular
landscape changes the contents of the form of the local color.
|
118 |
[en] BOUNDING BOXES SELECTION IN OBJECT DETECTION ARCHITECTURES / [pt] SELEÇÃO DE RETÂNGULOS ENVOLVENTES EM ARQUITETURAS PARA DETECÇÃO DE OBJETOSCLAUDIO VIEIRA ESCUDERO 30 June 2021 (has links)
[pt] Esta dissertação estuda métodos e algoritmos para critérios de seleções dos retângulos envolventes focando em arquiteturas de detecção de objetos baseada redes neurais convolucionais para tempo real, que processam mais de 30fps, que também possibilitam a expansão para outras arquiteturas. O objetivo
desta dissertação é melhorar as métricas Recall e Precision, proporcionando mais assertividade nos resultados destas arquiteturas sem a necessidade de recriá-las ou retreiná-las, diminuindo, assim, os recursos para manutenções. As arquiteturas que trabalham em tempo real normalmente não apresentam
melhores resultados, pois são desenvolvidas visando a redução do tempo de execução. Para resolver estes problemas, serão testados outros métodos de critérios de seleção de retângulos envolventes em estado da arte, são eles: Nonmaximum Suppression (NMS), Soft-NMS, Non-Maximum Weighted (NMW)
e Weighted Boxes Fusion (WBF). Os resultados obtidos foram comparados aos originais das arquiteturas, utilizando as métricas mAP, Recall e Precision. Através desta comparação foi possível comprovar que os novos critérios apresentaram bons resultados. O tempo de execução dos novos critérios também
foi analisado com execuções de imagens em lotes, contornando alguns overheads dos critérios mais pesados. As arquiteturas utilizadas como base nos experimentos foram baseadas nos sistemas YOLOv3-Tiny e YOLOv4-Tiny, utilizando o dataset QMUL-OpenLogo público e especializado em logotipos e
baseado em fotos reais. / [en] This dissertation studies methods and algorithms for bounding box selection criteria focusing on object detection architectures based on convolutional neural networks for real-time, processing over 30fps, which also allow expansion to other architectures. The goal of this study is to improve the Recall and Precision metrics, providing more assertiveness in the results of these architectures without the need to recreate or retrain them, thus reducing the resources for maintenance. Architectures that work in real-time usually do not present good results, because they are developed aiming to reduce execution time. To solve these problems, other state-of-the-art bounding box selection criteria methods will be tested: Non-maximum Suppression (NMS), Soft-NMS, Non-Maximum Weighted (NMW) and Weighted Boxes Fusion (WBF). The
results obtained were compared to the original architectures, using the mAP, Recall and Precision metrics. Through this comparison it was possible to prove that the new criteria presented satisfactory results. The execution time of the new criteria was also analyzed with batch image executions, bypassing some
overheads of the heavier criteria. The architectures used as basis for the experiments were based on the YOLOv3-Tiny and YOLOv4-Tiny systems, using the public dataset QMUL-OpenLogo specialized in logos and based on real photos.
|
Page generated in 0.0473 seconds