Spelling suggestions: "subject:"anotaciones"" "subject:"anotacions""
1 |
[pt] ESTRATÉGIAS PARA OTIMIZAR PROCESSOS DE ANOTAÇÃO E GERAÇÃO DE DATASETS DE SEGMENTAÇÃO SEMÂNTICA EM IMAGENS DE MAMOGRAFIA / [en] STRATEGIES TO OPTIMIZE ANNOTATION PROCESSES AND GENERATION OF SEMANTIC SEGMENTATION DATASETS IN MAMMOGRAPHY IMAGESBRUNO YUSUKE KITABAYASHI 17 November 2022 (has links)
[pt] Com o avanço recente do uso de aprendizagem profunda supervisionada
(supervised deep learning) em aplicações no ramo da visão computacional, a
indústria e a comunidade acadêmica vêm evidenciando que uma das principais
dificuldades para o sucesso destas aplicações é a falta de datasets com a
suficiente quantidade de dados anotados. Nesse sentido aponta-se a necessidade
de alavancar grandes quantidades de dados rotulados para que estes modelos
inteligentes possam solucionar problemas pertinentes ao seu contexto para
atingir os resultados desejados. O uso de técnicas para gerar dados anotados
de maneira mais eficiente está sendo cada vez mais explorado, juntamente com
técnicas para o apoio à geração dos datasets que servem de insumos para o
treinamento dos modelos de inteligência artificial. Este trabalho tem como
propósito propor estratégias para otimizar processos de anotação e geração
de datasets de segmentação semântica. Dentre as abordagens utilizadas neste
trabalho destacamos o Interactive Segmentation e Active Learning. A primeira,
tenta melhorar o processo de anotação de dados, tornando-o mais eficiente e
eficaz do ponto de vista do anotador ou especialista responsável pela rotulagem
dos dados com uso de um modelo de segmentação semântica que tenta imitar
as anotações feitas pelo anotador. A segunda, consiste em uma abordagem que
permite consolidar um modelo deep learning utilizando um critério inteligente,
visando a seleção de dados não anotados mais informativos para o treinamento
do modelo a partir de uma função de aquisição que se baseia na estimação de
incerteza da rede para realizar a filtragem desses dados. Para aplicar e validar
os resultados de ambas as técnicas, o trabalho os incorpora em um caso de
uso relacionado em imagens de mamografia para segmentação de estruturas
anatômicas. / [en] With the recent advancement of the use of supervised deep learning in
applications in the field of computer vision, the industry and the academic
community have been showing that one of the main difficulties for the success
of these applications is the lack of datasets with a sufficient amount of
annotated data. In this sense, there is a need to leverage large amounts of
labeled data so that these intelligent models can solve problems relevant to
their context to achieve the desired results. The use of techniques to generate
annotated data more efficiently is being increasingly explored, together with
techniques to support the generation of datasets that serve as inputs for the
training of artificial intelligence models. This work aims to propose strategies
to optimize annotation processes and generation of semantic segmentation
datasets. Among the approaches used in this work, we highlight Interactive
Segmentation and Active Learning. The first one tries to improve the data
annotation process, making it more efficient and effective from the point of
view of the annotator or specialist responsible for labeling the data using a
semantic segmentation model that tries to imitate the annotations made by
the annotator. The second consists of an approach that allows consolidating
a deep learning model using an intelligent criterion, aiming at the selection of
more informative unannotated data for training the model from an acquisition
function that is based on the uncertainty estimation of the network to filter
these data. To apply and validate the results of both techniques, the work
incorporates them in a use case in mammography images for segmentation of
anatomical structures.
|
2 |
[en] ENABLING AUTONOMOUS DATA ANNOTATION: A HUMAN-IN-THE-LOOP REINFORCEMENT LEARNING APPROACH / [pt] HABILITANDO ANOTAÇÕES DE DADOS AUTÔNOMOS: UMA ABORDAGEM DE APRENDIZADO POR REFORÇO COM HUMANO NO LOOPLEONARDO CARDIA DA CRUZ 10 November 2022 (has links)
[pt] As técnicas de aprendizado profundo têm mostrado contribuições significativas em vários campos, incluindo a análise de imagens. A grande maioria
dos trabalhos em visão computacional concentra-se em propor e aplicar
novos modelos e algoritmos de aprendizado de máquina. Para tarefas de
aprendizado supervisionado, o desempenho dessas técnicas depende de uma
grande quantidade de dados de treinamento, bem como de dados rotulados. No entanto, a rotulagem é um processo caro e demorado. Uma recente
área de exploração são as reduções dos esforços na preparação de dados,
deixando-os sem inconsistências, ruídos, para que os modelos atuais possam obter um maior desempenho. Esse novo campo de estudo é chamado
de Data-Centric IA. Apresentamos uma nova abordagem baseada em Deep
Reinforcement Learning (DRL), cujo trabalho é voltado para a preparação
de um conjunto de dados em problemas de detecção de objetos, onde as anotações de caixas delimitadoras são feitas de modo autônomo e econômico.
Nossa abordagem consiste na criação de uma metodologia para treinamento
de um agente virtual a fim de rotular automaticamente os dados, a partir do
auxílio humano como professor desse agente. Implementamos o algoritmo
Deep Q-Network para criar o agente virtual e desenvolvemos uma abordagem de aconselhamento para facilitar a comunicação do humano professor
com o agente virtual estudante. Para completar nossa implementação, utilizamos o método de aprendizado ativo para selecionar casos onde o agente
possui uma maior incerteza, necessitando da intervenção humana no processo de anotação durante o treinamento. Nossa abordagem foi avaliada
e comparada com outros métodos de aprendizado por reforço e interação
humano-computador, em diversos conjuntos de dados, onde o agente virtual precisou criar novas anotações na forma de caixas delimitadoras. Os
resultados mostram que o emprego da nossa metodologia impacta positivamente para obtenção de novas anotações a partir de um conjunto de dados
com rótulos escassos, superando métodos existentes. Desse modo, apresentamos a contribuição no campo de Data-Centric IA, com o desenvolvimento
de uma metodologia de ensino para criação de uma abordagem autônoma
com aconselhamento humano para criar anotações econômicas a partir de
anotações escassas. / [en] Deep learning techniques have shown significant contributions in various
fields, including image analysis. The vast majority of work in computer
vision focuses on proposing and applying new machine learning models
and algorithms. For supervised learning tasks, the performance of these
techniques depends on a large amount of training data and labeled data.
However, labeling is an expensive and time-consuming process.
A recent area of exploration is the reduction of efforts in data preparation,
leaving it without inconsistencies and noise so that current models can
obtain greater performance. This new field of study is called Data-Centric
AI. We present a new approach based on Deep Reinforcement Learning
(DRL), whose work is focused on preparing a dataset, in object detection
problems where the bounding box annotations are done autonomously and
economically. Our approach consists of creating a methodology for training
a virtual agent in order to automatically label the data, using human
assistance as a teacher of this agent.
We implemented the Deep Q-Network algorithm to create the virtual agent
and developed a counseling approach to facilitate the communication of the
human teacher with the virtual agent student. We used the active learning
method to select cases where the agent has more significant uncertainty,
requiring human intervention in the annotation process during training to
complete our implementation. Our approach was evaluated and compared
with other reinforcement learning methods and human-computer interaction
in different datasets, where the virtual agent had to create new annotations
in the form of bounding boxes. The results show that the use of our
methodology has a positive impact on obtaining new annotations from
a dataset with scarce labels, surpassing existing methods. In this way,
we present the contribution in the field of Data-Centric AI, with the
development of a teaching methodology to create an autonomous approach
with human advice to create economic annotations from scarce annotations.
|
Page generated in 0.0363 seconds