1 |
[pt] DETECTOR DE ASSINATURAS DE GÁS EM LEVANTAMENTOS SÍSMICOS UTILIZANDO LSTM / [en] DIRECT HYDROCARBON INDICATORS BASED ON LSTMLUIZ FERNANDO TRINDADE SANTOS 02 April 2020 (has links)
[pt] Detectar reservatórios de hidrocarbonetos a partir de um levantamento sísmico é uma tarefa complexa, que requer profissionais especializados e muito tempo
de trabalho. Por isso, atualmente, existem muitas pesquisas que buscam automatizar
essa tarefa utilizando redes neurais profundas. Seguindo o sucesso das redes convolucionais profundas, CNNs, na identificação de objetos em imagens e vídeos, as
CNNs tem sido utilizadas como detectores de eventos geológicos nas imagens sísmica. O treinamento de uma rede neural profunda atual, entretanto, requer centenas
de milhares de dados rotulados. Se tratarmos os dados sísmicos como imagens, os
reservatórios de hidrocarbonetos geralmente constituem uma pequena sub imagem
incapaz de fornecer tantas amostras. A metodologia proposta nesta dissertação trata
o dado sísmico como um conjunto de traços e a amostra que alimenta a rede neural
são trechos de um sinal unidimensional parecido com um sinal de som ou voz. Com
essa entrada uma marcação de um reservatório numa sísmica geralmente já fornece
o número necessário de amostras rotuladas para o treinamento. Um outro aspecto
importante da nossa proposta é a utilização de uma rede neural recorrente. A influencia de um reservatório de hidrocarboneto num traço sísmico se dá não somente
no local onde ele se encontra, mas em todo o traço que se segue. Por isso propomos
a utilização de uma rede do tipo longa memória de curto prazo (Long Short-Term
Memory, LSTM) para caracterizar regiões que apresentem assinaturas de gás em
imagens sísmicas. Esta dissertação detalha ainda a implementação da metodologia proposta e os testes feitos nos dados sísmicos públicos Netherlands F3-Block.
Os resultados alcançados avaliados pelos índices de sensibilidade, especificidade,
acurácia e AUC foram todos excelentes, acima de 95 por cento. / [en] Detecting hydrocarbon reservoirs from a seismic survey is a complex task,
requiring specialized professionals and long time. Consequently, many authors
today seek to automate this task by using deep neural networks. Following the
success of deep convolutional networks, CNNs, in the identification of objects
in images and videos, CNNs have been used as detectors of geological events
in seismic images. Training a deep neural network, however, requires hundreds
of thousands of labeled data, that is, samples that we know the response that
the network must provide. If we treat seismic data as images, the hydrocarbon
reservoirs usually constitute a small sub-image unable to provide so many samples.
The methodology proposed in this dissertation treats the seismic data as a set
of traces and the sample that feeds the neural network are fragments of a onedimensional signal resembling a sound or voice signal. A labeled reservoir seismic
image usually provides the required number of labeled one-dimensional samples for
training. Another important aspect of our proposal is the use of a recurrent neural
network. The influence of a hydrocarbon reservoir on a seismic trace occurs not only
in its location but throughout the trace that follows. For this reason, we propose
the use of a Long Short-Term Memory, LSTM, network to characterize regions
that present gas signatures in seismic images. This dissertation further details the
implementation of the proposed methodology and test results on the Netherlands
F3-Block public seismic data. The results on this data set, evaluated by sensitivity,
specificity, accuracy and AUC indexes, are all excellent, above 95 percent.
|
2 |
[en] ESTIMATING THE LITHIUM-ION BATTERY STATE OF HEALTH: A RECURRENT NEURAL NETWORK APPROACH / [pt] ESTIMATIVA DE CURVA DE ESTADO DE SAÚDE DE BATERIAS DE ÍON-LÍTIO: UMA ABORDAGEM USANDO REDES NEURAIS RECORRENTESRAFAEL SAADI DANTAS TEIXEIRA 10 June 2021 (has links)
[pt] Por conta dos rápidos avanços tecnológicos, percebe-se uma mudança nos hábitos e das necessidades das pessoas. Há uma dependência cada vez maior de aparelhos eletrônicos como smartphones, notebooks etc. Construir baterias com grande capacidade energética é um dos desafios atuais para aumentar a autonomia dos aparelhos eletrônicos. Entretanto, uma alternativa que pode ajudar a manter aparelhos eletrônicos por mais tempo longe das tomadas é o compartilhamento de baterias. Existem na literatura muitos estudos envolvendo o compartilhamento de baterias no contexto de veículos elétricos, porém não são encontradas aplicações em smartphones. Um parâmetro importante a ser monitorado neste contexto é o estado de saúde (SoH). Até o momento, não há um consenso na literatura acerca do melhor modelo para estimar o SoH de baterias devido à falta de métodos bem estabelecidos. Assim, o objetivo geral desta dissertação foi construir um modelo para estimar a curva de estado de saúde, por meio do estado de carga, com vistas a estimar a saúde de baterias de íon-lítio. O modelo proposto foi baseado em redes neurais recorrentes. Para treinar e validar o modelo, foi construído um sistema para a realização de ensaios destrutivos, sendo possível estudar o comportamento de baterias de íon-lítio ao longo de toda vida útil. O modelo proposto foi capaz de estimar o SoH das baterias estudadas com boa exatidão, sob diferentes parâmetros de carga/descarga. O diferencial do modelo são baixa complexidade computacional, mesmo envolvendo modelos de redes neurais, e serem adotados parâmetros de entrada de fácil medição. / [en] Because of the fast technological advances, there is a change in people s habits and needs. There is an increasing dependence on electronic devices such as smartphones, notebooks etc. Building batteries with great energy capacity is one of the current challenges to increase the autonomy of electronic devices. However, an alternative that can help keep electronic devices longer away from sockets is battery swap. There are many studies in the literature involving the sharing of batteries in the context of electric vehicles, but no applications are found in smartphones. An important parameter to be monitored in this context is state of health (SoH). To date, there is no consensus in the literature about the best model for estimating battery SoH due to the lack of well-established methods. Thus, the objective of this dissertation is to build a model to estimate the state of health curve, with a view to classifying the health of lithium-ion batteries, through state of charge curve, for applications involving battery swap aiming to use in smartphones. The proposed model was based on recurrent neural networks. To train and validate the model, a system was built to perform destructive tests, being possible to study the behavior of lithium-ion batteries throughout its useful life. The proposed model was able to estimate the SoH of the batteries studied with good precision, under different charge / discharge parameters. The distinction of the model is low computational complexity, even involving neural network models, and easy-to-measure input parameters are adopted.
|
3 |
[en] A DEPENDENCY TREE ARC FILTER / [pt] UM FILTRO PARA ARCOS EM ÁRVORES DE DEPENDÊNCIARENATO SAYAO CRYSTALLINO DA ROCHA 13 December 2018 (has links)
[pt] A tarefa de Processamento de Linguagem Natural consiste em analisar linguagens naturais de forma computacional, facilitando o desenvolvimento de programas capazes de utilizar dados falados ou escritos. Uma das tarefas mais importantes deste campo é a Análise de Dependência. Tal tarefa consiste em analisar a estrutura gramatical de frases visando extrair aprender dados sobre suas relações de dependência. Em uma sentença, essas relações se apresentam em formato de árvore, onde todas as palavras
são interdependentes. Devido ao seu uso em uma grande variedade de aplicações como Tradução Automática e Identificação de Papéis Semânticos, diversas pesquisas com diferentes abordagens são feitas nessa área visando melhorar a acurácia das árvores previstas. Uma das abordagens em questão
consiste em encarar o problema como uma tarefa de classificação de tokens e dividi-la em três classificadores diferentes, um para cada sub-tarefa, e depois juntar seus resultados de forma incremental. As sub-tarefas consistem em classificar, para cada par de palavras que possuam relação paidependente,
a classe gramatical do pai, a posição relativa entre os dois e a distância relativa entre as palavras. Porém, observando pesquisas anteriores nessa abordagem, notamos que o gargalo está na terceira sub-tarefa, a
predição da distância entre os tokens. Redes Neurais Recorrentes são modelos que nos permitem trabalhar utilizando sequências de vetores, tornando viáveis problemas de classificação onde tanto a entrada quanto a saída do problema são sequenciais, fazendo delas uma escolha natural para o problema. Esse trabalho utiliza-se de Redes Neurais Recorrentes, em específico Long Short-Term Memory, para realizar a tarefa de predição da distância entre palavras que possuam relações de dependência como um problema de classificação sequence-to-sequence. Para sua avaliação empírica, este trabalho segue a linha de pesquisas anteriores e utiliza os dados do corpus em português disponibilizado pela Conference on Computational Natural Language Learning 2006 Shared Task. O modelo resultante alcança 95.27 por cento de precisão, resultado que é melhor do que o obtido por pesquisas feitas anteriormente para o modelo incremental. / [en] The Natural Language Processing task consists of analyzing the grammatical structure of a sentence written in natural language aiming to learn, identify and extract information related to its dependency structure. This data can be structured like a tree, since every word in a sentence has a head-dependent relation to another word from the same sentence. Since Dependency Parsing is used in many applications like Machine Translation, Semantic Role Labeling and Part-Of-Speech Tagging, researchers aiming to improve the accuracy on their models are approaching this task in many different ways. One of the approaches consists in looking at this task as a token classification problem, using different classifiers for each sub-task and joining them in an incremental way. These sub-tasks consist in classifying, for each head-dependent pair, the Part-Of-Speech tag of the head, the relative position between the two words and the distance
between them. However, previous researches using this approach show that the bottleneck lies in the distance classifier. Recurrent Neural Networks are a kind of Neural Network that allows us to work using sequences of vectors, allowing for classification problems where both our input and output are sequences, making them a great choice for the problem at hand. This work studies the use of Recurrent Neural Networks, in specific Long Short-Term Memory networks, for the head-dependent distance classifier sub-task as a sequence-to-sequence classification problem. To evaluate its efficiency, this work follows the line of previous researches and makes use of the Portuguese corpus of the Conference on Computational Natural Language Learning 2006 Shared Task. The resulting model attains 95.27 percent precision, which is better than the previous results obtained using incremental models.
|
4 |
[en] EXTRACTING AND CONNECTING PLAINTIFF S LEGAL CLAIMS AND JUDICIAL PROVISIONS FROM BRAZILIAN COURT DECISIONS / [pt] EXTRAÇÃO E CONEXÃO ENTRE PEDIDOS E DECISÕES JUDICIAIS DE UM TRIBUNAL BRASILEIROWILLIAM PAULO DUCCA FERNANDES 03 November 2020 (has links)
[pt] Neste trabalho, propomos uma metodologia para anotar decisões judiciais,
criar modelos de Deep Learning para extração de informação, e visualizar
de forma agregada a informação extraída das decisões. Instanciamos a
metodologia em dois sistemas. O primeiro extrai modificações de um tribunal
de segunda instância, que consiste em um conjunto de categorias legais
que são comumente modificadas pelos tribunais de segunda instância. O
segundo (i) extrai as causas que motivaram uma pessoa a propor uma ação
judicial (causa de pedir), os pedidos do autor e os provimentos judiciais dessas
ações proferidas pela primeira e segunda instância de um tribunal, e (ii)
conecta os pedidos com os provimentos judiciais correspondentes. O sistema
apresenta seus resultados através de visualizações. Extração de Informação
para textos legais tem sido abordada usando diferentes técnicas e idiomas.
Nossas propostas diferem dos trabalhos anteriores, pois nossos corpora são
compostos por decisões de primeira e segunda instância de um tribunal brasileiro.
Para extrair as informações, usamos uma abordagem tradicional de
Aprendizado de Máquina e outra usando Deep Learning, tanto individualmente
quanto como uma solução combinada. Para treinar e avaliar os sistemas,
construímos quatro corpora: Kauane Junior para o primeiro sistema,
e Kauane Insurance Report, Kauane Insurance Lower e Kauane Insurance
Upper para o segundo. Usamos dados públicos disponibilizados pelo Tribunal
de Justiça do Estado do Rio de Janeiro para construir os corpora. Para
o Kauane Junior, o melhor modelo (Fbeta=1 de 94.79 por cento) foi uma rede neural bidirecional Long Short-Term Memory combinada com Conditional Random
Fields (BILSTM-CRF); para o Kauane Insurance Report, o melhor (Fbeta=1
de 67,15 por cento) foi uma rede neural bidirecional Long Short-Term Memory com
embeddings de caracteres concatenados a embeddings de palavras combinada
com Conditional Random Fields (BILSTM-CE-CRF). Para o Kauane
Insurance Lower, o melhor (Fbeta=1 de 89,12 por cento) foi uma BILSTM-CE-CRF;
para o Kauane Insurance Upper, uma BILSTM-CRF (Fbeta=1 de 83,66 por cento). / [en] In this work, we propose a methodology to annotate Court decisions,
create Deep Learning models to extract information, and visualize the aggregated
information extracted from the decisions. We instantiate our methodology
in two systems we have developed. The first one extracts Appellate
Court modifications, a set of legal categories that are commonly modified
by Appellate Courts. The second one (i) extracts plaintiff s legal claims and
each specific provision on legal opinions enacted by lower and Appellate
Courts, and (ii) connects each legal claim with the corresponding judicial
provision. The system presents the results through visualizations. Information
Extraction for legal texts has been previously addressed using different
techniques and languages. Our proposals differ from previous work, since
our corpora are composed of Brazilian lower and Appellate Court decisions.
To automatically extract that information, we use a traditional Machine
Learning approach and a Deep Learning approach, both as alternative solutions
and also as a combined solution. In order to train and evaluate the
systems, we have built Kauane Junior corpus for the first system, and three
corpora for the second system – Kauane Insurance Report, Kauane Insurance
Lower, and Kauane Insurance Upper. We used public data disclosed by
the State Court of Rio de Janeiro to build the corpora. For Kauane Junior,
the best model, which is a Bidirectional Long Short-Term Memory network
combined with Conditional Random Fields (BILSTM-CRF), obtained an
(F)beta=1 score of 94.79 percent. For Kauane Insurance Report, the best model, which is a Bidirectional Long Short-Term Memory network with character embeddings
concatenated to word embeddings combined with Conditional Random
Fields (BILSTM-CE-CRF), obtained an (F)beta=1 score of 67.15 percent. For
Kauane Insurance Lower, the best model, which is a BILSTM-CE-CRF,
obtained an (F)beta=1 score of 89.12 percent. For Kauane Insurance Upper, the best
model, which is a BILSTM-CRF, obtained an (F)beta=1 score of 83.66 percent.
|
Page generated in 0.0356 seconds