1 |
[en] SEISMIC IMAGE SUPER RESOLUTION / [pt] SUPER RESOLUÇÃO DE IMAGENS SÍSMICASPEDRO FERREIRA ALVES PINTO 06 December 2022 (has links)
[pt] A super resolução (SR) é um tema de suma importância em domínios
de conhecimentos variados, como por exemplo a área médica, de monitoramento e de segurança. O uso de redes neurais profundas para a resolução
desta tarefa é algo extremamente recente no universo da sísmica, tendo poucas referências, as quais começaram a ser divulgadas há menos de 2 anos.
Todavia, a literatura apresenta uma vasta gama de métodos, que utilizam redes neurais para a super resolução de imagens naturais. Tendo isto em vista,
o objetivo deste trabalho é explorar tais abordagens aplicadas em dados sísmicos sintéticos de reservatórios. Para isto, foram empregados modelos de
importância cronológica na literatura e foram comparados com um método
clássico de interpolação e com os modelos da literatura de super resolução
de imagens sísmicas. São estes modelos: o SRCNN, o RDN, a abordagem do
Deep Image Prior e o SAN. Por fim, os resultados apresentam que o PSNR
obtido por arquiteturas de projetos no domínio da sísmica equivale a 38.23
e o melhor resultado das arquiteturas propostas 38.62, mostrando o avanço
que tais modelos trazem ao campo da sísmica. / [en] Super resolution (SR) is a topic of notable importance in domains of
assorted knowledge, such as the medical, monitoring, and security areas.
The use of deep neural networks to solve this task is something extremely
recent in the seismic field, with few references, which began to be published
less than 2 years ago. However, the literature presents a wide range of
methods, using neural networks for the super resolution of natural images.
With this in mind, the objective of this work is to explore such approaches
applied to synthetic seismic data from reservoirs. For this, models of
chronological importance in the literature were used and compared with
a classic interpolation method and with models of the literature of super
resolution of seismic images. These models are: SRCNN, RDN, the Deep
Image Prior approach and SAN. The results show that the PSNR obtained
by architectures developed for the seismic domain is equivalent to 38.23 and
the best result of the proposed architectures is 38.62, showing the progress
that such models bring to the seismic domain.
|
2 |
[en] ENHANCEMENT AND CONTINUOUS SPEECH RECOGNITION IN ADVERSE ENVIRONMENTS / [pt] REALCE E RECONHECIMENTO DE VOZ CONTÍNUA EM AMBIENTES ADVERSOSCHRISTIAN DAYAN ARCOS GORDILLO 13 June 2018 (has links)
[pt] Esta tese apresenta e examina contribuições inovadoras no front-end dos sistemas de reconhecimento automático de voz (RAV) para o realce e reconhecimento de voz em ambientes adversos. A primeira proposta consiste em aplicar um filtro de mediana sobre a função de distribuição de probabilidade de cada coeficiente cepstral antes de utilizar uma transformação para um domínio invariante às distorções, com o objetivo de adaptar a voz ruidosa ao ambiente limpo de referência através da modificação de histogramas. Fundamentadas nos resultados de estudos psicofísicos do sistema auditivo humano, que utiliza como princípio o fato de que o som que atinge o ouvido é sujeito a um processo chamado Análise de Cena Auditiva (ASA), o qual examina como o sistema auditivo separa as fontes de som que compõem a entrada acústica, três novas abordagens aplicadas independentemente foram propostas para realce e reconhecimento de voz. A primeira aplica a estimativa de uma nova máscara no domínio espectral usando o conceito da transformada de Fourier de tempo curto (STFT). A máscara proposta aplica a técnica Local Binary Pattern (LBP) à relação sinal ruído (SNR) de cada unidade de tempo-frequência (T-F) para estimar
uma máscara de vizinhança ideal (INM). Continuando com essa abordagem, propõe-se em seguida nesta tese o mascaramento usando as transformadas wavelet com base nos LBP para realçar os espectros temporais dos coeficientes wavelet nas altas frequências. Finalmente, é proposto um novo método de estimação da máscara INM, utilizando um algoritmo de aprendizagem supervisionado das Deep Neural Networks (DNN) com o objetivo de realizar a classificação de unidades T-F obtidas da saída dos bancos de
filtros pertencentes a uma mesma fonte de som (ou predominantemente voz ou predominantemente ruído). O desempenho é comparado com as técnicas de máscara tradicionais IBM e IRM, tanto em termos de qualidade objetiva da voz, como através de taxas de erro de palavra. Os resultados das técnicas
propostas evidenciam as melhoras obtidas em ambientes ruidosos, com diferenças significativamente superiores às abordagens convencionais. / [en] This thesis presents and examines innovative contributions in frontend of the automatic speech recognition systems (ASR) for enhancement and speech recognition in adverse environments. The first proposal applies
a median filter on the probability distribution function of each cepstral coefficient before using a transformation to a distortion-invariant domain, to adapt the corrupted voice to the clean reference environment by modifying histograms. Based on the results of psychophysical studies of the human
auditory system, which uses as a principle the fact that sound reaching the ear is subjected to a process called Auditory Scene Analysis (ASA), which examines how the auditory system separates the sound sources that make up the acoustic input, three new approaches independently applied were proposed for enhancement and speech recognition. The first applies the estimation of a new mask in the spectral domain using the short-time Fourier Transform (STFT) concept. The proposed mask applies the Local Binary Pattern (LBP) technique to the Signal-to-Noise Ratio (SNR) of each time-frequency unit (T-F) to estimate an Ideal Neighborhood Mask (INM). Continuing with this approach, the masking using LBP-based wavelet
transforms to highlight the temporal spectra of wavelet coefficients at high frequencies is proposed in this thesis. Finally, a new method of estimation of the INM mask is proposed, using a supervised learning algorithm of Deep Neural Network (DNN) to classify the T-F units obtained from the output of
the filter banks belonging to a same source of sound (or predominantly voice or predominantly noise). The performance is compared with traditional IBM and IRM mask techniques, both regarding objective voice quality and through word error rates. The results of the proposed methods show the improvements obtained in noisy environments, with differences significantly superior to the conventional approaches.
|
3 |
[pt] ENSAIOS EM MODELOS DE DOIS ESTÁGIOS EM SISTEMAS DE POTÊNCIAS: CONTRIBUIÇÕES EM MODELAGEM E APLICAÇÕES DO MÉTODO DE GERAÇÃO DE LINHAS E COLUNAS / [en] ESSAYS ON TWO-STAGE ROBUST MODELS FOR POWER SYSTEMS: MODELING CONTRIBUTIONS AND APPLICATIONS OF THE COLUMN-AND-CONSTRAINT-GENERATION ALGORITHMALEXANDRE VELLOSO PEREIRA RODRIGUES 07 December 2020 (has links)
[pt] Esta dissertação está estruturada como uma coleção de cinco artigos formatados em capítulos. Os quatro primeiros artigos apresentam contribuições em modelagem e metodológicas para problemas de operação
ou investimento em sistemas de potência usando arcabouço de otimização robusta adaptativa e modificações no algoritmo de geração de linhas e colunas (CCGA). O primeiro artigo aborda a programação de curto prazo com restrição de segurança, onde a resposta automática de geradores é considerada. Um modelo robusto de dois estágios é adotado, resultando em complexas instâncias de programação inteira mista, que apresentam variáveis binárias associadas às decisões de primeiro e segundo estágios.
Um novo CCGA que explora a estrutura do problema é desenvolvido. O segundo artigo usa redes neurais profundas para aprender o mapeamento das demandas nodais aos pontos de ajuste dos geradores para o problema do primeiro artigo. O CCGA é usados para garantir a viabilidade da solução. Este método resulta em importantes ganhos computacionais em relação ao primeiro artigo. O terceiro artigo propõe uma abordagem adaptativa em dois estágios para um modelo robusto de programação diária no qual o
conjunto de incerteza poliedral é caracterizado diretamente a partir dos dados de geração não despachável observados. O problema resultante é afeito ao CCGA. O quarto artigo propõe um modelo de dois estágios adaptativo, robusto em distribuição para expansão de transmissão, incorporando incertezas a longo e curto prazo. Um novo CCGA é desenvolvido para lidar com os subproblemas. Finalmente, sob uma perspectiva diferente e generalista, o quinto artigo investiga a adequação de prêmios de incentivo para promover inovações em aspectos teóricos e computacionais para os desafios de sistemas de potência modernos. / [en] This dissertation is structured as a collection of five papers formatted as chapters. The first four papers provide modeling and methodological contributions in scheduling or investment problems in power systems
using the adaptive robust optimization framework and modifications to the column-and-constraint-generation algorithm (CCGA). The first paper addresses the security-constrained short-term scheduling problem where automatic primary response is considered. A two-stage robust model is adopted, resulting in complex mixed-integer linear instances featuring binary variables associated with first- and second-stage decisions. A new tailored CCGA which explores the structure of the problem is devised. The second paper uses deep neural networks for learning the mapping of nodal demands onto generators set point for the first paper s model. Robust-based modeling approaches and the CCGA are used to enforce feasibility for the solution. This method results in important computational gains as compared to results of the first paper. The third paper proposes an adaptive data-driven approach for a two-stage robust unit commitment model, where the polyhedral uncertainty set is characterized directly from data, through the convex hull of a set of previously observed non-dispatchable generation profiles. The resulting problem is suitable for the exact CCGA. The fourth paper proposes an adaptive two-stage distributionally robust transmission
expansion model incorporating long- and short-term uncertainties. A novel extended CCGA is devised to tackle distributionally robust subproblems. Finally, under a different and higher-level perspective, the fifth paper investigates the adequacy of systematic inducement prizes for fostering innovations in theoretical and computational aspects for various modern power systems challenges.
|
Page generated in 0.0367 seconds