1 |
[en] ENHANCEMENT AND CONTINUOUS SPEECH RECOGNITION IN ADVERSE ENVIRONMENTS / [pt] REALCE E RECONHECIMENTO DE VOZ CONTÍNUA EM AMBIENTES ADVERSOSCHRISTIAN DAYAN ARCOS GORDILLO 13 June 2018 (has links)
[pt] Esta tese apresenta e examina contribuições inovadoras no front-end dos sistemas de reconhecimento automático de voz (RAV) para o realce e reconhecimento de voz em ambientes adversos. A primeira proposta consiste em aplicar um filtro de mediana sobre a função de distribuição de probabilidade de cada coeficiente cepstral antes de utilizar uma transformação para um domínio invariante às distorções, com o objetivo de adaptar a voz ruidosa ao ambiente limpo de referência através da modificação de histogramas. Fundamentadas nos resultados de estudos psicofísicos do sistema auditivo humano, que utiliza como princípio o fato de que o som que atinge o ouvido é sujeito a um processo chamado Análise de Cena Auditiva (ASA), o qual examina como o sistema auditivo separa as fontes de som que compõem a entrada acústica, três novas abordagens aplicadas independentemente foram propostas para realce e reconhecimento de voz. A primeira aplica a estimativa de uma nova máscara no domínio espectral usando o conceito da transformada de Fourier de tempo curto (STFT). A máscara proposta aplica a técnica Local Binary Pattern (LBP) à relação sinal ruído (SNR) de cada unidade de tempo-frequência (T-F) para estimar
uma máscara de vizinhança ideal (INM). Continuando com essa abordagem, propõe-se em seguida nesta tese o mascaramento usando as transformadas wavelet com base nos LBP para realçar os espectros temporais dos coeficientes wavelet nas altas frequências. Finalmente, é proposto um novo método de estimação da máscara INM, utilizando um algoritmo de aprendizagem supervisionado das Deep Neural Networks (DNN) com o objetivo de realizar a classificação de unidades T-F obtidas da saída dos bancos de
filtros pertencentes a uma mesma fonte de som (ou predominantemente voz ou predominantemente ruído). O desempenho é comparado com as técnicas de máscara tradicionais IBM e IRM, tanto em termos de qualidade objetiva da voz, como através de taxas de erro de palavra. Os resultados das técnicas
propostas evidenciam as melhoras obtidas em ambientes ruidosos, com diferenças significativamente superiores às abordagens convencionais. / [en] This thesis presents and examines innovative contributions in frontend of the automatic speech recognition systems (ASR) for enhancement and speech recognition in adverse environments. The first proposal applies
a median filter on the probability distribution function of each cepstral coefficient before using a transformation to a distortion-invariant domain, to adapt the corrupted voice to the clean reference environment by modifying histograms. Based on the results of psychophysical studies of the human
auditory system, which uses as a principle the fact that sound reaching the ear is subjected to a process called Auditory Scene Analysis (ASA), which examines how the auditory system separates the sound sources that make up the acoustic input, three new approaches independently applied were proposed for enhancement and speech recognition. The first applies the estimation of a new mask in the spectral domain using the short-time Fourier Transform (STFT) concept. The proposed mask applies the Local Binary Pattern (LBP) technique to the Signal-to-Noise Ratio (SNR) of each time-frequency unit (T-F) to estimate an Ideal Neighborhood Mask (INM). Continuing with this approach, the masking using LBP-based wavelet
transforms to highlight the temporal spectra of wavelet coefficients at high frequencies is proposed in this thesis. Finally, a new method of estimation of the INM mask is proposed, using a supervised learning algorithm of Deep Neural Network (DNN) to classify the T-F units obtained from the output of
the filter banks belonging to a same source of sound (or predominantly voice or predominantly noise). The performance is compared with traditional IBM and IRM mask techniques, both regarding objective voice quality and through word error rates. The results of the proposed methods show the improvements obtained in noisy environments, with differences significantly superior to the conventional approaches.
|
2 |
[en] METALLIC NANOSTRUCTURE FABRICATION BY AFM LITHOGRAPHY / [pt] FABRICAÇÃO DE NANOESTRUTURAS CONDUTORAS POR AFMHENRIQUE DUARTE DA FONSECA FILHO 14 March 2005 (has links)
[pt] Nesta dissertação de mestrado, nós desenvolvemos um
processo de
litografia baseado na técnica de microscopia de força
atômica. O estudo do
processo de litografia aqui utilizado inicia-se com a
deposição e caracterização de
filmes finos de sulfeto de arsênio amorfo (a-As2S3) em
substratos de silício e a
deposição de uma camada metálica de alumínio, utilizada
como máscara, sobre a
superfície do a-As2S3. O microscópio de força atômica é
utilizado para escrever os
padrões de forma controlada na camada metálica, e para
tal, a influencia dos
parâmetros de controle do microscópio na realização da
litografia foi analisada.
Para a transferência do padrão litografado realiza-se um
posterior processo de
fotossensibilização e dissolução química do a-As2S3 com
uma solução de K2CO3.
Após a dissolução, uma camada de ouro foi depositada por
erosão catódica DC,
seguido de uma nova dissolução, desta vez com NaOH
resultando na transferência
de nanoestruturas de Au para o substrato de silício. / [en] In this dissertation, we have developed a lithography
process based on the
atomic force microscopy of technique. The study of the
lithography process starts
with the deposition and characterization of amorphous
arsenic sulfide thin films
(a-As2S3) in silicon substrates and the deposition of a
metallic aluminum layer,
used as mask, on the surface of the a-As2S3. An atomic
force microscope was used
to write patterns in a controlled way on the metallic
layer. Therefore, the influence
of microscope feedback system on the accomplishment of the
lithography was
analyzed. In order to transfer the lithographed pattern to
a silicon substrate, the a-
As2S3 was exposed to a UV light source and was dissolved
with a K2CO3 solution.
Then, a thin gold layer was deposited by sputtering DC,
and a new dissolution,
now with NaOH was performed, leading to the deposition of
Au nanostructures
onto the silicon substrate.
|
3 |
[en] DESIGN FOR ADDITIVE MANUFACTURING: DEVELOPMENT OF PPE FOR HEALTH EMERGENCIES / [pt] DESIGN PARA MANUFATURA ADITIVA: DESENVOLVIMENTO DE EPI PARA EMERGÊNCIAS DE SAÚDEROBERTO TAKAO YAMAKI 17 February 2025 (has links)
[pt] A pandemia de COVID-19 resultou em uma crise global de saúde pública
nunca antes observada, impactando praticamente todos os aspectos da vida
humana e catalisando a pesquisa em equipamentos de proteção individual (EPI).
Com a falta desses equipamentos para os profissionais que atuaram na linha de
frente, diversas iniciativas de fabricação local de EPI foram observadas utilizando
manufatura aditiva como forma de amortizar a falta desses insumos tão valiosos.
Este trabalho apresenta a contextualização da pandemia, com seus impactos não
somente na população geral, mas principalmente no trabalho dos profissionais de
saúde no Rio de Janeiro. Demonstra também as estratégias observadas em
diversos locais do mundo para mitigar a falta de EPI, causada pela alta demanda e
pelos interrompimentos nas cadeias de abastecimento. O trabalho apresenta as
ferramentas e metodologias utilizadas na pesquisa e desenvolvimento de três
EPIs, projetados utilizando a metodologia de pesquisa RtD para avaliar e
documentar cada etapa e a manufatura aditiva como ferramenta fundamental para
sua produção. A partir de diferentes tecnologias de impressão 3D, a pesquisa
gerou inúmeros protótipos, que serviram para iterar o design dos três produtos:
um face shield com tecnologia embarcada, voltado ao trabalho dos Agentes
Comunitários de Saúde e duas máscaras de proteção respiratória que utilizam o
tecido da máscara cirúrgica como mídia filtrante, além de ensaiar fabricação de
filtros para máscaras utilizando uma máquina construída com ferramentas comuns
e acessíveis. A tese detalha cada decisão projetual tomada ao longo do trabalho e
reflete sobre a possibilidade de futuras pesquisas e aplicações da manufatura
aditiva na área da saúde, no sentido de inovação e de fabricação não centralizada. / [en] The COVID-19 pandemic resulted in an unprecedented global public
health crisis, impacting virtually all aspects of human life and catalyzing research
on personal protective equipment (PPE). Due to the shortage of PPE for frontline
workers, various local manufacturing initiatives emerged, using additive
manufacturing as a way to mitigate the lack of these essential supplies. This work
presents the contextualization of the pandemic, highlighting its impact not only on
the general population but especially on the work of healthcare professionals in
Rio de Janeiro. It also demonstrates strategies observed worldwide to address the
PPE shortage caused by high demand and disruptions in supply chains. The work
presents the tools and methodologies used in the research and development of
three PPEs, using the Research through Design (RtD) methodology to evaluate
and document each step, with additive manufacturing as a fundamental tool for
their production. Using different 3D printing technologies, the research generated
numerous prototypes, which served to iterate the design of the three products: a
face shield with embedded technology aimed at Community Health Workers, and
two respiratory protection masks that use surgical mask fabric as a filtering
medium. The thesis details each design decision made throughout the work and
reflects on the potential for future research and applications of additive
manufacturing in the healthcare field, in terms of innovation and decentralized
production. As an outcome, this work presents the beginning of research on the
manufacturing of mask filters, using a machine built with common and accessible
tools.
|
Page generated in 0.0447 seconds