1 |
[pt] ENGENHARIA DE RECURSOS PARA LIDAR COM DADOS RUIDOSOS NA IDENTIFICAÇÃO ESPARSA SOB AS PERSPECTIVAS DE CLASSIFICAÇÃO E REGRESSÃO / [en] FEATURE ENGINEERING TO DEAL WITH NOISY DATA IN SPARSE IDENTIFICATION THROUGH CLASSIFICATION AND REGRESSION PERSPECTIVESTHAYNA DA SILVA FRANCA 15 July 2021 (has links)
[pt] Os sistemas dinâmicos desempenham um papel crucial no que diz respeito
à compreensão de fenômenos inerentes a diversos campos da ciência.
Desde a última década, todo aporte tecnológico alcançado ao longo de anos de
investigação deram origem a uma estratégia orientada a dados, permitindo a
inferência de modelos capazes de representar sistemas dinâmicos. Além disso,
independentemente dos tipos de sensores adotados a fim de realizar o procedimento
de aquisição de dados, é natural verificar a existência de uma certa
corrupção ruidosa nos referidos dados. Genericamente, a tarefa de identificação
é diretamente afetada pelo cenário ruidoso previamente descrito, implicando na
falsa descoberta de um modelo generalizável. Em outras palavras, a corrupção
ao ruído pode ser responsável pela geração de uma representação matemática
infiel de um determinado sistema. Nesta tese, no que diz respeito à tarefa
de identificação, é demonstrado como a robustez ao ruído pode ser melhorada
a partir da hibridização de técnicas de aprendizado de máquina, como
aumento de dados, regressão esparsa, seleção de características, extração de
características, critério de informação, pesquisa em grade e validação cruzada.
Especificamente, sob as perspectivas de classificação e regressão, o sucesso da
estratégia proposta é apresentado a partir de exemplos numéricos, como o
crescimento logístico, oscilador Duffing, modelo FitzHugh-Nagumo, atrator de
Lorenz e uma modelagem Suscetível-Infeccioso-Recuperado (SIR) do Severe
Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2). / [en] The dynamical systems play a fundamental role related to the understanding
of the phenomena inherent to several fields of science. Since the last
decade, all technological advances achieved throughout years of research have
given rise to a data oriented strategy, enabling the inference of dynamical
systems. Moreover, regardless the sensor types adopted to perform the data
acquisition procedure, it is natural to verify the existence of a certain noise
corruption in such data. Generically, the identification task is directly affected
by the noisy scenario previously described, which entails in the false discovery
of a generalizable model. In other words, the noise corruption might be
responsible to give rise to a worthless mathematical representation of a given
system. In this thesis, with respect to the identification assignment, it is demonstrated
how the robustness to noise may be improved from the hybridization
of machine learning techniques, such as data augmentation, sparse regression,
feature selection, feature extraction, information criteria, grid search and cross
validation. Specifically, through classification and regression perspectives, the
success of the proposed strategy is presented from numerical examples, such
as the logistic growth, Duffing oscillator, FitzHugh–Nagumo model, Lorenz attractor
and a Susceptible-Infectious-Recovered (SIR) modeling of Severe Acute
Respiratory Syndrome Coronavirus 2 (SARS-CoV-2).
|
Page generated in 0.0466 seconds