Spelling suggestions: "subject:"regressão robust"" "subject:"egressão robust""
1 |
Métodos de regressão robusta e kernel para dados intervalaresFAGUNDES, Roberta Andrade de Araújo, CYSNEIROS, Francisco José de Azevêdo 16 December 2013 (has links)
Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-12T19:39:46Z
No. of bitstreams: 2
Tese Roberta Fagundes.pdf: 7867298 bytes, checksum: 0839d26ed0dc955fd5fc7770e39965b0 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-12T19:39:46Z (GMT). No. of bitstreams: 2
Tese Roberta Fagundes.pdf: 7867298 bytes, checksum: 0839d26ed0dc955fd5fc7770e39965b0 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-12-16 / O processo de descoberta de conhecimento tem o objetivo de extrair de informa¸c˜oes ´uteis
(conhecimento) em bases de dados. As abordagens usadas na execu¸c˜ao do processo de
extra¸c˜ao do conhecimento s˜ao gen´ericas e derivadas das diferentes ´areas de conhecimento,
tais como da estat´ıstica, aprendizagem de m´aquina e banco de dados. A An´alise de Dados
Simb´olicos (ADS) [Bock e Diday, (2000)] ´e introduzida como abordagem na ´area de descoberta
autom´atica de conhecimento que visa desenvolver m´etodos para dados descritos
por vari´aveis atrav´es de conjuntos de categorias, lista de valores, intervalos ou distribui¸c˜ao
de probabilidade. Dentre as t´ecnicas estat´ısticas, os modelos de regress˜ao procuram prever
o comportamento da vari´avel resposta (dependente) a partir de informa¸c˜oes provenientes
do conjunto de vari´aveis preditoras (independentes). O objetivo deste trabalho ´e propor
duas metodologias para an´alise de dados intervalares. A primeira metodologia aborda o
m´etodo robusto em regress˜ao, que ´e uma alternativa para o uso do m´etodo dos m´ınimos
quadrados quando os dados contˆem outliers. Enquanto a segunda aborda regress˜ao por
kernel, que ´e um m´etodo que prover uma rela¸c˜ao n˜ao param´etrica entre as vari´aveis, sem
utilizar um modelo com paramˆetros fixos, mas as taxas de convergˆencias dos estimadores
n˜ao param´etricos s˜ao mais lentas do que a dos estimadores param´etricos. Experimentos
com conjuntos de dados simulados e aplica¸c˜oes com conjuntos de dados reais intervalares
indicam a funcionalidade e eficiˆencia dos m´etodos propostos.
|
2 |
Diagnóstico em regressão L1 / Diagnostic in L1 regressionRodrigues, Kévin Allan Sales 14 March 2019 (has links)
Este texto apresenta um método alternativo de regressão que é denominado regressão L1. Este método é robusto com relação a outliers na variável Y enquanto o método tradicional, mínimos quadrados, não oferece robustez a este tipo de outlier. Neste trabalho reanalisaremos os dados sobre imóveis apresentados por Narula e Wellington (1977) à luz da regressão L1. Ilustraremos os principais resultados inferenciais como: interpretação do modelo, construção de intervalos de confiança e testes de hipóteses para os parâmetros, análise de medidas de qualidade do ajuste do modelo e também utilizaremos medidas de diagnóstico para destacar observações influentes. Dentre as medidas de influência utilizaremos a diferença de verossimilhanças e a diferença de verossimilhanças condicional. / This text presents an alternative method of regression that is called L1 regression. This method is robust to outliers in the Y variable while the traditional least squares method does not provide robustness to this type of outlier. In this work we will review the data about houses presented by Narula and Wellington (1977) in the light of the L1 regression. We will illustrate the main inferential results such as: model interpretation, construction of confidence intervals and hypothesis tests for the parameters, analysis of quality measures of model fit and also use diagnostic measures to highlight influential observations. Among the measures of influence we will use the likelihood displacement and the conditional likelihood displacement.
|
3 |
Critérios robustos de seleção de modelos de regressão e identificação de pontos aberrantes / Robust model selection criteria in regression and outliers identificationGuirado, Alia Garrudo 08 March 2019 (has links)
A Regressão Robusta surge como uma alternativa ao ajuste por mínimos quadrados quando os erros são contaminados por pontos aberrantes ou existe alguma evidência de violação das suposições do modelo. Na regressão clássica existem critérios de seleção de modelos e medidas de diagnóstico que são muito conhecidos. O objetivo deste trabalho é apresentar os principais critérios robustos de seleção de modelos e medidas de detecção de pontos aberrantes, assim como analisar e comparar o desempenho destes de acordo com diferentes cenários para determinar quais deles se ajustam melhor a determinadas situações. Os critérios de validação cruzada usando simulações de Monte Carlo e o Critério de Informação Bayesiano são conhecidos por desenvolver-se de forma adequada na identificação de modelos. Na dissertação confirmou-se este fato e além disso, suas alternativas robustas também destacam-se neste aspecto. A análise de resíduos constitui uma forte ferramenta da análise diagnóstico de um modelo, no trabalho detectou-se que a análise clássica de resíduos sobre o ajuste do modelo de regressão linear robusta, assim como a análise das ponderações das observações, são medidas de detecção de pontos aberrantes eficientes. Foram aplicados os critérios e medidas analisados ao conjunto de dados obtido da Estação Meteorológica do Instituto de Astronomia, Geofísica e Ciências Atmosféricas da Universidade de São Paulo para detectar quais variáveis meteorológicas influem na temperatura mínima diária durante o ano completo, e ajustou-se um modelo que permite identificar os dias associados à entrada de sistemas frontais. / Robust Regression arises as an alternative to least squares method when errors are contaminated by outliers points or there are some evidence of violation of model assumptions. In classical regression there are several criteria for model selection and diagnostic measures that are well known. The objective of this work is to present the main robust criteria of model selection and outliers detection measures, as well as to analyze and compare their performance according to different stages to determine which of them fit better in certain situations. The cross-validation criteria using Monte Carlo simulations and Beyesian Information Criterion are known to be adequately developed in model identification. This fact was confirmed, and in addition, its robust alternatives also stand out in this aspect. The residual analysis is a strong tool for model diagnostic analysis, in this work it was detected that the classic residual analysis on the robust linear model regression fit, as well as the analysis of the observations weights, are efficient measures of outliers detection points. The analyzed criteria and measures were applied to the data set obtained from the Meteorological Station of the Astronomy, Geophysics and Atmospheric Sciences Institute of São Paulo University to detect which meteorological variables influence the daily minimum temperature during the whole year, and was fitted a model that allows identify the days associated with the entry of frontal systems.
|
4 |
Um novo método para transferência de modelos de calibração NIR e uma nova estratégia para classificação de sementes de algodão usando imagem hiperespectral NIRSoares, Sófacles Figueredo Carreiro 20 June 2016 (has links)
Submitted by ANA KARLA PEREIRA RODRIGUES (anakarla_@hotmail.com) on 2017-08-09T15:33:48Z
No. of bitstreams: 1
arquivototal.pdf: 4699110 bytes, checksum: ef3b7c0aa5c4758d2c77e65ad6a81ad3 (MD5) / Made available in DSpace on 2017-08-09T15:33:48Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 4699110 bytes, checksum: ef3b7c0aa5c4758d2c77e65ad6a81ad3 (MD5)
Previous issue date: 2016-06-20 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work involves the development of two studies that are presented in chapters 2 and 3. At
first, a new method to perform the calibration transfer was designed. This method was
developed to make use of separate variables instead of using the full spectrum or spectral
windows. To accomplish this task a univariate procedure is initially used to correct the spectra
recorded in the secondary equipment, given a set of transfer samples. A robust regression
technique is then used to obtain a model with small sensitivity with respect to the univariate
correction. The proposed method is employed in two case studies involving near infrared
spectrometric determination of specific mass, research octane number and naphtenes in
gasoline, and moisture and oil in corn. In both cases, better calibration transfer results were
obtained in comparison with piecewise direct standardization (PDS). In the second, a new
strategy for cotton seed classification using near infrared (NIR) hyperspectral images (HSI)
was developed. Initially the cotton seeds samples were recorded on a station HSI image-NIR
and a conventional spectrometer NIR. Thereon, the images were segmented and the mean
spectrum of each seed was extract. Classification models SPA-LDA e PLS-DA based on the
mean spectral were developed for two data sets. The results for models SPA-LDA and PLSDA
showed that the classification with HSI-NIR data set has been achieved with greater
accuracy when compared to models for the NIR-conventional data set. / Este trabalho envolve o desenvolvimento de dois estudos, que são apresentados nos capítulos
2 e 3. No primeiro, um novo método para realizar a transferência de calibração foi concebido.
Este método foi desenvolvido para fazer uso de variáveis isoladas em vez de usar todo o
espectro ou janelas espectrais. Para realizar essa tarefa, um procedimento univariado é
inicialmente usado para corrigir os espectros registrados no equipamento secundário, dado um
conjunto de amostras de transferência. Uma técnica de regressão robusta é então usada para
obter um modelo com pequena sensibilidade em relação aos resíduos da correção univariada.
O novo método é então empregado em dois estudos de caso envolvendo análise
espectrométrica NIR, em que foram determinados os parâmetros massa específica, RON
(Research Octane Number) e teor de naftênicos em gasolina e os teores de água e óleo em
amostras de milho. Os resultados do novo método foram melhores do que os obtidos usando o
método PDS. No segundo, uma nova estratégia para classificação de sementes de algodão
usando imagens hiperespectrais no NIR foi desenvolvido. Inicialmente as amostras de
sementes de algodão foram registradas em uma estação de imagem HSI-NIR e em um
equipamento NIR convencional. Após isso, as imagens foram segmentadas e os espectros
médios de cada semente foram extraídos. Os modelos de classificação SPA-LDA e PLS-DA
baseados nos espectros médios foram construídos para os dois conjuntos de dados. Os
resultados SPA-LDA e PLS-DA para os modelos demonstraram que a classificação com os
dados HSI-NIR foi alcançada com maior exatidão quando comparada aos modelos obtidos
usando o NIR-convencional.
|
Page generated in 0.0383 seconds