Return to search

Métodos robustos em regressão linear para dados simbólicos do tipo intervalo

Made available in DSpace on 2014-06-12T15:51:56Z (GMT). No. of bitstreams: 2
arquivo2961_1.pdf: 1358041 bytes, checksum: 6856c7acfe3c44063d89520f13a9da5f (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Fundação de Amparo à Pesquisa do Estado do Amazonas / A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um
conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina
e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas,
listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos
para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais,
análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear
propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados
para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo
da regressão linear considerando apenas as informações sobre os pontos médios (centros) das
variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos
e considerando os valores dos pontos médios e das amplitudes dos intervalos.
Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade
dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise
de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados
sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA,
esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar
a generalização de um conjunto de outras observações clássicas.
Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos
do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores
tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos
de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados
na literatura não estabelecem suposições probabilísticas. Além disso, considerando que
a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização
de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de
técnicas para a identificação de dados simbólicos intervalares atípicos

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/1700
Date31 January 2010
CreatorsDOMINGUES, Marco Antonio de Oliveira
ContributorsSOUZA, Renata Maria Cardoso Rodrigues de
PublisherUniversidade Federal de Pernambuco
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds