Made available in DSpace on 2014-06-12T15:51:56Z (GMT). No. of bitstreams: 2
arquivo2961_1.pdf: 1358041 bytes, checksum: 6856c7acfe3c44063d89520f13a9da5f (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Fundação de Amparo à Pesquisa do Estado do Amazonas / A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um
conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina
e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas,
listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos
para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais,
análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear
propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados
para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo
da regressão linear considerando apenas as informações sobre os pontos médios (centros) das
variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos
e considerando os valores dos pontos médios e das amplitudes dos intervalos.
Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade
dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise
de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados
sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA,
esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar
a generalização de um conjunto de outras observações clássicas.
Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos
do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores
tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos
de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados
na literatura não estabelecem suposições probabilísticas. Além disso, considerando que
a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização
de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de
técnicas para a identificação de dados simbólicos intervalares atípicos
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/1700 |
Date | 31 January 2010 |
Creators | DOMINGUES, Marco Antonio de Oliveira |
Contributors | SOUZA, Renata Maria Cardoso Rodrigues de |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.002 seconds