Global ETD Search

Return to search

Revisitando o problema de classificação de padrões na presença de outliers usando técnicas de regressão robusta / Revisiting the problem of pattern classification in the presence of outliers using robust regression techniques

BARROS, A. L. B. P. Revisitando o problema de classificação de padrões na presença de outliers usando técnicas de regressão robusta. 2013. 132 f. Tese (Doutorado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2013. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2014-04-03T16:37:19Z
No. of bitstreams: 1
2013_tese_albpbarros.pdf: 1388726 bytes, checksum: 538397168fecf8499a0d2f56c55e7ca9 (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2014-05-07T19:09:33Z (GMT) No. of bitstreams: 1
2013_tese_albpbarros.pdf: 1388726 bytes, checksum: 538397168fecf8499a0d2f56c55e7ca9 (MD5) / Made available in DSpace on 2014-05-07T19:09:33Z (GMT). No. of bitstreams: 1
2013_tese_albpbarros.pdf: 1388726 bytes, checksum: 538397168fecf8499a0d2f56c55e7ca9 (MD5)
Previous issue date: 2013 / This thesis addresses the problem of data classiﬁcation when they are contaminated with atypical patterns. These patterns, generally called outliers, are omnipresent in real-world multi- variate data sets, but their a priori detection (i.e. before training the classiﬁer) is a difﬁcult task to perform. As a result, the most common approach is the reactive one, in which one suspects of the presence of outliers in the data only after a previously trained classiﬁer has achieved a low performance. Several strategies can then be carried out to improve the performance of the classiﬁer, such as to choose a more computationally powerful classiﬁer and/or to remove the de- tected outliers from data, eliminating those patterns which are difﬁcult to categorize properly. Whatever the strategy adopted, the presence of outliers will always require more attention and care during the design of a pattern classiﬁer. Bearing these difﬁculties in mind, this thesis revi- sits concepts and techniques from the theory of robust regression, in particular those related to M-estimation, adapting them to the design of pattern classiﬁers which are able to automatically handle outliers. This adaptation leads to the proposal of robust versions of two pattern classi- ﬁers widely used in the literature, namely, least squares classiﬁer (LSC) and extreme learning machine (ELM). Through a comprehensive set of computer experiments using synthetic and real-world data, it is shown that the proposed robust classiﬁers consistently outperform their original versions. / Nesta tese, aborda-se o problema de classiﬁcação de dados que estão contaminados com pa- drões atípicos. Tais padrões, genericamente chamados de outliers, são onipresentes em conjunto de dados multivariados reais, porém sua detecção a priori (i.e antes de treinar um classiﬁcador) é uma tarefa de difícil realização. Como conseqüência, uma abordagem reativa, em que se desconﬁa da presença de outliers somente após um classiﬁcador previamente treinado apresen- tar baixo desempenho, é a mais comum. Várias estratégias podem então ser levadas a cabo a ﬁm de melhorar o desempenho do classiﬁcador, dentre elas escolher um classiﬁcador mais poderoso computacionalmente ou promover uma limpeza dos dados, eliminando aqueles pa- drões difíceis de categorizar corretamente. Qualquer que seja a estratégia adotada, a presença de outliers sempre irá requerer maior atenção e cuidado durante o projeto de um classiﬁcador de padrões. Tendo estas diﬁculdades em mente, nesta tese são revisitados conceitos e técni- cas provenientes da teoria de regressão robusta, em particular aqueles relacionados à estimação M, adaptando-os ao projeto de classiﬁcadores de padrões capazes de lidar automaticamente com outliers. Esta adaptação leva à proposição de versões robustas de dois classiﬁcadores de padrões amplamente utilizados na literatura, a saber, o classiﬁcador linear dos mínimos qua- drados (least squares classiﬁer, LSC) e a máquina de aprendizado extremo (extreme learning machine, ELM). Através de uma ampla gama de experimentos computacionais, usando dados sintéticos e reais, mostra-se que as versões robustas dos classiﬁcadores supracitados apresentam desempenho consistentemente superior aos das versões originais.

Teleinformática

Reconhecimento de padrões

Proteção de dados

Identifer	oai:union.ndltd.org:IBICT/oai:www.repositorio.ufc.br:riufc/8003
Date	January 2013
Creators	Barros, Ana Luiza Bessa de Paula
Contributors	Barreto, Guilherme de Alencar
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	English
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Source	reponame:Repositório Institucional da UFC, instname:Universidade Federal do Ceará, instacron:UFC
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0049 seconds

Revisitando o problema de classificação de padrões na presença de outliers usando técnicas de regressão robusta / Revisiting the problem of pattern classification in the presence of outliers using robust regression techniques

Description

Links & Downloads

Tags

Additional Fields