1 |
[en] A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT / [pt] ENSEMBLE SEQUENCIAL CENTRADO EM MODELOS PARA DETECÇÃO DE OUTLIERS NO CONTEXTO DE MARKETING SCIENCEREBECCA PORPHIRIO DA COSTA DE AZEVEDO 19 February 2019 (has links)
[pt] O desenvolvimento visto nos últimos anos em dispositivos móveis tem tornado dramático o aumento na quantidade de dados e informações disponíveis para publicitários ao redor do mundo. Custo computacional e tempo disponível para processar dados e ser capaz de distinguir verdadeiros usuários de anomalias ou ruído têm crescido. Assim, a criação de um método para detecção de outliers poderia apoiar melhor os pesquisadores de Marketing e aumentar sua precisão na compreensão do comportamento digital. Estudos atuais mostram que, até o momento, o uso de meta-algoritmos tem sido pouco usado para detecção de outliers. Meta-algoritmos tendem a trazer benefícios porque reduzem a dependência que um único algoritmo pode gerar. Esta dissertação propõe um design de meta-algoritmo que utiliza diferentes algoritmos para obter resultados de detecção de outliers melhores do que aqueles obtidos por apenas um único algoritmo: centrado em modelo e sequencial. A novidade da abordagem consiste em (i) explorar a técnica sequencial, utilizando algoritmos que são aplicados sequencialmente, no qual um algoritmo impacta o próximo e o resultado final é uma combinação dos resultados obtidos; (ii) centralizar a performance no modelo e não nos dados, o que significa que o ensemble é aplicado a todo o conjunto de dados ao mesmo tempo e; (iii) apoiar pesquisadores de marketing que precisem operar ciência de dados de forma mais robusta e coerente. / [en] Latest years evolution in mobile devices has increased dramatically the amount of data and available information for advertisers around the world. Computational cost and available time to process data and be able to distinguish true users from anomalies or noise has only increased. Thus, the creation of a method to detect outliers could support Marketing researchers and increase their precision in understanding online behavior. Recent studies showthat, so far, meta-algorithms have not been used to detect outliers. Metaalgorithms tend to bring benefits because they reduce dependency that a single algorithm can generate. This work proposes a sequential model-centric ensemble design that uses different algorithms in outlier detection to obtain better results than those obtained by a single algorithm. The novelty in this approach consists in: (i) exploring the sequential technique, using algorithms that impact the next one and whose results are a combination of previously obtained results; (ii) centralizing performance around the model and not the data, which means the ensemble is applied in the whole dataset and not on different subsamples; (iii) support Marketing researchers that need to operate data Science in a more robust and coherent way.
|
2 |
[pt] DETECÇÃO DE PADRÕES EM IMAGENS BIDIMENSIONAIS: ESTUDO DE CASOS / [en] PATTERN DETECTION IN BIDIMENSIONAL IMAGENS: CASES STUDYGUILHERME LUCIO ABELHA MOTA 10 November 2005 (has links)
[pt] A presente dissertação estudo dois problemas de detecção
de padrões em imagens com fundo complexo, casos onde os
algoritmos de segmentação convencionais não podem
proporcionar bons resultados: a localização de Unidades
Estruturais (UE`s) em imagens obtidas por Microscópio
Eletrônico de Transmissão em Alta Resolução, e a detecção
de faces frontais na posição vertical em imagens. Apesar
de serem abordados problemas diferentes, as metodologias
empregadas na solução de ambos os problemas possuem
semelhanças. Uma operação de vizinhança é aplicada a
imagem de entrada em busca de padrões de interesse. Sendo
cada região extraída desta imagem submetida a um operador
matemático composto por etapas de pré-processamento,
redução de dimensionalidade e classificação.
Na detecção de UE`s foram empregados três métodos
distintos de redução de dimensionalidade - Análise de
Componentes Principais (PCA), PCA do conjunto de
treinamento equilibrado (PCAEq), e um método inédito,
eixos que maximizam a distância ao centróide de uma classe
(MAXDIST) - e dois modelos de classificador -
classificador baseado na distância euclideana (EUC) e rede
neural back-propagation (RN). A combinação PCAEq/RN
forneceu taxa de detecção de 88% para 25 componentes. Já a
combinação MAXDIST/EUC com apenas uma atributo forneceu
82% de detecção com menos falsas detecções. Na detecção de
faces foi empregada uma nova abordagem, que utiliza uma
rede neural back-propagation como classificador. Aplica-se
a sua entrada recebe a representação no subespaço das
faces e o erro de reconstrução. Em comparação com os
resultados de referência da literatura na área, o método
proposto atingiu taxas de detecção similares. / [en] This dissertation studies two pattern detection problems
in images with complex background, in which standard
segmentation techniques do not provide good results: the
detection of structural units (SU`s) in images obtained
through High resolution transmission Electron Microscopy
and the detection of frontal human faces in images.
The methods employed in the solution of both
problems have many similarities - a neighborhood operator,
basically composed of pre-processing, dimensionality
reduction and classification steps, scans the input image
searching for the patterns of interest.
For SU detection three dimensionality reduction
methods - Principal Component Analysis (PCA), PCA of the
balanced training set (PACEq), and a new method, axis that
maximize the distance to a given class centroid
(MAXDIST) -, and two classifiers - Euclidean Distance
(EUC) and back-propagation neural network (RN). The
MAXDIST/EUC combination, with just one component, provided
a detection rate of 82% with less false detections.
For face detection a new approach was employed,
using a back-propagation neural network as classifier. It
takes as input a representation in the so-called face
space and the reconstruction error (DFFS). In comparison
with benchmark results from the literature, the proposed
method reached similar detection rates.
|
Page generated in 0.4962 seconds