Spelling suggestions: "subject:"clusterização"" "subject:"clusterization""
1 |
[en] APPLICATION OF CLUSTERING METHODS IN A STUDY ABOUT THE BRAZILIAN STOCK MARKET / [pt] APLICAÇÃO DE MÉTODOS DE CLUSTERIZAÇÃO EM UM ESTUDO SOBRE O MERCADO ACIONÁRIO BRASILEIRORODRIGO ARRUDA TORRES 02 May 2014 (has links)
[pt] Evidências indicam que ações de empresas de um mesmo setor da economia apresentam retornos semelhantes ao longo do tempo, uma vez que estariam expostas a variáveis econômico-financeiras e técnico-operacionais semelhantes. Gestores de recursos, de maneira geral, utilizam esta evidência em suas avaliações diárias na busca pelos melhores investimentos. Entretanto, na grande maioria dos
casos, não há um embasamento teórico e matemático que comprove essa relação entre as ações. O objetivo dessa dissertação é verificar se, para um grupo de ações classificadas como mais relevantes dentre as presentes na Bolsa de Valores brasileira, os preços diários de fechamento que se comportam analogamente correspondem a empresas de um mesmo setor econômico. Para testar tal hipótese, serão avaliados diferentes métodos de clusterização aplicados a matriz de dissimilaridade entre os dados estudados, que por sua vez será determinada a partir de diferentes técnicas não-paramétricas de cálculo de dependência entre dados. Os métodos testados serão comparados e o melhor escolhido através da aplicação de índices de validação de clusterizações. / [en] Evidence indicates that shares of companies belonging to the same economic sector have similar returns over time, since they would be exposed to similar economic-financial and technical-operational variables. Portfolio managers, in general, use this evidence in their daily valuations in order to find the best investment alternatives. However, in most cases, there isn`t a theoretical and mathematical background proving this relationship between stocks exists. The objective of this dissertation is to determine whether, for a group of stocks classified as among the most important of the Brazilian stock market, the daily closing prices that behave similarly correspond to companies in the same economic sector. To test this hypothesis, various clustering methods were evaluated and applied to the dissimilarity matrix calculated for the analyzed data, which is determined using different non-parametric techniques for calculating the dependency between data. The models were compared and the best selected by applying clustering validation index.
|
2 |
[en] CLUSTERING VIBRATION DATA FROM OIL WELLS THROUGH UNSUPERVISED NEURAL NETWORK / [pt] CLUSTERIZAÇÃO DE DADOS DE VIBRAÇÃO NA PERFURAÇÃO DE POÇOS DE PETRÓLEO ATRAVÉS DE REDES NEURAIS NÃO SUPERVISIONADASBRUNO ROMANELLI MENECHINI ESTEU 14 August 2015 (has links)
[pt] A perfuração de poços de petróleo em águas profundas tem como objetivo
atingir o melhor ponto de extração de óleo e gás natural presentes em
reservatórios a alguns milhares de metros no fundo do mar. Um melhor
entendimento da dinâmica de perfuração através da análise de parâmetros
operacionais em tempo real é importante para otimizar os processos de perfuração
e reduzir seus tempos de operação. Com esse objetivo, operadoras de petróleo têm
realizado grandes investimentos no desenvolvimento de ferramentas de medição e
transmissão de parâmetros durante a perfuração, tais como, entre outros, o peso
sobre broca, rotação da coluna e vazão do fluido de perfuração. Dentre as
vantagens em se monitorar estes dados em tempo real, destaca-se a otimização de
parâmetros operacionais buscando obter uma taxa de penetração satisfatória com
o menor gasto de energia possível. Em uma perfuração rotativa, essa energia é
muitas vezes parcialmente dissipada devido à vibração da coluna causada pela
interação entre broca e formação. Nesta dissertação, com o objetivo de extrair
características comuns que pudessem vir a ajudar na otimização da atividade de
perfuração, foi utilizada uma técnica de redes neurais não supervisionadas para
análise de uma extensa base de dados levantados ao longo de campanhas de
perfuração de poços em um mesmo campo de petróleo. Os dados de campo
analisados foram obtidos ao longo de perfurações de poços verticais,
exclusivamente empregando brocas tipo PDC e exibindo elevados níveis de
vibração torcional. O estudo realizado a partir de registros de parâmetros de
perfuração, características dos poços e respostas de vibração obtidas em tempo
real por ferramentas de poço, e empregando o código de mineração de dados
WEKA e a plataforma computacional de análise TIBCO Spotfire, permitiu a
determinação de uma curva de desgaste de broca e a influência das ferramentas de
navegação no nível de severidade de vibração ao longo da perfuração. / [en] Drilling oil wells in deep waters aims to achieve the best point of
extraction of oil and natural gas reservoirs present in a few thousand meters in the
seabed. A better understanding of the drilling dynamics through the analysis of
real time operation parameters is important to optimize drilling process and reduce
operation time. For this purpose petroleum operator companies have been made
great investments in developing tools that measure and transmit parameters during
drilling operation, such as the weight on bit, pipes rotation per minute and drilling
fluid flow. Among the advantages to monitor this real time data there is the
operational parameters optimization looking for the least expenditure of energy as
possible. In a rotary drilling operation this energy is often lost partially due to
column vibration caused by the interaction between bit and formation.In this
master s thesis in order to extract common features that could help on the drilling
operation optimization a technique using unsupervised neural networks for
analyze an extensive database which was built over drilling campaigns in a big oil
field . The field data analyzed were obtained during drilling vertical wells
exclusively employing PDC bits and presented high levels of torcional vibration.
The study was made from drilling parameters records, wells characteristics and
vibration responses obtained in real time by downhole tools. Employing the
WEKA data mining code and the computing analysis platform TIBCO potfire it
was possible determine a bit wear curve and the real influence of navigation tools
on the severity levels of vibration during drilling operations.
|
3 |
[en] STRUCTURE OF ELECTRICITY WHITE TARIFF IN BRAZIL: CRITICAL ANALYSIS AND PROPOSAL OF METHODOLOGY / [pt] ESTRUTURA DA TARIFA BRANCA DE ENERGIA ELÉTRICA NO BRASIL: ANÁLISE CRÍTICA E PROPOSIÇÃO METODOLÓGICADANILO FEBRONI BAPTISTA 13 July 2017 (has links)
[pt] Essa dissertação de mestrado teve dois objetivos principais. O primeiro foi avaliar a metodologia atual de determinação de preços para tarifa branca de energia elétrica. O segundo foi propor uma nova metodologia, baseada na simulação e otimização do parâmetro kz, com a inserção de variáveis voltadas para a observação do equilíbrio econômico e financeiro da tarifa, a modicidade tarifária. De acordo com a estrutura tarifária brasileira, a tomada de decisão equivocada no tocante à regulamentação da tarifa branca poderá acarretar em consequências deletérias para a tarifa de energia, caso sejam concedidos benefícios indevidos a consumidores, ou por outro lado, ser uma barreira impeditiva para a migração, que causaria o fracasso da nova modalidade. Para o desenvolvimento do trabalho foi utilizada uma metodologia de clusterização das curvas de carga por tipo e desenvolvido uma metodologia baseada em parâmetros da regulamentação atual e variáveis fundamentadas em experiências internacionais de tarifação horo-sazonal na baixa tensão. A aplicação da metodologia foi realizada pela simulação do parâmetro kz, com a obtenção das respectivas tarifas (fora de ponta, intermediária e ponta), para cada kz simulado foram calculadas as variáveis do modelo por tipologia e, na sequência, realizada a otimização da variável kz pela observação dos resultados consolidados das tipologias do subgrupo. Concluiu-se com esse estudo que a metodologia atual não observa parâmetros relevantes para a determinação dos preços da tarifa branca e que as distorções possuem maior impacto absoluto no subgrupo residencial e maior impacto relativo na classe industrial. A metodologia proposta demonstrou-se consistente na obtenção das relações de preços da tarifa branca e, oportunamente, poderá contribuir para o aprimoramento da nova modalidade tarifária. / [en] This Master s thesis has two main goals. The first is to assess the current method for determining the electrical energy white tariff prices. The second is to propose a new methodology based on simulation and optimization of the kz parameter with the inclusion of new variables, aiming at the the economic and financial balance of the tariff, considering the fact that its adoption by the utility clientes is not at all compulsory. According to the Brazilian tariff structure, making wrong decision regarding the regulation of the white tariff may result in harmful consequences not only for the energy tariff, but also for the distribution utility. To develop the thesis it was used a clustering methodology by type of load curves and applied parameters based on international experiences that has used such kind of tariff. The methodology was carried out by simulation of the kz parameter, obtaining the white tariffs, for each simulated kz value. the model variables by type were then calculated. Finally, the optimal kz value was obtained by observing the consolidated results of the subgroup typologies. It is concluded from this study that the current methodology does not consider relevant parameters for the determination of the white tariffs prices and that distortions have greater absolute impact on residential subgroup and greater relative impact on the industrial class. The proposed methodology proved to be consistent in getting the price ratios of the white tariff and, in due course, can contribute to the improvement of the new tariff structure.
|
4 |
[en] FACIAL FEATURES DETECTION BASED ON FERNS / [pt] DETECÇÃO DE CARACTERÍSTICAS FACIAIS UTILIZANDO FERNSFABIOLA ALVARES RODRIGUES DE SOUZA MAFFRA 18 January 2010 (has links)
[pt] Nas últimas décadas, a área de detecção da face e suas características tem
recebido bastante atenção da comunidade científica dada sua importância em
diversas aplicações, tais como, reconhecimento de faces, interação humanocomputador,
reconhecimento de expressões faciais, segurança, etc. Esta
dissertação propõe a utilização de um classificador baseado em FERNS no
treinamento e reconhecimento de pontos característicos a fim de possibilitar a
detecção das características da face. São revistas, brevemente, as principais
abordagens utilizadas na detecção de características faciais e a teoria de
reconhecimento de pontos característicos utilizando os FERNS. Também é
apresentada uma implementação de um detector de características da face baseado
nos FERNS e os resultados obtidos. O método proposto conta com uma fase de
treinamento offline durante a qual diversas vistas dos pontos característicos
extraídos de uma imagem de treinamento são sintetizadas e utilizadas no
treinamento dos FERNS. A detecção das características da face é realizada nas
imagens obtidas, em tempo real, de diversos pontos de vista e sob diferentes
condições de iluminação. / [en] Over the last decades, face detection and facial features detection have
received a great deal of attention from the scientific community, since these
tasks are essential for a number of important applications, such as face
recognition, face tracking, human-computer interaction, face expression
recognition, security, etc. This work proposes the use of a classifier based on
FERNS to recognize interest points across images and then detect and track the
facial features. We begin with a brief review of the most common approaches
used in facial features detection and also the theory around the FERNS. In
addition, an implementation of the facial features detection based on FERNS is
present to provide results and conclusions. The method proposed here relies on
an offline training phase during which multiple views of the keypoints to be
matched are synthesized and used to train the FERNS. The facial features
detection is performed on images acquired in real-time from many different
viewpoints and under different lighting conditions.
|
5 |
[pt] EXPLORANDO NOVOS MÉTODOS PARA REALIZAR BAGGING COM AMORTECIMENTO EXPONENCIAL / [en] EXPLORING NEW METHODS TO PERFORM BAGGING WITH EXPONENTIAL SMOOTHINGDAVID SOUZA PINTO 07 December 2020 (has links)
[pt] Métodos de amortecimento exponencial são formulações versáteis para
a previsão de séries temporais univariadas, desenvolvidas na década de 1960.
Modelos mais recentes têm feito uso do bagging para melhorar a qualidade das
previsões. Um destes, o BaggedETS, desenvolvido em 2016, trouxe melhorias
na qualidade de previsão e está disponível na biblioteca forecast para R. Uma
proposta posterior, BaggedClusterETS, adicionou uma etapa de clustering
e validação para tratar o efeito da covariância associada ao uso do bagging,
resultando em ganhos adicionais de performance. Este trabalho explora três
extensões dos métodos supracitados e seus efeitos: o primeiro estuda os efeitos
do maximum entropy bootstrap na realização do BaggedETS. O segundo
explora diferentes medidas de dissimilaridade para construir os clusters do
BaggedClusterETS. O terceiro emprega uma versão simplificada do BaggedClusterETS,
removendo as etapas de validação e seleção, empregando apenas os medóides para realizar o bagging. Para testar estas propostas, 21 séries temporais da aviação civil e demanda energética foram empregadas. / [en] Exponential smoothing methods are flexible procedures for univariate
time series forecasting, developed in the 1960 s. Most recent developments
based on these models use bagging to improve forecast quality. One of these
implementations, BaggedETS, developed in 2016, brought improvements in
forecast quality and is distributed through the forecast package for R. A posterior implementation, BaggedClusterETS, adds clustering and validation
steps to address the covariance effect associated with bagging. The proposal
resulted in further accuracy improvements. This work delves into three extensions
of the aforementioned methods: the first studies the effects of the maximum
entropy bootstrap on the BaggedETS. The second explores different
dissimilarity measures to construct the clusters in BaggedClusterETS. The
third studies a simplified version of BaggedClusterETS, where the validation
and selection steps are removed, and using only the medoids for bagging.
To test these proposals, 21 time series from civil aviation and energy consumption were used.
|
6 |
A caminhada do turista como ferramenta na identificação de padrões / The tourist walk as a tool in pattern recognitionCampiteli, Mônica Guimarães 15 June 2007 (has links)
A caminhada do turista pode ser enunciada num meio desordenado formado por N pontos espalhados aleatoriamente num hipercubo de d dimensoes. Um caminhante, partindo de um ponto qualquer desse meio, se desloca seguindo a regra determinista de dirigir-se sempre ao ponto mais proximo que nao tenha sido visitado nos ultimos µ pas- sos. Esta dinamica de movimentacao leva a trajetorias formadas por uma parte inicial transiente de t pontos, e uma parte final c?clica de p pontos. As trajetorias obtidas sao altamente dependentes da configuracao do meio. Este cenario sugere que este modelo possa ser usado como uma ferramenta de reconhecimento de padroes em conjuntos de dados. O objetivo desta tese e mostrar que as propriedades da caminhada do turista permitem a sua utilizacao na caracterizacao e exploracao de diversos tipos de sistemas. Aplicamos o modelo descrito em dois tipos distintos de sistemas, sistemas cont´?nuos e redes regulares, estudando suas ropriedades em funcao de parametros como tamanho do sistema, valor de memoria (µ), condicoes de contorno e regras de movimentacao. Finalmente, propomos e exploramos duas novas metodologias de reconhecimento de padroes baseadas nesta caminhada. A primeira consiste de um algoritmo de an´alise de imagens para caracterizar texturas que utiliza os resultados da matriz conjunta S(t, p) que carrega as informacoes sobre todas as trajetorias obtidas, reduzindo sua dimensionalidade e permitindo a classificacao eficiente de diferentes classes de imagens por um algoritmo de analise discriminante. O diferencial desta metodologia esta em sua capacidade de extrair da imagem as informacoes presentes em diversas escalas simultaneamente. A segunda metodologia e um algoritmo de agrupamento de dados n~ao supervisionado que considera cada atrator formado num dado valor de µ como um agrupamento natural e tem como resultado final uma arvore hierarquica geral, onde os grupos se conectam conforme se aumenta o valor de µ. Os resultados desta metodologia comparam-se em eficiencia aos resultados obtidos pela metodologia adicional para os dados testados e, entre as vanta- gens obtidas, podemos citar (i) independencia de uma metrica relacionando os elementos do conjunto, ja que trabalha apenas com uma matriz de vizinhancas, (ii) respeito a estrutura natural embutida no conjunto de dados, gerando uma arvore geral ao inves de uma arvore binaria e (iii) a representacao de maneira identica de conjuntos que sofreram transformacao de escala devido a independencia de uma metrica. / The tourist walk is defined in a disordered environment characterized by N points randomly distributed in a d-dimensional hypercube. Leaving from a given point, a wal- ker moves according to the deterministic rule of going to next point not visited in the last µ time steps. This dynamics leads to trajectories consisting in a transient part of t points e a final cyclic part of p points. The obtained trajectories are strongly dependent on the configuration of points. This described scenario suggests that the model can be treated as a tool for pattern recognition. The aim of this thesis is to demonstrate that the tourist walk\'s properties allow for its use in the characterization and exploration of various kinds of systems. We have applied the model in two distinct kinds of systems - continuous systems and regular networks and studied its properties as a function of the following parameters: system size, memory (µ), boundary conditions and movimentation rule. Eventually we have proposed and explored two new pattern recognition methodolo- gies based on this deterministic walk. The first one consists of an image analysis algorithm to characterize textures that makes use of the joint matrix S(t, p) which carries the data about all trajectories obtained, reducing its dimensionality and allowing an efficient clas- sification of different classes of images by a discriminant analysis algorithm. Its distinctive feature is its ability to extract informations in all scales from an image simultaneously. The second methodology proposed is a non-supervised clustering algorithm that considers each attractor in a given µ as a natural cluster. Its final result is a general hierarchical tree where groups coalesce as µ is increased. The results obtained with this methodology are comparable in efficiency with the results obtained with the tradicional method for the datasets tested. Among the advantages presented we can cite (i) independence from a metrics relating the elements since it works only with a neighborhood ranking table, (ii) respect for the natural structure hidden in the dataset, generating a general tree instead of a binary one and (iii) the representation of two sets transformed by scale in an identic manner due to the independence from a metrics.
|
7 |
A caminhada do turista como ferramenta na identificação de padrões / The tourist walk as a tool in pattern recognitionMônica Guimarães Campiteli 15 June 2007 (has links)
A caminhada do turista pode ser enunciada num meio desordenado formado por N pontos espalhados aleatoriamente num hipercubo de d dimensoes. Um caminhante, partindo de um ponto qualquer desse meio, se desloca seguindo a regra determinista de dirigir-se sempre ao ponto mais proximo que nao tenha sido visitado nos ultimos µ pas- sos. Esta dinamica de movimentacao leva a trajetorias formadas por uma parte inicial transiente de t pontos, e uma parte final c?clica de p pontos. As trajetorias obtidas sao altamente dependentes da configuracao do meio. Este cenario sugere que este modelo possa ser usado como uma ferramenta de reconhecimento de padroes em conjuntos de dados. O objetivo desta tese e mostrar que as propriedades da caminhada do turista permitem a sua utilizacao na caracterizacao e exploracao de diversos tipos de sistemas. Aplicamos o modelo descrito em dois tipos distintos de sistemas, sistemas cont´?nuos e redes regulares, estudando suas ropriedades em funcao de parametros como tamanho do sistema, valor de memoria (µ), condicoes de contorno e regras de movimentacao. Finalmente, propomos e exploramos duas novas metodologias de reconhecimento de padroes baseadas nesta caminhada. A primeira consiste de um algoritmo de an´alise de imagens para caracterizar texturas que utiliza os resultados da matriz conjunta S(t, p) que carrega as informacoes sobre todas as trajetorias obtidas, reduzindo sua dimensionalidade e permitindo a classificacao eficiente de diferentes classes de imagens por um algoritmo de analise discriminante. O diferencial desta metodologia esta em sua capacidade de extrair da imagem as informacoes presentes em diversas escalas simultaneamente. A segunda metodologia e um algoritmo de agrupamento de dados n~ao supervisionado que considera cada atrator formado num dado valor de µ como um agrupamento natural e tem como resultado final uma arvore hierarquica geral, onde os grupos se conectam conforme se aumenta o valor de µ. Os resultados desta metodologia comparam-se em eficiencia aos resultados obtidos pela metodologia adicional para os dados testados e, entre as vanta- gens obtidas, podemos citar (i) independencia de uma metrica relacionando os elementos do conjunto, ja que trabalha apenas com uma matriz de vizinhancas, (ii) respeito a estrutura natural embutida no conjunto de dados, gerando uma arvore geral ao inves de uma arvore binaria e (iii) a representacao de maneira identica de conjuntos que sofreram transformacao de escala devido a independencia de uma metrica. / The tourist walk is defined in a disordered environment characterized by N points randomly distributed in a d-dimensional hypercube. Leaving from a given point, a wal- ker moves according to the deterministic rule of going to next point not visited in the last µ time steps. This dynamics leads to trajectories consisting in a transient part of t points e a final cyclic part of p points. The obtained trajectories are strongly dependent on the configuration of points. This described scenario suggests that the model can be treated as a tool for pattern recognition. The aim of this thesis is to demonstrate that the tourist walk\'s properties allow for its use in the characterization and exploration of various kinds of systems. We have applied the model in two distinct kinds of systems - continuous systems and regular networks and studied its properties as a function of the following parameters: system size, memory (µ), boundary conditions and movimentation rule. Eventually we have proposed and explored two new pattern recognition methodolo- gies based on this deterministic walk. The first one consists of an image analysis algorithm to characterize textures that makes use of the joint matrix S(t, p) which carries the data about all trajectories obtained, reducing its dimensionality and allowing an efficient clas- sification of different classes of images by a discriminant analysis algorithm. Its distinctive feature is its ability to extract informations in all scales from an image simultaneously. The second methodology proposed is a non-supervised clustering algorithm that considers each attractor in a given µ as a natural cluster. Its final result is a general hierarchical tree where groups coalesce as µ is increased. The results obtained with this methodology are comparable in efficiency with the results obtained with the tradicional method for the datasets tested. Among the advantages presented we can cite (i) independence from a metrics relating the elements since it works only with a neighborhood ranking table, (ii) respect for the natural structure hidden in the dataset, generating a general tree instead of a binary one and (iii) the representation of two sets transformed by scale in an identic manner due to the independence from a metrics.
|
8 |
[en] A GRAPH-MINING BASED METHOD FOR SEGMENTATION AND COUNTING OF LOCAL MAXIMUM CLUSTERS IN DIGITAL IMAGES / [pt] UM MÉTODO BASEADO EM MINERAÇÃO DE GRAFOS PARA SEGMENTAÇÃO E CONTAGEM DE CLUSTERS DE MÁXIMOS LOCAIS EM IMAGENS DIGITAISGEISA MARTINS FAUSTINO 19 August 2011 (has links)
[pt] Uma imagem monocromática pode ser interpretada como uma superfície topológica e desta forma objetos de interesse podem aparecer como picos (sharp mountains), domos (smooth hills) ou vales (V- or U-shaped). Um domo geralmente contém vários pontos de máximo locais em seu topo. Logo, fica bem caracterizado por um cluster de máximos locais. Segmentar individualmente objetos em imagens onde estes aparecem parcialmente sobrepostos ou fortemente agrupados é um problema que métodos clássicos de segmentação podem não solucionar adequadamente. Outro problema é contar objetos idênticos em imagens perviamente segmentada. Esta tarefa, quando executada manualmente, devido ao cansaço visual exige um grande esforço humano. É tediosa, demorada, além de gerar resultados subjetivos. O presente trabalho propõe um novo método para segmentação e contagem de clusters de máximos locais em uma imagem digital através uma abordagem baseada em grafos. Utilizando a informação de luminância, a imagem é representada por um grafo de adjacências e um algoritmo de mineração é utilizado para segmentar os clusters. Por fim, de acordo com características da imagem, um algoritmo de clusterização pode ser incorporado ao processo para melhorar o resultado final. A contagem dos objetos é um resultado direto do algoritmo de mineração e de clusterização, quando este último é aplicado. O método proposto é tolerante a variações no tamanho e forma dos objetos e é facilmente parametrizado para lidar com diferentes grupos de imagens provenientes de objetos distintos. Testes executados em uma base de dados com 262 imagens, composta de imagens de objetos reais (grupo 1) e de células tronco embrionárias em imagens de microscopia fluorescente (grupo 2), atestam a eficiência e qualidade do método desenvolvido no que diz respeito a segmentação e a contagem. Os resultados gerados para as imagens do grupo 1 foram validados pela autora e os do grupo 2 pelos biólogos do Instituto de Ciências Biomédicas da Universidade Federal do Rio de Janeiro. Para estas imagens foram obtidas uma F-measuare média de 85,33% e 90,88%, respectivamente. Por fim, um estudo comparativo com o algoritmo clássico de watershed foi realizado. Este alcançou uma F-measuare média de 74.02% e 78,28% para os grupos 1 e 2, respectivamente, contra 85,33% e 91,60% obtido pelo método proposto. / [en] A grayscale image can be viewed as a topological surface and this way, objects
of interests may appear as peaks (sharp mountains), domes (smooth hills) or
valleys (V- or U-shaped). Generally, the dome top presents more than one local
maximum. Thus, it can be characterized by a local maximum cluster. Segmenting
objects individually in images where they appear partially or totally fused is
a problem which frequently may not be solved by a watershed segmentation
or a basic morphological processing of images. Other issue is counting similar
objects in images segmented beforehand. Counting them manually is a tedious
and time-consuming task, and its subjective nature can lead to a wide variation
in the results. This work presents a new method for segmenting and counting
of local maximum clusters in digital images through a graph-based approach.
Using the luminance information, the image is represented by a region adjacency
graph and a graph-mining algorithm is applied to segment the clusters. Finally,
according to image characteristics, a graph-clustering algorithm can be added
to the process to improve the final result. The object counting step is a direct
result from the mining algorithm and the clustering algorithm, when the latter
is applied. The proposed method is tolerant to variations in object size and
shape and can easily be parameterized to handle different image groups resulting
from distinct objects. Tests made on a database with 262 images, composed of
photographs of objects (group 1) and embryonic stem cells under fluorescence
microscopy images (group 2), attest the effectiveness and quality of the proposed
method as for segmentation and counting purpose. The images form group 1
processed by our method were checked by the author and those ones from group
2 by the specialists from the Institute of Biomedical Sciences at UFRJ. For these
images we obtained an average F-measure of 85.33% and 90.88%, respectively.
Finally, a comparative study with the widely used watershed algorithm was done.
The watershed achieved an average F-measure of 74.02% e 78.28% for groups 1
and 2, respectively, against 85.33% e 91.60% obtained by our method.
|
9 |
[pt] LOCALIZAÇÃO ESPAÇO-TEMPORAL DE ATORES EM VÍDEOS/VÍDEOS 360 E SUAS APLICAÇÕES / [en] SPATIO-TEMPORAL LOCALIZATION OF ACTORS IN VIDEO/360-VIDEO AND ITS APPLICATIONS13 September 2021 (has links)
[pt] A popularidade de plataformas para o armazenamento e compartilhamento
de vídeo tem criado um volume massivo de horas de vídeo. Dado
um conjunto de atores presentes em um vídeo, a geração de metadados com
a determinação temporal dos intervalos em que cada um desses atores está
presente, bem como a localização no espaço 2D dos quadros em cada um
desses intervalos pode facilitar a recuperação de vídeo e a recomendação.
Neste trabalho, nós investigamos a Clusterização Facial em Vídeo para a
localização espaço-temporal de atores. Primeiro descrevemos nosso método
de Clusterização Facial em Vídeo em que utilizamos métodos de detecção
facial, geração de embeddings e clusterização para agrupar faces dos atores
em diferentes quadros e fornecer a localização espaço-temporal destes atores.
Então, nós exploramos, propomos, e investigamos aplicações inovadoras
dessa localização espaço-temporal em três diferentes tarefas: (i) Reconhecimento
Facial em Vídeo, (ii) Recomendação de Vídeos Educacionais e (iii)
Posicionamento de Legendas em Vídeos 360 graus. Para a tarefa (i), propomos
um método baseado na similaridade de clústeres que é facilmente escalável e
obteve um recall de 99.435 por cento e uma precisão de 99.131 por cento em um conjunto de
vídeos. Para a tarefa (ii), propomos um método não supervisionado baseado
na presença de professores em diferentes vídeos. Tal método não requer nenhuma
informação adicional sobre os vídeo e obteve um valor mAP aproximadamente 99 por cento.
Para a tarefa (iii), propomos o posicionamento dinâmico de legendas baseado
na localização de atores em vídeo 360 graus. / [en] The popularity of platforms for the storage and transmission of video content
has created a substantial volume of video data. Given a set of actors
present in a video, generating metadata with the temporal determination
of the interval in which each actor is present, and their spatial 2D localization
in each frame in these intervals can facilitate video retrieval and
recommendation. In this work, we investigate Video Face Clustering for
this spatio-temporal localization of actors in videos. We first describe our
method for Video Face Clustering in which we take advantage of face detection,
embeddings, and clustering methods to group similar faces of actors
in different frames and provide the spatio-temporal localization of them.
Then, we explore, propose, and investigate innovative applications of this spatio-temporal localization in three different tasks: (i) Video Face Recognition, (ii) Educational Video Recommendation and (iii) Subtitles Positioning in 360-video. For (i), we propose a cluster-matching-based method that is easily scalable and achieved a recall of 99.435 percent and precision of 99.131 percent in a small video set. For (ii), we propose an unsupervised method based on them presence of lecturers in different videos that does not require any additional information from the videos and achieved a mAP approximately 99 percent. For (iii), we propose a dynamic placement of subtitles based on the automatic localization of actors in 360-video.
|
10 |
[pt] DESENVOLVIMENTO DE SISTEMA PARA DETECÇÃO DE PERDAS COMERCIAIS EM REDES DE DISTRIBUIÇÃO DE ENERGIA ELÉTRICA / [en] SYSTEM DEVELOPMENT TO DETECT COMMERCIAL LOSSES IN ELECTRICAL ENERGY DISTRIBUTION NETWORKRODRIGO FLORA CALILI 29 December 2005 (has links)
[pt] Os modelos matemáticos comumente usados na identificação de
irregularidades na medição se baseiam na análise da
redução percentual do
consumo do mês (normalmente de 20% a 30%) em relação aos
meses anteriores.
Este método tem gerado resultados imprecisos uma vez que
considera o valor do
consumo como um valor rígido e, portanto, não incorpora o
efeito da sazonalidade
na tipologia das cargas das unidades consumidoras.
Este trabalho tem o intuito de melhorar a identificação de
clientes
fraudulentos utilizando métodos de inteligência
artificial, tais como Redes Neurais e
Lógica Fuzzy, implementados a um banco de dados de
cadastro da Distribuidora
de Energia ELEKTRO e a uma Pesquisa de Posses e Hábitos de
Consumo (PPH)
feita nesta mesma empresa.
Nesta dissertação, o objetivo foi classificar um grupo de
consumidores
como normal (adimplente), inadimplente e fraudulento. Para
tanto, foi feita
inicialmente uma clusterização utilizando uma Rede Neural,
mais especificamente
uma Rede de Kohonen, para o banco de dados de cadastro
disponibilizado pela
distribuidora. Tomando os grupos desta classificação
prévia feita pela Rede
identificaram-se quais e quantos destes tiveram PPH´s
realizadas. Para se ter a
classificação de um grupo quanto a incidência de
consumidores normais,
inadimplentes e fraudulentos utilizou-se um processo de
Análise Fuzzy, o qual
identifica os clusters com os consumidores de cada um dos
segmentos. É feita uma
análise de desempenho do modelo proposto com dados reais
fornecidos pela
empresa, na qual os resultados apontaram para uma robustez
do método. / [en] Mathematical models commonly used to identify
irregularities in
measurement are based on percentile reduction analysis of
the monthly
consumption (normally from 20% to 30%) in relation to the
previous months. This
method tends to generate imprecise results, since it
considers the value of the
consumption as a rigid value and, therefore, it does not
incorporate the seasonal
effect in the loads topology of the consumer units.
This work has intention to improve the identification of
fraudulent
customers using artificial intelligence methods, such as
Neural Networks and Fuzzy
Logic, implemented to a database of consumers of ELEKTRO a
distributing utility of
São Paulo State, Brazil. It also uses information on
appliances ownership obtained
via market research in ELEKTRO area, named PPH (Portuguese
for this particular
type of market research).
In this dissertation, the main objective was to classify a
group of
consumers as solvent, insolvent and fraudulent. In order
to achieve this task, a
clustering was initially made using a Neural Network
framework, more specifically a
Kohonen Network, for the database available. It was then
checked which of the
groups had a minimum number of clients interviewed in the
PPH. In order to have
the classification of the clients in the three categories
it was used Fuzzy Analysis.
Selected data is also presented, considering the available
database of the Company
as well as the research environment, which had been taken
from the PPH. Finally, it
was checked the performance of the method against real
data obtained from the
utility and the results were very satisfactory.
|
Page generated in 0.0692 seconds