• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 13
  • 6
  • Tagged with
  • 19
  • 19
  • 18
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] CLUSTERING VIBRATION DATA FROM OIL WELLS THROUGH UNSUPERVISED NEURAL NETWORK / [pt] CLUSTERIZAÇÃO DE DADOS DE VIBRAÇÃO NA PERFURAÇÃO DE POÇOS DE PETRÓLEO ATRAVÉS DE REDES NEURAIS NÃO SUPERVISIONADAS

BRUNO ROMANELLI MENECHINI ESTEU 14 August 2015 (has links)
[pt] A perfuração de poços de petróleo em águas profundas tem como objetivo atingir o melhor ponto de extração de óleo e gás natural presentes em reservatórios a alguns milhares de metros no fundo do mar. Um melhor entendimento da dinâmica de perfuração através da análise de parâmetros operacionais em tempo real é importante para otimizar os processos de perfuração e reduzir seus tempos de operação. Com esse objetivo, operadoras de petróleo têm realizado grandes investimentos no desenvolvimento de ferramentas de medição e transmissão de parâmetros durante a perfuração, tais como, entre outros, o peso sobre broca, rotação da coluna e vazão do fluido de perfuração. Dentre as vantagens em se monitorar estes dados em tempo real, destaca-se a otimização de parâmetros operacionais buscando obter uma taxa de penetração satisfatória com o menor gasto de energia possível. Em uma perfuração rotativa, essa energia é muitas vezes parcialmente dissipada devido à vibração da coluna causada pela interação entre broca e formação. Nesta dissertação, com o objetivo de extrair características comuns que pudessem vir a ajudar na otimização da atividade de perfuração, foi utilizada uma técnica de redes neurais não supervisionadas para análise de uma extensa base de dados levantados ao longo de campanhas de perfuração de poços em um mesmo campo de petróleo. Os dados de campo analisados foram obtidos ao longo de perfurações de poços verticais, exclusivamente empregando brocas tipo PDC e exibindo elevados níveis de vibração torcional. O estudo realizado a partir de registros de parâmetros de perfuração, características dos poços e respostas de vibração obtidas em tempo real por ferramentas de poço, e empregando o código de mineração de dados WEKA e a plataforma computacional de análise TIBCO Spotfire, permitiu a determinação de uma curva de desgaste de broca e a influência das ferramentas de navegação no nível de severidade de vibração ao longo da perfuração. / [en] Drilling oil wells in deep waters aims to achieve the best point of extraction of oil and natural gas reservoirs present in a few thousand meters in the seabed. A better understanding of the drilling dynamics through the analysis of real time operation parameters is important to optimize drilling process and reduce operation time. For this purpose petroleum operator companies have been made great investments in developing tools that measure and transmit parameters during drilling operation, such as the weight on bit, pipes rotation per minute and drilling fluid flow. Among the advantages to monitor this real time data there is the operational parameters optimization looking for the least expenditure of energy as possible. In a rotary drilling operation this energy is often lost partially due to column vibration caused by the interaction between bit and formation.In this master s thesis in order to extract common features that could help on the drilling operation optimization a technique using unsupervised neural networks for analyze an extensive database which was built over drilling campaigns in a big oil field . The field data analyzed were obtained during drilling vertical wells exclusively employing PDC bits and presented high levels of torcional vibration. The study was made from drilling parameters records, wells characteristics and vibration responses obtained in real time by downhole tools. Employing the WEKA data mining code and the computing analysis platform TIBCO potfire it was possible determine a bit wear curve and the real influence of navigation tools on the severity levels of vibration during drilling operations.
2

[en] STRUCTURE OF ELECTRICITY WHITE TARIFF IN BRAZIL: CRITICAL ANALYSIS AND PROPOSAL OF METHODOLOGY / [pt] ESTRUTURA DA TARIFA BRANCA DE ENERGIA ELÉTRICA NO BRASIL: ANÁLISE CRÍTICA E PROPOSIÇÃO METODOLÓGICA

DANILO FEBRONI BAPTISTA 13 July 2017 (has links)
[pt] Essa dissertação de mestrado teve dois objetivos principais. O primeiro foi avaliar a metodologia atual de determinação de preços para tarifa branca de energia elétrica. O segundo foi propor uma nova metodologia, baseada na simulação e otimização do parâmetro kz, com a inserção de variáveis voltadas para a observação do equilíbrio econômico e financeiro da tarifa, a modicidade tarifária. De acordo com a estrutura tarifária brasileira, a tomada de decisão equivocada no tocante à regulamentação da tarifa branca poderá acarretar em consequências deletérias para a tarifa de energia, caso sejam concedidos benefícios indevidos a consumidores, ou por outro lado, ser uma barreira impeditiva para a migração, que causaria o fracasso da nova modalidade. Para o desenvolvimento do trabalho foi utilizada uma metodologia de clusterização das curvas de carga por tipo e desenvolvido uma metodologia baseada em parâmetros da regulamentação atual e variáveis fundamentadas em experiências internacionais de tarifação horo-sazonal na baixa tensão. A aplicação da metodologia foi realizada pela simulação do parâmetro kz, com a obtenção das respectivas tarifas (fora de ponta, intermediária e ponta), para cada kz simulado foram calculadas as variáveis do modelo por tipologia e, na sequência, realizada a otimização da variável kz pela observação dos resultados consolidados das tipologias do subgrupo. Concluiu-se com esse estudo que a metodologia atual não observa parâmetros relevantes para a determinação dos preços da tarifa branca e que as distorções possuem maior impacto absoluto no subgrupo residencial e maior impacto relativo na classe industrial. A metodologia proposta demonstrou-se consistente na obtenção das relações de preços da tarifa branca e, oportunamente, poderá contribuir para o aprimoramento da nova modalidade tarifária. / [en] This Master s thesis has two main goals. The first is to assess the current method for determining the electrical energy white tariff prices. The second is to propose a new methodology based on simulation and optimization of the kz parameter with the inclusion of new variables, aiming at the the economic and financial balance of the tariff, considering the fact that its adoption by the utility clientes is not at all compulsory. According to the Brazilian tariff structure, making wrong decision regarding the regulation of the white tariff may result in harmful consequences not only for the energy tariff, but also for the distribution utility. To develop the thesis it was used a clustering methodology by type of load curves and applied parameters based on international experiences that has used such kind of tariff. The methodology was carried out by simulation of the kz parameter, obtaining the white tariffs, for each simulated kz value. the model variables by type were then calculated. Finally, the optimal kz value was obtained by observing the consolidated results of the subgroup typologies. It is concluded from this study that the current methodology does not consider relevant parameters for the determination of the white tariffs prices and that distortions have greater absolute impact on residential subgroup and greater relative impact on the industrial class. The proposed methodology proved to be consistent in getting the price ratios of the white tariff and, in due course, can contribute to the improvement of the new tariff structure.
3

[en] FACIAL FEATURES DETECTION BASED ON FERNS / [pt] DETECÇÃO DE CARACTERÍSTICAS FACIAIS UTILIZANDO FERNS

FABIOLA ALVARES RODRIGUES DE SOUZA MAFFRA 18 January 2010 (has links)
[pt] Nas últimas décadas, a área de detecção da face e suas características tem recebido bastante atenção da comunidade científica dada sua importância em diversas aplicações, tais como, reconhecimento de faces, interação humanocomputador, reconhecimento de expressões faciais, segurança, etc. Esta dissertação propõe a utilização de um classificador baseado em FERNS no treinamento e reconhecimento de pontos característicos a fim de possibilitar a detecção das características da face. São revistas, brevemente, as principais abordagens utilizadas na detecção de características faciais e a teoria de reconhecimento de pontos característicos utilizando os FERNS. Também é apresentada uma implementação de um detector de características da face baseado nos FERNS e os resultados obtidos. O método proposto conta com uma fase de treinamento offline durante a qual diversas vistas dos pontos característicos extraídos de uma imagem de treinamento são sintetizadas e utilizadas no treinamento dos FERNS. A detecção das características da face é realizada nas imagens obtidas, em tempo real, de diversos pontos de vista e sob diferentes condições de iluminação. / [en] Over the last decades, face detection and facial features detection have received a great deal of attention from the scientific community, since these tasks are essential for a number of important applications, such as face recognition, face tracking, human-computer interaction, face expression recognition, security, etc. This work proposes the use of a classifier based on FERNS to recognize interest points across images and then detect and track the facial features. We begin with a brief review of the most common approaches used in facial features detection and also the theory around the FERNS. In addition, an implementation of the facial features detection based on FERNS is present to provide results and conclusions. The method proposed here relies on an offline training phase during which multiple views of the keypoints to be matched are synthesized and used to train the FERNS. The facial features detection is performed on images acquired in real-time from many different viewpoints and under different lighting conditions.
4

[pt] EXPLORANDO NOVOS MÉTODOS PARA REALIZAR BAGGING COM AMORTECIMENTO EXPONENCIAL / [en] EXPLORING NEW METHODS TO PERFORM BAGGING WITH EXPONENTIAL SMOOTHING

DAVID SOUZA PINTO 07 December 2020 (has links)
[pt] Métodos de amortecimento exponencial são formulações versáteis para a previsão de séries temporais univariadas, desenvolvidas na década de 1960. Modelos mais recentes têm feito uso do bagging para melhorar a qualidade das previsões. Um destes, o BaggedETS, desenvolvido em 2016, trouxe melhorias na qualidade de previsão e está disponível na biblioteca forecast para R. Uma proposta posterior, BaggedClusterETS, adicionou uma etapa de clustering e validação para tratar o efeito da covariância associada ao uso do bagging, resultando em ganhos adicionais de performance. Este trabalho explora três extensões dos métodos supracitados e seus efeitos: o primeiro estuda os efeitos do maximum entropy bootstrap na realização do BaggedETS. O segundo explora diferentes medidas de dissimilaridade para construir os clusters do BaggedClusterETS. O terceiro emprega uma versão simplificada do BaggedClusterETS, removendo as etapas de validação e seleção, empregando apenas os medóides para realizar o bagging. Para testar estas propostas, 21 séries temporais da aviação civil e demanda energética foram empregadas. / [en] Exponential smoothing methods are flexible procedures for univariate time series forecasting, developed in the 1960 s. Most recent developments based on these models use bagging to improve forecast quality. One of these implementations, BaggedETS, developed in 2016, brought improvements in forecast quality and is distributed through the forecast package for R. A posterior implementation, BaggedClusterETS, adds clustering and validation steps to address the covariance effect associated with bagging. The proposal resulted in further accuracy improvements. This work delves into three extensions of the aforementioned methods: the first studies the effects of the maximum entropy bootstrap on the BaggedETS. The second explores different dissimilarity measures to construct the clusters in BaggedClusterETS. The third studies a simplified version of BaggedClusterETS, where the validation and selection steps are removed, and using only the medoids for bagging. To test these proposals, 21 time series from civil aviation and energy consumption were used.
5

[en] APPLICATION OF CLUSTERING METHODS IN A STUDY ABOUT THE BRAZILIAN STOCK MARKET / [pt] APLICAÇÃO DE MÉTODOS DE CLUSTERIZAÇÃO EM UM ESTUDO SOBRE O MERCADO ACIONÁRIO BRASILEIRO

RODRIGO ARRUDA TORRES 02 May 2014 (has links)
[pt] Evidências indicam que ações de empresas de um mesmo setor da economia apresentam retornos semelhantes ao longo do tempo, uma vez que estariam expostas a variáveis econômico-financeiras e técnico-operacionais semelhantes. Gestores de recursos, de maneira geral, utilizam esta evidência em suas avaliações diárias na busca pelos melhores investimentos. Entretanto, na grande maioria dos casos, não há um embasamento teórico e matemático que comprove essa relação entre as ações. O objetivo dessa dissertação é verificar se, para um grupo de ações classificadas como mais relevantes dentre as presentes na Bolsa de Valores brasileira, os preços diários de fechamento que se comportam analogamente correspondem a empresas de um mesmo setor econômico. Para testar tal hipótese, serão avaliados diferentes métodos de clusterização aplicados a matriz de dissimilaridade entre os dados estudados, que por sua vez será determinada a partir de diferentes técnicas não-paramétricas de cálculo de dependência entre dados. Os métodos testados serão comparados e o melhor escolhido através da aplicação de índices de validação de clusterizações. / [en] Evidence indicates that shares of companies belonging to the same economic sector have similar returns over time, since they would be exposed to similar economic-financial and technical-operational variables. Portfolio managers, in general, use this evidence in their daily valuations in order to find the best investment alternatives. However, in most cases, there isn`t a theoretical and mathematical background proving this relationship between stocks exists. The objective of this dissertation is to determine whether, for a group of stocks classified as among the most important of the Brazilian stock market, the daily closing prices that behave similarly correspond to companies in the same economic sector. To test this hypothesis, various clustering methods were evaluated and applied to the dissimilarity matrix calculated for the analyzed data, which is determined using different non-parametric techniques for calculating the dependency between data. The models were compared and the best selected by applying clustering validation index.
6

[en] A GRAPH-MINING BASED METHOD FOR SEGMENTATION AND COUNTING OF LOCAL MAXIMUM CLUSTERS IN DIGITAL IMAGES / [pt] UM MÉTODO BASEADO EM MINERAÇÃO DE GRAFOS PARA SEGMENTAÇÃO E CONTAGEM DE CLUSTERS DE MÁXIMOS LOCAIS EM IMAGENS DIGITAIS

GEISA MARTINS FAUSTINO 19 August 2011 (has links)
[pt] Uma imagem monocromática pode ser interpretada como uma superfície topológica e desta forma objetos de interesse podem aparecer como picos (sharp mountains), domos (smooth hills) ou vales (V- or U-shaped). Um domo geralmente contém vários pontos de máximo locais em seu topo. Logo, fica bem caracterizado por um cluster de máximos locais. Segmentar individualmente objetos em imagens onde estes aparecem parcialmente sobrepostos ou fortemente agrupados é um problema que métodos clássicos de segmentação podem não solucionar adequadamente. Outro problema é contar objetos idênticos em imagens perviamente segmentada. Esta tarefa, quando executada manualmente, devido ao cansaço visual exige um grande esforço humano. É tediosa, demorada, além de gerar resultados subjetivos. O presente trabalho propõe um novo método para segmentação e contagem de clusters de máximos locais em uma imagem digital através uma abordagem baseada em grafos. Utilizando a informação de luminância, a imagem é representada por um grafo de adjacências e um algoritmo de mineração é utilizado para segmentar os clusters. Por fim, de acordo com características da imagem, um algoritmo de clusterização pode ser incorporado ao processo para melhorar o resultado final. A contagem dos objetos é um resultado direto do algoritmo de mineração e de clusterização, quando este último é aplicado. O método proposto é tolerante a variações no tamanho e forma dos objetos e é facilmente parametrizado para lidar com diferentes grupos de imagens provenientes de objetos distintos. Testes executados em uma base de dados com 262 imagens, composta de imagens de objetos reais (grupo 1) e de células tronco embrionárias em imagens de microscopia fluorescente (grupo 2), atestam a eficiência e qualidade do método desenvolvido no que diz respeito a segmentação e a contagem. Os resultados gerados para as imagens do grupo 1 foram validados pela autora e os do grupo 2 pelos biólogos do Instituto de Ciências Biomédicas da Universidade Federal do Rio de Janeiro. Para estas imagens foram obtidas uma F-measuare média de 85,33% e 90,88%, respectivamente. Por fim, um estudo comparativo com o algoritmo clássico de watershed foi realizado. Este alcançou uma F-measuare média de 74.02% e 78,28% para os grupos 1 e 2, respectivamente, contra 85,33% e 91,60% obtido pelo método proposto. / [en] A grayscale image can be viewed as a topological surface and this way, objects of interests may appear as peaks (sharp mountains), domes (smooth hills) or valleys (V- or U-shaped). Generally, the dome top presents more than one local maximum. Thus, it can be characterized by a local maximum cluster. Segmenting objects individually in images where they appear partially or totally fused is a problem which frequently may not be solved by a watershed segmentation or a basic morphological processing of images. Other issue is counting similar objects in images segmented beforehand. Counting them manually is a tedious and time-consuming task, and its subjective nature can lead to a wide variation in the results. This work presents a new method for segmenting and counting of local maximum clusters in digital images through a graph-based approach. Using the luminance information, the image is represented by a region adjacency graph and a graph-mining algorithm is applied to segment the clusters. Finally, according to image characteristics, a graph-clustering algorithm can be added to the process to improve the final result. The object counting step is a direct result from the mining algorithm and the clustering algorithm, when the latter is applied. The proposed method is tolerant to variations in object size and shape and can easily be parameterized to handle different image groups resulting from distinct objects. Tests made on a database with 262 images, composed of photographs of objects (group 1) and embryonic stem cells under fluorescence microscopy images (group 2), attest the effectiveness and quality of the proposed method as for segmentation and counting purpose. The images form group 1 processed by our method were checked by the author and those ones from group 2 by the specialists from the Institute of Biomedical Sciences at UFRJ. For these images we obtained an average F-measure of 85.33% and 90.88%, respectively. Finally, a comparative study with the widely used watershed algorithm was done. The watershed achieved an average F-measure of 74.02% e 78.28% for groups 1 and 2, respectively, against 85.33% e 91.60% obtained by our method.
7

[pt] LOCALIZAÇÃO ESPAÇO-TEMPORAL DE ATORES EM VÍDEOS/VÍDEOS 360 E SUAS APLICAÇÕES / [en] SPATIO-TEMPORAL LOCALIZATION OF ACTORS IN VIDEO/360-VIDEO AND ITS APPLICATIONS

13 September 2021 (has links)
[pt] A popularidade de plataformas para o armazenamento e compartilhamento de vídeo tem criado um volume massivo de horas de vídeo. Dado um conjunto de atores presentes em um vídeo, a geração de metadados com a determinação temporal dos intervalos em que cada um desses atores está presente, bem como a localização no espaço 2D dos quadros em cada um desses intervalos pode facilitar a recuperação de vídeo e a recomendação. Neste trabalho, nós investigamos a Clusterização Facial em Vídeo para a localização espaço-temporal de atores. Primeiro descrevemos nosso método de Clusterização Facial em Vídeo em que utilizamos métodos de detecção facial, geração de embeddings e clusterização para agrupar faces dos atores em diferentes quadros e fornecer a localização espaço-temporal destes atores. Então, nós exploramos, propomos, e investigamos aplicações inovadoras dessa localização espaço-temporal em três diferentes tarefas: (i) Reconhecimento Facial em Vídeo, (ii) Recomendação de Vídeos Educacionais e (iii) Posicionamento de Legendas em Vídeos 360 graus. Para a tarefa (i), propomos um método baseado na similaridade de clústeres que é facilmente escalável e obteve um recall de 99.435 por cento e uma precisão de 99.131 por cento em um conjunto de vídeos. Para a tarefa (ii), propomos um método não supervisionado baseado na presença de professores em diferentes vídeos. Tal método não requer nenhuma informação adicional sobre os vídeo e obteve um valor mAP aproximadamente 99 por cento. Para a tarefa (iii), propomos o posicionamento dinâmico de legendas baseado na localização de atores em vídeo 360 graus. / [en] The popularity of platforms for the storage and transmission of video content has created a substantial volume of video data. Given a set of actors present in a video, generating metadata with the temporal determination of the interval in which each actor is present, and their spatial 2D localization in each frame in these intervals can facilitate video retrieval and recommendation. In this work, we investigate Video Face Clustering for this spatio-temporal localization of actors in videos. We first describe our method for Video Face Clustering in which we take advantage of face detection, embeddings, and clustering methods to group similar faces of actors in different frames and provide the spatio-temporal localization of them. Then, we explore, propose, and investigate innovative applications of this spatio-temporal localization in three different tasks: (i) Video Face Recognition, (ii) Educational Video Recommendation and (iii) Subtitles Positioning in 360-video. For (i), we propose a cluster-matching-based method that is easily scalable and achieved a recall of 99.435 percent and precision of 99.131 percent in a small video set. For (ii), we propose an unsupervised method based on them presence of lecturers in different videos that does not require any additional information from the videos and achieved a mAP approximately 99 percent. For (iii), we propose a dynamic placement of subtitles based on the automatic localization of actors in 360-video.
8

[pt] DESENVOLVIMENTO DE SISTEMA PARA DETECÇÃO DE PERDAS COMERCIAIS EM REDES DE DISTRIBUIÇÃO DE ENERGIA ELÉTRICA / [en] SYSTEM DEVELOPMENT TO DETECT COMMERCIAL LOSSES IN ELECTRICAL ENERGY DISTRIBUTION NETWORK

RODRIGO FLORA CALILI 29 December 2005 (has links)
[pt] Os modelos matemáticos comumente usados na identificação de irregularidades na medição se baseiam na análise da redução percentual do consumo do mês (normalmente de 20% a 30%) em relação aos meses anteriores. Este método tem gerado resultados imprecisos uma vez que considera o valor do consumo como um valor rígido e, portanto, não incorpora o efeito da sazonalidade na tipologia das cargas das unidades consumidoras. Este trabalho tem o intuito de melhorar a identificação de clientes fraudulentos utilizando métodos de inteligência artificial, tais como Redes Neurais e Lógica Fuzzy, implementados a um banco de dados de cadastro da Distribuidora de Energia ELEKTRO e a uma Pesquisa de Posses e Hábitos de Consumo (PPH) feita nesta mesma empresa. Nesta dissertação, o objetivo foi classificar um grupo de consumidores como normal (adimplente), inadimplente e fraudulento. Para tanto, foi feita inicialmente uma clusterização utilizando uma Rede Neural, mais especificamente uma Rede de Kohonen, para o banco de dados de cadastro disponibilizado pela distribuidora. Tomando os grupos desta classificação prévia feita pela Rede identificaram-se quais e quantos destes tiveram PPH´s realizadas. Para se ter a classificação de um grupo quanto a incidência de consumidores normais, inadimplentes e fraudulentos utilizou-se um processo de Análise Fuzzy, o qual identifica os clusters com os consumidores de cada um dos segmentos. É feita uma análise de desempenho do modelo proposto com dados reais fornecidos pela empresa, na qual os resultados apontaram para uma robustez do método. / [en] Mathematical models commonly used to identify irregularities in measurement are based on percentile reduction analysis of the monthly consumption (normally from 20% to 30%) in relation to the previous months. This method tends to generate imprecise results, since it considers the value of the consumption as a rigid value and, therefore, it does not incorporate the seasonal effect in the loads topology of the consumer units. This work has intention to improve the identification of fraudulent customers using artificial intelligence methods, such as Neural Networks and Fuzzy Logic, implemented to a database of consumers of ELEKTRO a distributing utility of São Paulo State, Brazil. It also uses information on appliances ownership obtained via market research in ELEKTRO area, named PPH (Portuguese for this particular type of market research). In this dissertation, the main objective was to classify a group of consumers as solvent, insolvent and fraudulent. In order to achieve this task, a clustering was initially made using a Neural Network framework, more specifically a Kohonen Network, for the database available. It was then checked which of the groups had a minimum number of clients interviewed in the PPH. In order to have the classification of the clients in the three categories it was used Fuzzy Analysis. Selected data is also presented, considering the available database of the Company as well as the research environment, which had been taken from the PPH. Finally, it was checked the performance of the method against real data obtained from the utility and the results were very satisfactory.
9

[pt] RESULTADOS TEÓRICOS E EXPERIMENTAIS EM CLUSTERIZAÇÃO COM MÉTRICAS DE TEORIA DA INFORMAÇÃO / [en] THEORETICAL AND EXPERIMENTAL RESULTS IN INFORMATION-THEORETIC CLUSTERING

LUCAS SAADI MURTINHO 21 September 2020 (has links)
[pt] Esta dissertação apresenta resultados teóricos e experimentais relativos ao problema de clusterização de um conjunto de vetores (que possam ser interpretados como distribuições de probabilidade) com o objetivo de minimizar uma medida de impureza da partição resultante. Por meio de uma conexão entre o problema geométrico de k-médias e o problema de clusterização para minimizar a impureza ponderada de Gini da partição, prova-se que este último é NP-completo e APX-difícil. Também analisamos uma família de algoritmos para clusterização com base nas componentes dominantes (as maiores componentes) dos vetores a serem particionados. Mostra-se que, em alguns casos, dois desses algoritmos conseguem obter bons resultados em termos da entropia ponderada da partição resultante, em um tempo bem menor do que os algoritmos considerados como o estado da arte. / [en] We present theoretical and experimental results related to the problem of clustering a set of vectors (which can be interpreted as probability distributions) with the goal of minimizing a weighted impurity measure of the resulting partition. The problem of clustering while minimizing the weighted Gini impurity of the partition is shown to be NP-complete and APX-hard, via a connection with the geometrical k-means problem. We also analyze a family of algorithms for information-theoretic clustering that rely on the dominant (largest) component of the vectors to be clustered. These algorithms are shown to be very fast compared to the state of the art, while able to achieve comparable results in terms of the resulting partition s weighted entropy.
10

[en] A CLUSTER-BASED METHOD FOR ACTION SEGMENTATION USING SPATIO-TEMPORAL AND POSITIONAL ENCODED EMBEDDINGS / [pt] MÉTODO BASEADO EM AGRUPAMENTO PARA A SEGMENTAÇÃO DE AÇÕES UTILIZANDO EMBEDDINGS ESPAÇO-TEMPORAIS E COM CODIFICAÇÃO POSICIONAL

GUILHERME DE AZEVEDO P MARQUES 20 April 2023 (has links)
[pt] Vídeos se tornaram a principal mídia para a comunicação, com um volume massivo de dados criado a cada segundo. Conseguir entender essa quantidade de dados de forma automática se tornou importante e, por conseguinte, métodos de video understanding são cada vez mais necessários. Uma tarefa crucial para o entendimento de vídeos é a classificação e localização no tempo de diferentes ações. Para isso, a segmentação de ações precisa ser realizada. Segmentação de ações é a tarefa que consiste em segmentar temporalmente um vídeo, classificando cada quadro com alguma ação. Neste trabalho, é proposto um método de segmentação de ações que não requer análise prévia do vídeo e nenhum dado anotado. O método envolve a extração de embeddings espaço-temporais dos vídeos com redes de aprendizado profundo pré-treinadas, seguida por uma transformação realizada por um codificador posicional e pela aplicação de um algoritmo de grupamento em que cada cluster gerado corresponde a uma ação diferente. Os experimentos realizados demonstram que o método produz resultados competitivos nos conjuntos de dados Breakfast e Inria Instructional Videos. / [en] The rise of video content as the main media for communication has been creating massive volumes of video data every second. The ability of understanding this huge quantities of data automatically has become increasingly important, therefore better video understanding methods are needed. A crucial task to overall video understanding is the recognition and localisation in time of dierent actions. To address this problem, action segmentation must be achieved. Action segmentation consists of temporally segmenting a video by labeling each frame with a specific action. In this work, we propose a novel action segmentation method that requires no prior video analysis and no annotated data. Our method involves extracting spatio-temporal features from videos using a pre-trained deep network. Data is then transformed using a positional encoder, and finally a clustering algorithm is applied where each cluster presumably corresponds to a dierent single and distinguishable action. In experiments, we show that our method produces competitive results on the Breakfast and Inria Instructional Videos dataset benchmarks.

Page generated in 0.4504 seconds